דילוג לתוכן
0
  • דף הבית
  • חוקי הפורום
  • מדריכים
  • פוסטים אחרונים
  • לא נפתר
  • פופולרי
  • משתמשים
  • חיפוש בפורום
  • צור קשר
  • דף הבית
  • חוקי הפורום
  • מדריכים
  • פוסטים אחרונים
  • לא נפתר
  • פופולרי
  • משתמשים
  • חיפוש בפורום
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
לוגו אתר

פורום אוצריא

אוצריא - דף הבית
|
קח שותפות בהוספת ספרים
|
תרום לאוצריא חיפוש
  1. דף הבית
  2. הוספת ספרים לספריית אוצריא
  3. להורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא

להורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא

מתוזמן נעוץ נעול הועבר הוספת ספרים לספריית אוצריא
198 פוסטים 26 כותבים 2.7k צפיות 25 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • י. פל.י י. פל.

    אם שכבת הטקסט כבר קיימת ב-PDF, הבעיה היא לא “המרת PDF”, אלא חילוץ הטקסט עם קידוד נכון והמרתו ל-UTF-8.

    יש כמה דרכים מקובלות:


    ✅ דרך פשוטה (pdftotext + iconv)

    ברוב המקרים זה מספיק:

    1. חלץ טקסט מה-PDF:
    pdftotext input.pdf output.txt
    
    1. המר מ-Windows-1255 ל-UTF-8:
    iconv -f windows-1255 -t utf-8 output.txt > output_utf8.txt
    

    אם הטקסט יוצא ג’יבריש בשלב הראשון, אפשר לנסות להזרים ישר:

    pdftotext input.pdf - | iconv -f windows-1255 -t utf-8 > output_utf8.txt
    

    ✅ דרך מדויקת יותר (Python)

    טוב כשצריך שליטה מלאה:

    from pdfminer.high_level import extract_text
    
    text = extract_text("input.pdf")
    
    # אם זה כבר מחרוזת לא תקינה, לפעמים צריך:
    text_bytes = text.encode('windows-1255', errors='ignore')
    fixed = text_bytes.decode('windows-1255')
    
    with open("output_utf8.txt", "w", encoding="utf-8") as f:
        f.write(fixed)
    

    ✅ אם הקידוד משובש בתוך ה-PDF עצמו

    לפעמים ה-PDF לא באמת שומר “Windows-1255”, אלא משתמש ב-font encoding פנימי. במצב כזה:

    • נסה pdftotext -raw
    • או pdftotext -enc UTF-8
    • או להשתמש ב-OCR (כמו Tesseract) אם שכבת הטקסט פגומה.

    💡 טיפ חשוב

    בדוק קודם מה הקידוד האמיתי של הקובץ שחולץ:

    file output.txt
    

    או:

    uchardet output.txt
    

    לפעמים זה בכלל ISO-8859-8 (עברית ישנה) ולא 1255.


    אם תרצה, אפשר לתת פתרון מדויק יותר לפי:

    • מערכת הפעלה
    • כלי העבודה שלך (CLI / Python / תוכנה גרפית)
    • דוגמה לפלט משובש

    מה אתה משתמש כרגע? 😊

    צ מנותק
    צ מנותק
    צדיק וטוב לו
    כתב נערך לאחרונה על ידי
    #156

    @י.-פל. אין לי פייתון, ולא מתחשק לי להתקין.
    אתה יכול לנסות להריץ את זה על חגיגה שהביאו למעלה?

    תגובה 1 תגובה אחרונה
    0
    • יאיר דניאלי יאיר דניאל

      @הבל-הבלים כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

      [לא יודע איך להעלות לגיטהאב @יאיר-דניאל ].

      א - יש לך כאן בספויילר הסבר
      ב - אם אין לך כח תעלה את זה לדרייב, אוני אוריד משם

      הבל הבליםה מנותק
      הבל הבליםה מנותק
      הבל הבלים
      צוות פיקוח
      כתב נערך לאחרונה על ידי הבל הבלים
      #157

      @יאיר-דניאל
      כמובן שאני יודע להעלות לגיטהאב.
      לא הייתי מספיק ברור, בגלל הגודל, אני לא יודע, וגם אין לי כוח לבדוק.
      למעשה, עשיתי גם אופטימיזציה לקבצים, והם שוקלים - 1.6, אבל האיכות תמונה שלהם גרועה מאוד, יותר מהקבצים שיש היום לאוצריא, אבל בזום 100% זה בסדר, אני ינסה להעלות את שתיהם אם אני יצליח.

      תגובה 1 תגובה אחרונה
      0
      • צבי דורש ציוןצ צבי דורש ציון

        אגב לכל מי שחולם על ש"ס של עוז והדר, אם עוז והדר מאשרים את השימוש בש"ס שלהם אני מוכן להקריא בעל פה לכל מחשב כל מקום מבוקש בש"ס כאילו אני נמצא בתוך התוכנה...

        ולמי שלא הבין, זה לא יקרה!
        או יותר נכון יותר מהר שאני יצליח לעשות את הנ"ל בצורה קוונטית... 😁

        יהודי צעירי מנותק
        יהודי צעירי מנותק
        יהודי צעיר
        עורך ספרים מקצועי
        כתב נערך לאחרונה על ידי
        #158

        @צבי-דורש-ציון כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

        אגב לכל מי שחולם על ש"ס של עוז והדר, אם עוז והדר מאשרים את השימוש בש"ס שלהם אני מוכן להקריא בעל פה לכל מחשב כל מקום מבוקש בש"ס כאילו אני נמצא בתוך התוכנה...

        ולמי שלא הבין, זה לא יקרה!
        או יותר נכון יותר מהר שאני יצליח לעשות את הנ"ל בצורה קוונטית... 😁

        דוקא היה איתם מו"מ, בינתיים לא אפרט בנידון

        מיכאלושמ תגובה 1 תגובה אחרונה
        3
        • יהודי צעירי יהודי צעיר

          @צבי-דורש-ציון כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

          אגב לכל מי שחולם על ש"ס של עוז והדר, אם עוז והדר מאשרים את השימוש בש"ס שלהם אני מוכן להקריא בעל פה לכל מחשב כל מקום מבוקש בש"ס כאילו אני נמצא בתוך התוכנה...

          ולמי שלא הבין, זה לא יקרה!
          או יותר נכון יותר מהר שאני יצליח לעשות את הנ"ל בצורה קוונטית... 😁

          דוקא היה איתם מו"מ, בינתיים לא אפרט בנידון

          מיכאלושמ מנותק
          מיכאלושמ מנותק
          מיכאלוש
          כתב נערך לאחרונה על ידי
          #159

          @יהודי-צעיר כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

          דוקא היה איתם מו"מ, בינתיים לא אפרט בנידון

          בינתיים יש את כאן שס עוז והדר לא לשימוש מסחרי

          הבל הבליםה יהודי צעירי 2 תגובות תגובה אחרונה
          0
          • מיכאלושמ מיכאלוש

            @יהודי-צעיר כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

            דוקא היה איתם מו"מ, בינתיים לא אפרט בנידון

            בינתיים יש את כאן שס עוז והדר לא לשימוש מסחרי

            הבל הבליםה מנותק
            הבל הבליםה מנותק
            הבל הבלים
            צוות פיקוח
            כתב נערך לאחרונה על ידי
            #160

            @מיכאלוש
            אולי תשאל אותו? אוצריא זה לא שימוש מסחרי!

            תגובה 1 תגובה אחרונה
            0
            • חנניהח מנותק
              חנניהח מנותק
              חנניה
              כתב נערך לאחרונה על ידי חנניה
              #161

              סיכום (אקראי) לדרישות ההתנדבות למאגר:
              cor לש"ס וגשל
              תיקון כותרות הש"ס הנ"ל- לבנתיים קיימת תוכנה שתעשה זאת. ראה כאן
              (לברר על ש"ס אחר 'רישמי' לאוצריא)
              התאמת 102 ספרים לאוצריא
              המרת קובץ איגרות חזו"א לטקסט

              איש גמזוא יהודי צעירי 2 תגובות תגובה אחרונה
              1
              • חנניהח חנניה

                סיכום (אקראי) לדרישות ההתנדבות למאגר:
                cor לש"ס וגשל
                תיקון כותרות הש"ס הנ"ל- לבנתיים קיימת תוכנה שתעשה זאת. ראה כאן
                (לברר על ש"ס אחר 'רישמי' לאוצריא)
                התאמת 102 ספרים לאוצריא
                המרת קובץ איגרות חזו"א לטקסט

                איש גמזוא מנותק
                איש גמזוא מנותק
                איש גמזו
                כתב נערך לאחרונה על ידי איש גמזו
                #162

                @חנניה אגרות חזו״א כבר קיים בטקסט

                תגובה 1 תגובה אחרונה
                0
                • י. פל.י מנותק
                  י. פל.י מנותק
                  י. פל.
                  כתב נערך לאחרונה על ידי
                  #163

                  בעבר היתה יוזמה ליצירת צורת הדף כHTML, שזה בעצם טקסט פשוט שמעוצב בצורת הדף, זה קל (משהו כמו אלפית מPDF), ומהיר, אבל נראה לי דהם לא התקדמו בזה.
                  @האדם-החושב

                  M האדם החושבה 2 תגובות תגובה אחרונה
                  0
                  • י. פל.י י. פל.

                    בעבר היתה יוזמה ליצירת צורת הדף כHTML, שזה בעצם טקסט פשוט שמעוצב בצורת הדף, זה קל (משהו כמו אלפית מPDF), ומהיר, אבל נראה לי דהם לא התקדמו בזה.
                    @האדם-החושב

                    M מנותק
                    M מנותק
                    meir
                    כתב נערך לאחרונה על ידי
                    #164

                    @י.-פל. זה היה של מגיקוד (הבעה"ב של נטפרי) אבל זה לא הושלם והאתר כבר לא קיים

                    י. פל.י תגובה 1 תגובה אחרונה
                    0
                    • M meir

                      @י.-פל. זה היה של מגיקוד (הבעה"ב של נטפרי) אבל זה לא הושלם והאתר כבר לא קיים

                      י. פל.י מנותק
                      י. פל.י מנותק
                      י. פל.
                      כתב נערך לאחרונה על ידי
                      #165

                      @meir כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                      @י.-פל. זה היה של מגיקוד (הבעה"ב של נטפרי) אבל זה לא הושלם והאתר כבר לא קיים

                      אתה יכול לפנות אליו?

                      ד תגובה 1 תגובה אחרונה
                      0
                      • י. פל.י י. פל.

                        @meir כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                        @י.-פל. זה היה של מגיקוד (הבעה"ב של נטפרי) אבל זה לא הושלם והאתר כבר לא קיים

                        אתה יכול לפנות אליו?

                        ד מנותק
                        ד מנותק
                        דאנציג
                        כתב נערך לאחרונה על ידי
                        #166

                        @י.-פל.
                        אולי לסיון22 יהיה פתרון...
                        יש בתא שמע המקוון צורת הדף:
                        09f563a8-8f17-4b5f-93af-ecdc7a913559-image.png

                        איש־שלו'א תגובה 1 תגובה אחרונה
                        1
                        • אהרןא מנותק
                          אהרןא מנותק
                          אהרן
                          כתב נערך לאחרונה על ידי
                          #167

                          זה נורא ביותר, עדיף PDF.

                          abc123A תגובה 1 תגובה אחרונה
                          1
                          • אהרןא אהרן

                            זה נורא ביותר, עדיף PDF.

                            abc123A מנותק
                            abc123A מנותק
                            abc123
                            כתב נערך לאחרונה על ידי
                            #168

                            @אהרן אני חושב שזה נורא רק בגמ׳ אבל אם יאמצו את זה בשאר הספרים שאין צורה מוכרת בראש זה יהיה לדעתי נוח מאוד

                            תגובה 1 תגובה אחרונה
                            1
                            • חנניהח חנניה

                              סיכום (אקראי) לדרישות ההתנדבות למאגר:
                              cor לש"ס וגשל
                              תיקון כותרות הש"ס הנ"ל- לבנתיים קיימת תוכנה שתעשה זאת. ראה כאן
                              (לברר על ש"ס אחר 'רישמי' לאוצריא)
                              התאמת 102 ספרים לאוצריא
                              המרת קובץ איגרות חזו"א לטקסט

                              יהודי צעירי מנותק
                              יהודי צעירי מנותק
                              יהודי צעיר
                              עורך ספרים מקצועי
                              כתב נערך לאחרונה על ידי
                              #169

                              @חנניה כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                              תיקון כותרות הש"ס הנ"ל

                              כבר יש תוכנה אוטומטית
                              https://otzaria.org/forum/post/6010

                              תגובה 1 תגובה אחרונה
                              1
                              • יום חדש מתחילי מנותק
                                יום חדש מתחילי מנותק
                                יום חדש מתחיל
                                מנהל ספריית אוצריא
                                כתב נערך לאחרונה על ידי
                                #170

                                @abc123 אם אין צורה מוגדרת, אז מה בכלל העניין בהצגה בצורה כזו?

                                abc123A תגובה 1 תגובה אחרונה
                                0
                                • מיכאלושמ מיכאלוש

                                  @יהודי-צעיר כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                                  דוקא היה איתם מו"מ, בינתיים לא אפרט בנידון

                                  בינתיים יש את כאן שס עוז והדר לא לשימוש מסחרי

                                  יהודי צעירי מנותק
                                  יהודי צעירי מנותק
                                  יהודי צעיר
                                  עורך ספרים מקצועי
                                  כתב נערך לאחרונה על ידי יהודי צעיר
                                  #171
                                  פוסט זה נמחק!
                                  abc123A איש־שלו'א 2 תגובות תגובה אחרונה
                                  1
                                  • יום חדש מתחילי יום חדש מתחיל

                                    @abc123 אם אין צורה מוגדרת, אז מה בכלל העניין בהצגה בצורה כזו?

                                    abc123A מנותק
                                    abc123A מנותק
                                    abc123
                                    כתב נערך לאחרונה על ידי
                                    #172

                                    @יום-חדש-מתחיל הרבה יותר נוח ללמוד ככה
                                    גם בספרים שאין עליהם מפרשים יותר נוח לקרוא שורות שמחולקות לשתי טורים
                                    ובגמרא או בכל ספרי היסוד האחרים מאוד נוח לראות את הנו״כ על הדף ישירות. מה שיש היום זה שדרוג מטורף אבל אני חושב חד משמעית שעדיף דף שלא זז אלא מקובע כמו pdf

                                    תגובה 1 תגובה אחרונה
                                    0
                                    • יהודי צעירי יהודי צעיר

                                      פוסט זה נמחק!

                                      abc123A מנותק
                                      abc123A מנותק
                                      abc123
                                      כתב נערך לאחרונה על ידי
                                      #173

                                      @יהודי-צעיר אם אתה בקטע של pdf יש לי מאגר של כל ספרי היסוד בהוצאות הכי טובות אבל אתה תצטרך להגדיל את נפח האחסון שלך בדרייב

                                      יהודי צעירי תגובה 1 תגובה אחרונה
                                      0
                                      • ד דאנציג

                                        @י.-פל.
                                        אולי לסיון22 יהיה פתרון...
                                        יש בתא שמע המקוון צורת הדף:
                                        09f563a8-8f17-4b5f-93af-ecdc7a913559-image.png

                                        איש־שלו'א מנותק
                                        איש־שלו'א מנותק
                                        איש־שלו'
                                        כתב נערך לאחרונה על ידי איש־שלו'
                                        #174

                                        @דאנציג

                                        מאיפה יש להם את זה?
                                        זה דומה למה שהתחיל לבנות יידשע־קאפ
                                        https://indesign.yiddishe-kop.com/scripts/4

                                        עריכה: @האדם-החושב נ"י ציין [להלן] למקור העיקרי:
                                        https://github.com/Yiddishe-Kop/Shas-Vilna

                                        בכל אופן מה שיש כאן נראה ocr לפי הטעויות בתרגום
                                        feacdb88-659a-4b88-bd2d-6863013adb26-image.png

                                        לעומת זאת מה שיש ב'מרכבה':
                                        https://www.themercava.com/app/books/metanav/2184

                                        שם האיכות נראית הרבה הרבה יותר...
                                        c2100429-6dfa-417e-b9f5-2685a9562934-image.png

                                        צ תגובה 1 תגובה אחרונה
                                        1
                                        • abc123A abc123

                                          @יהודי-צעיר אם אתה בקטע של pdf יש לי מאגר של כל ספרי היסוד בהוצאות הכי טובות אבל אתה תצטרך להגדיל את נפח האחסון שלך בדרייב

                                          יהודי צעירי מנותק
                                          יהודי צעירי מנותק
                                          יהודי צעיר
                                          עורך ספרים מקצועי
                                          כתב נערך לאחרונה על ידי
                                          #175

                                          @abc123 כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                                          @יהודי-צעיר אם אתה בקטע של pdf יש לי מאגר של כל ספרי היסוד בהוצאות הכי טובות אבל אתה תצטרך להגדיל את נפח האחסון שלך בדרייב

                                          בהחלט יועיל לנו
                                          צור קשר עם @יאיר-דניאל

                                          abc123A תגובה 1 תגובה אחרונה
                                          1

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון