דילוג לתוכן
0
  • דף הבית
  • חוקי הפורום
  • מדריכים
  • פוסטים אחרונים
  • לא נפתר
  • פופולרי
  • משתמשים
  • חיפוש בפורום
  • צור קשר
  • דף הבית
  • חוקי הפורום
  • מדריכים
  • פוסטים אחרונים
  • לא נפתר
  • פופולרי
  • משתמשים
  • חיפוש בפורום
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
לוגו אתר

פורום אוצריא

אוצריא - דף הבית
|
קח שותפות בהוספת ספרים
|
תרום לאוצריא חיפוש
  1. דף הבית
  2. הוספת ספרים לספריית אוצריא
  3. להורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא

להורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא

מתוזמן נעוץ נעול הועבר הוספת ספרים לספריית אוצריא
198 פוסטים 26 כותבים 2.7k צפיות 25 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • צ צדיק וטוב לו

    כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

    ובכן.
    זה בעיה בקידוד.
    זה מקודד בקידוד ישן של Windows-1255
    כאשר צריך להמיר אותו ל UTF-8
    בוורד זה קלי קלות
    השאלה איך עושים את זה ל PDF, בלי שיקרה דבר לשכבת התמונה מעל.

    לאף אחד אין פתרון לבעיה הזו?
    זה ישמור על טקסט מדויק 100%

    חנניהח מנותק
    חנניהח מנותק
    חנניה
    כתב נערך לאחרונה על ידי
    #153

    @צדיק-וטוב-לו אולי כבוד הרב ג'ימני?

    תגובה 1 תגובה אחרונה
    0
    • י. פל.י מנותק
      י. פל.י מנותק
      י. פל.
      כתב נערך לאחרונה על ידי
      #154

      אם שכבת הטקסט כבר קיימת ב-PDF, הבעיה היא לא “המרת PDF”, אלא חילוץ הטקסט עם קידוד נכון והמרתו ל-UTF-8.

      יש כמה דרכים מקובלות:


      ✅ דרך פשוטה (pdftotext + iconv)

      ברוב המקרים זה מספיק:

      1. חלץ טקסט מה-PDF:
      pdftotext input.pdf output.txt
      
      1. המר מ-Windows-1255 ל-UTF-8:
      iconv -f windows-1255 -t utf-8 output.txt > output_utf8.txt
      

      אם הטקסט יוצא ג’יבריש בשלב הראשון, אפשר לנסות להזרים ישר:

      pdftotext input.pdf - | iconv -f windows-1255 -t utf-8 > output_utf8.txt
      

      ✅ דרך מדויקת יותר (Python)

      טוב כשצריך שליטה מלאה:

      from pdfminer.high_level import extract_text
      
      text = extract_text("input.pdf")
      
      # אם זה כבר מחרוזת לא תקינה, לפעמים צריך:
      text_bytes = text.encode('windows-1255', errors='ignore')
      fixed = text_bytes.decode('windows-1255')
      
      with open("output_utf8.txt", "w", encoding="utf-8") as f:
          f.write(fixed)
      

      ✅ אם הקידוד משובש בתוך ה-PDF עצמו

      לפעמים ה-PDF לא באמת שומר “Windows-1255”, אלא משתמש ב-font encoding פנימי. במצב כזה:

      • נסה pdftotext -raw
      • או pdftotext -enc UTF-8
      • או להשתמש ב-OCR (כמו Tesseract) אם שכבת הטקסט פגומה.

      💡 טיפ חשוב

      בדוק קודם מה הקידוד האמיתי של הקובץ שחולץ:

      file output.txt
      

      או:

      uchardet output.txt
      

      לפעמים זה בכלל ISO-8859-8 (עברית ישנה) ולא 1255.


      אם תרצה, אפשר לתת פתרון מדויק יותר לפי:

      • מערכת הפעלה
      • כלי העבודה שלך (CLI / Python / תוכנה גרפית)
      • דוגמה לפלט משובש

      מה אתה משתמש כרגע? 😊

      צ תגובה 1 תגובה אחרונה
      1
      • הבל הבליםה הבל הבלים

        במהלך הלילה המחשב שלי עבד קצת בשבילכם, ואני חושב שהתוצאה די טובה, אם כי לא מושלמת.
        אני מעלה כעת את הש"ס עם OCR בעברית לדרייב [לא יודע איך להעלות לגיטהאב @יאיר-דניאל ].
        כשיסיים - אעדכן.
        בנוסף, שלחתי מייל לוגשל שיסכימו להכניס את זה באופן רשמי, אני מחכה לתגובה.

        יאיר דניאלי מנותק
        יאיר דניאלי מנותק
        יאיר דניאל
        כתב נערך לאחרונה על ידי יאיר דניאל
        #155

        @הבל-הבלים כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

        [לא יודע איך להעלות לגיטהאב @יאיר-דניאל ].

        א - יש לך כאן בספויילר הסבר
        ב - אם אין לך כח תעלה את זה לדרייב, אוני אוריד משם

        "כִּי רָצוּ עֲבָדֶיךָ אֶת אֲבָנֶיהָ וְאֶת עֲפָרָהּ יְחֹנֵנוּ"

        הבל הבליםה תגובה 1 תגובה אחרונה
        0
        • י. פל.י י. פל.

          אם שכבת הטקסט כבר קיימת ב-PDF, הבעיה היא לא “המרת PDF”, אלא חילוץ הטקסט עם קידוד נכון והמרתו ל-UTF-8.

          יש כמה דרכים מקובלות:


          ✅ דרך פשוטה (pdftotext + iconv)

          ברוב המקרים זה מספיק:

          1. חלץ טקסט מה-PDF:
          pdftotext input.pdf output.txt
          
          1. המר מ-Windows-1255 ל-UTF-8:
          iconv -f windows-1255 -t utf-8 output.txt > output_utf8.txt
          

          אם הטקסט יוצא ג’יבריש בשלב הראשון, אפשר לנסות להזרים ישר:

          pdftotext input.pdf - | iconv -f windows-1255 -t utf-8 > output_utf8.txt
          

          ✅ דרך מדויקת יותר (Python)

          טוב כשצריך שליטה מלאה:

          from pdfminer.high_level import extract_text
          
          text = extract_text("input.pdf")
          
          # אם זה כבר מחרוזת לא תקינה, לפעמים צריך:
          text_bytes = text.encode('windows-1255', errors='ignore')
          fixed = text_bytes.decode('windows-1255')
          
          with open("output_utf8.txt", "w", encoding="utf-8") as f:
              f.write(fixed)
          

          ✅ אם הקידוד משובש בתוך ה-PDF עצמו

          לפעמים ה-PDF לא באמת שומר “Windows-1255”, אלא משתמש ב-font encoding פנימי. במצב כזה:

          • נסה pdftotext -raw
          • או pdftotext -enc UTF-8
          • או להשתמש ב-OCR (כמו Tesseract) אם שכבת הטקסט פגומה.

          💡 טיפ חשוב

          בדוק קודם מה הקידוד האמיתי של הקובץ שחולץ:

          file output.txt
          

          או:

          uchardet output.txt
          

          לפעמים זה בכלל ISO-8859-8 (עברית ישנה) ולא 1255.


          אם תרצה, אפשר לתת פתרון מדויק יותר לפי:

          • מערכת הפעלה
          • כלי העבודה שלך (CLI / Python / תוכנה גרפית)
          • דוגמה לפלט משובש

          מה אתה משתמש כרגע? 😊

          צ מנותק
          צ מנותק
          צדיק וטוב לו
          כתב נערך לאחרונה על ידי
          #156

          @י.-פל. אין לי פייתון, ולא מתחשק לי להתקין.
          אתה יכול לנסות להריץ את זה על חגיגה שהביאו למעלה?

          תגובה 1 תגובה אחרונה
          0
          • יאיר דניאלי יאיר דניאל

            @הבל-הבלים כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

            [לא יודע איך להעלות לגיטהאב @יאיר-דניאל ].

            א - יש לך כאן בספויילר הסבר
            ב - אם אין לך כח תעלה את זה לדרייב, אוני אוריד משם

            הבל הבליםה מנותק
            הבל הבליםה מנותק
            הבל הבלים
            צוות פיקוח
            כתב נערך לאחרונה על ידי הבל הבלים
            #157

            @יאיר-דניאל
            כמובן שאני יודע להעלות לגיטהאב.
            לא הייתי מספיק ברור, בגלל הגודל, אני לא יודע, וגם אין לי כוח לבדוק.
            למעשה, עשיתי גם אופטימיזציה לקבצים, והם שוקלים - 1.6, אבל האיכות תמונה שלהם גרועה מאוד, יותר מהקבצים שיש היום לאוצריא, אבל בזום 100% זה בסדר, אני ינסה להעלות את שתיהם אם אני יצליח.

            תגובה 1 תגובה אחרונה
            0
            • צבי דורש ציוןצ צבי דורש ציון

              אגב לכל מי שחולם על ש"ס של עוז והדר, אם עוז והדר מאשרים את השימוש בש"ס שלהם אני מוכן להקריא בעל פה לכל מחשב כל מקום מבוקש בש"ס כאילו אני נמצא בתוך התוכנה...

              ולמי שלא הבין, זה לא יקרה!
              או יותר נכון יותר מהר שאני יצליח לעשות את הנ"ל בצורה קוונטית... 😁

              יהודי צעירי מנותק
              יהודי צעירי מנותק
              יהודי צעיר
              עורך ספרים מקצועי
              כתב נערך לאחרונה על ידי
              #158

              @צבי-דורש-ציון כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

              אגב לכל מי שחולם על ש"ס של עוז והדר, אם עוז והדר מאשרים את השימוש בש"ס שלהם אני מוכן להקריא בעל פה לכל מחשב כל מקום מבוקש בש"ס כאילו אני נמצא בתוך התוכנה...

              ולמי שלא הבין, זה לא יקרה!
              או יותר נכון יותר מהר שאני יצליח לעשות את הנ"ל בצורה קוונטית... 😁

              דוקא היה איתם מו"מ, בינתיים לא אפרט בנידון

              מיכאלושמ תגובה 1 תגובה אחרונה
              3
              • יהודי צעירי יהודי צעיר

                @צבי-דורש-ציון כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                אגב לכל מי שחולם על ש"ס של עוז והדר, אם עוז והדר מאשרים את השימוש בש"ס שלהם אני מוכן להקריא בעל פה לכל מחשב כל מקום מבוקש בש"ס כאילו אני נמצא בתוך התוכנה...

                ולמי שלא הבין, זה לא יקרה!
                או יותר נכון יותר מהר שאני יצליח לעשות את הנ"ל בצורה קוונטית... 😁

                דוקא היה איתם מו"מ, בינתיים לא אפרט בנידון

                מיכאלושמ מנותק
                מיכאלושמ מנותק
                מיכאלוש
                כתב נערך לאחרונה על ידי
                #159

                @יהודי-צעיר כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                דוקא היה איתם מו"מ, בינתיים לא אפרט בנידון

                בינתיים יש את כאן שס עוז והדר לא לשימוש מסחרי

                הבל הבליםה יהודי צעירי 2 תגובות תגובה אחרונה
                0
                • מיכאלושמ מיכאלוש

                  @יהודי-צעיר כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                  דוקא היה איתם מו"מ, בינתיים לא אפרט בנידון

                  בינתיים יש את כאן שס עוז והדר לא לשימוש מסחרי

                  הבל הבליםה מנותק
                  הבל הבליםה מנותק
                  הבל הבלים
                  צוות פיקוח
                  כתב נערך לאחרונה על ידי
                  #160

                  @מיכאלוש
                  אולי תשאל אותו? אוצריא זה לא שימוש מסחרי!

                  תגובה 1 תגובה אחרונה
                  0
                  • חנניהח מנותק
                    חנניהח מנותק
                    חנניה
                    כתב נערך לאחרונה על ידי חנניה
                    #161

                    סיכום (אקראי) לדרישות ההתנדבות למאגר:
                    cor לש"ס וגשל
                    תיקון כותרות הש"ס הנ"ל- לבנתיים קיימת תוכנה שתעשה זאת. ראה כאן
                    (לברר על ש"ס אחר 'רישמי' לאוצריא)
                    התאמת 102 ספרים לאוצריא
                    המרת קובץ איגרות חזו"א לטקסט

                    איש גמזוא יהודי צעירי 2 תגובות תגובה אחרונה
                    1
                    • חנניהח חנניה

                      סיכום (אקראי) לדרישות ההתנדבות למאגר:
                      cor לש"ס וגשל
                      תיקון כותרות הש"ס הנ"ל- לבנתיים קיימת תוכנה שתעשה זאת. ראה כאן
                      (לברר על ש"ס אחר 'רישמי' לאוצריא)
                      התאמת 102 ספרים לאוצריא
                      המרת קובץ איגרות חזו"א לטקסט

                      איש גמזוא מנותק
                      איש גמזוא מנותק
                      איש גמזו
                      כתב נערך לאחרונה על ידי איש גמזו
                      #162

                      @חנניה אגרות חזו״א כבר קיים בטקסט

                      תגובה 1 תגובה אחרונה
                      0
                      • י. פל.י מנותק
                        י. פל.י מנותק
                        י. פל.
                        כתב נערך לאחרונה על ידי
                        #163

                        בעבר היתה יוזמה ליצירת צורת הדף כHTML, שזה בעצם טקסט פשוט שמעוצב בצורת הדף, זה קל (משהו כמו אלפית מPDF), ומהיר, אבל נראה לי דהם לא התקדמו בזה.
                        @האדם-החושב

                        M האדם החושבה 2 תגובות תגובה אחרונה
                        0
                        • י. פל.י י. פל.

                          בעבר היתה יוזמה ליצירת צורת הדף כHTML, שזה בעצם טקסט פשוט שמעוצב בצורת הדף, זה קל (משהו כמו אלפית מPDF), ומהיר, אבל נראה לי דהם לא התקדמו בזה.
                          @האדם-החושב

                          M מנותק
                          M מנותק
                          meir
                          כתב נערך לאחרונה על ידי
                          #164

                          @י.-פל. זה היה של מגיקוד (הבעה"ב של נטפרי) אבל זה לא הושלם והאתר כבר לא קיים

                          י. פל.י תגובה 1 תגובה אחרונה
                          0
                          • M meir

                            @י.-פל. זה היה של מגיקוד (הבעה"ב של נטפרי) אבל זה לא הושלם והאתר כבר לא קיים

                            י. פל.י מנותק
                            י. פל.י מנותק
                            י. פל.
                            כתב נערך לאחרונה על ידי
                            #165

                            @meir כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                            @י.-פל. זה היה של מגיקוד (הבעה"ב של נטפרי) אבל זה לא הושלם והאתר כבר לא קיים

                            אתה יכול לפנות אליו?

                            ד תגובה 1 תגובה אחרונה
                            0
                            • י. פל.י י. פל.

                              @meir כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                              @י.-פל. זה היה של מגיקוד (הבעה"ב של נטפרי) אבל זה לא הושלם והאתר כבר לא קיים

                              אתה יכול לפנות אליו?

                              ד מנותק
                              ד מנותק
                              דאנציג
                              כתב נערך לאחרונה על ידי
                              #166

                              @י.-פל.
                              אולי לסיון22 יהיה פתרון...
                              יש בתא שמע המקוון צורת הדף:
                              09f563a8-8f17-4b5f-93af-ecdc7a913559-image.png

                              איש־שלו'א תגובה 1 תגובה אחרונה
                              1
                              • אהרןא מנותק
                                אהרןא מנותק
                                אהרן
                                כתב נערך לאחרונה על ידי
                                #167

                                זה נורא ביותר, עדיף PDF.

                                abc123A תגובה 1 תגובה אחרונה
                                1
                                • אהרןא אהרן

                                  זה נורא ביותר, עדיף PDF.

                                  abc123A מנותק
                                  abc123A מנותק
                                  abc123
                                  כתב נערך לאחרונה על ידי
                                  #168

                                  @אהרן אני חושב שזה נורא רק בגמ׳ אבל אם יאמצו את זה בשאר הספרים שאין צורה מוכרת בראש זה יהיה לדעתי נוח מאוד

                                  תגובה 1 תגובה אחרונה
                                  1
                                  • חנניהח חנניה

                                    סיכום (אקראי) לדרישות ההתנדבות למאגר:
                                    cor לש"ס וגשל
                                    תיקון כותרות הש"ס הנ"ל- לבנתיים קיימת תוכנה שתעשה זאת. ראה כאן
                                    (לברר על ש"ס אחר 'רישמי' לאוצריא)
                                    התאמת 102 ספרים לאוצריא
                                    המרת קובץ איגרות חזו"א לטקסט

                                    יהודי צעירי מנותק
                                    יהודי צעירי מנותק
                                    יהודי צעיר
                                    עורך ספרים מקצועי
                                    כתב נערך לאחרונה על ידי
                                    #169

                                    @חנניה כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                                    תיקון כותרות הש"ס הנ"ל

                                    כבר יש תוכנה אוטומטית
                                    https://otzaria.org/forum/post/6010

                                    תגובה 1 תגובה אחרונה
                                    1
                                    • יום חדש מתחילי מנותק
                                      יום חדש מתחילי מנותק
                                      יום חדש מתחיל
                                      מנהל ספריית אוצריא
                                      כתב נערך לאחרונה על ידי
                                      #170

                                      @abc123 אם אין צורה מוגדרת, אז מה בכלל העניין בהצגה בצורה כזו?

                                      abc123A תגובה 1 תגובה אחרונה
                                      0
                                      • מיכאלושמ מיכאלוש

                                        @יהודי-צעיר כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                                        דוקא היה איתם מו"מ, בינתיים לא אפרט בנידון

                                        בינתיים יש את כאן שס עוז והדר לא לשימוש מסחרי

                                        יהודי צעירי מנותק
                                        יהודי צעירי מנותק
                                        יהודי צעיר
                                        עורך ספרים מקצועי
                                        כתב נערך לאחרונה על ידי יהודי צעיר
                                        #171
                                        פוסט זה נמחק!
                                        abc123A איש־שלו'א 2 תגובות תגובה אחרונה
                                        1
                                        • יום חדש מתחילי יום חדש מתחיל

                                          @abc123 אם אין צורה מוגדרת, אז מה בכלל העניין בהצגה בצורה כזו?

                                          abc123A מנותק
                                          abc123A מנותק
                                          abc123
                                          כתב נערך לאחרונה על ידי
                                          #172

                                          @יום-חדש-מתחיל הרבה יותר נוח ללמוד ככה
                                          גם בספרים שאין עליהם מפרשים יותר נוח לקרוא שורות שמחולקות לשתי טורים
                                          ובגמרא או בכל ספרי היסוד האחרים מאוד נוח לראות את הנו״כ על הדף ישירות. מה שיש היום זה שדרוג מטורף אבל אני חושב חד משמעית שעדיף דף שלא זז אלא מקובע כמו pdf

                                          תגובה 1 תגובה אחרונה
                                          0

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון