דילוג לתוכן
0
  • דף הבית
  • חוקי הפורום
  • מדריכים
  • פוסטים אחרונים
  • לא נפתר
  • פופולרי
  • משתמשים
  • חיפוש בפורום
  • צור קשר
  • דף הבית
  • חוקי הפורום
  • מדריכים
  • פוסטים אחרונים
  • לא נפתר
  • פופולרי
  • משתמשים
  • חיפוש בפורום
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
לוגו אתר

פורום אוצריא

אוצריא - דף הבית
|
קח שותפות בהוספת ספרים
|
תרום לאוצריא חיפוש
  1. דף הבית
  2. הוספת ספרים לספריית אוצריא
  3. להורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא

להורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא

מתוזמן נעוץ נעול הועבר הוספת ספרים לספריית אוצריא
198 פוסטים 26 כותבים 2.7k צפיות 25 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • צ צדיק וטוב לו

    @דורש-טוב אתה יכול להביא לי דף אחד כזה לנסות לבדוק?
    מה מקור הש"ס? היברובוקס? מהרשת?

    ד מנותק
    ד מנותק
    דורש טוב
    כתב נערך לאחרונה על ידי דורש טוב
    #141

    @צדיק-וטוב-לו העלתי פה מסכת חגיגה

    @צדיק-וטוב-לו כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

    מה מקור הש"ס? היברובוקס? מהרשת?

    אין לי מושג @יאיר-דניאל
    זה כמו של היברובוקס ואוצריא אבל זה נראה קובץ מקור

    הבל הבליםה תגובה 1 תגובה אחרונה
    0
    • ד דורש טוב

      @צדיק-וטוב-לו העלתי פה מסכת חגיגה

      @צדיק-וטוב-לו כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

      מה מקור הש"ס? היברובוקס? מהרשת?

      אין לי מושג @יאיר-דניאל
      זה כמו של היברובוקס ואוצריא אבל זה נראה קובץ מקור

      הבל הבליםה מנותק
      הבל הבליםה מנותק
      הבל הבלים
      צוות פיקוח
      כתב נערך לאחרונה על ידי
      #142

      @דורש-טוב כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

      זה כמו של היברובוקס

      יש אותו דבר גם בהיברובוקס אבל שם הם הטביעו ע"ז סימן מים של זכויות יוצרים.

      תגובה 1 תגובה אחרונה
      0
      • צבי דורש ציוןצ מנותק
        צבי דורש ציוןצ מנותק
        צבי דורש ציון
        כתב נערך לאחרונה על ידי צבי דורש ציון
        #143

        אגב לכל מי שחולם על ש"ס של עוז והדר, אם עוז והדר מאשרים את השימוש בש"ס שלהם אני מוכן להקריא בעל פה לכל מחשב כל מקום מבוקש בש"ס כאילו אני נמצא בתוך התוכנה...

        ולמי שלא הבין, זה לא יקרה!
        או יותר נכון יותר מהר שאני יצליח לעשות את הנ"ל בצורה קוונטית... 😁

        כי ירושלים אמנם תבנה כשיכספו בני ישראל לה תכלית הכוסף עד שיחוננו אבניה ועפרה
        (רבי יהודה הלוי בכוזרי מאמר ה עפ"י הפסוק אתה תקום וגו')

        יהודי צעירי תגובה 1 תגובה אחרונה
        3
        • צ מנותק
          צ מנותק
          צדיק וטוב לו
          כתב נערך לאחרונה על ידי
          #144

          ובכן.
          זה בעיה בקידוד.
          זה מקודד בקידוד ישן של Windows-1255
          כאשר צריך להמיר אותו ל UTF-8
          בוורד זה קלי קלות
          השאלה איך עושים את זה ל PDF, בלי שיקרה דבר לשכבת התמונה מעל.

          צ תגובה 1 תגובה אחרונה
          1
          • יהודי צעירי יהודי צעיר

            עדיף לחפש תלמוד בבלי חדש לאוצריא
            אני ניסיתי קצת, וללא הצלחה בינתיים
            צריך לפנות למהדורות ספרים
            (עוז והדר פניתי)
            המאור
            בארות
            טלמן
            שס ארץ ישראל (בלום)
            שס יביע אומר
            ועוד...

            מיכאלושמ מנותק
            מיכאלושמ מנותק
            מיכאלוש
            כתב נערך לאחרונה על ידי יום חדש מתחיל
            #145

            @יהודי-צעיר
            כמדומני שכבר שנים מאורות הדף היומי משתמשים בש"ס וילנא של מסורת הש"ס רק ללא ההערות שמסורת הש"ס עבדו אליהם
            פנית לאחד משניהם ?

            תגובה 1 תגובה אחרונה
            0
            • הבל הבליםה מנותק
              הבל הבליםה מנותק
              הבל הבלים
              צוות פיקוח
              כתב נערך לאחרונה על ידי
              #146

              במהלך הלילה המחשב שלי עבד קצת בשבילכם, ואני חושב שהתוצאה די טובה, אם כי לא מושלמת.
              אני מעלה כעת את הש"ס עם OCR בעברית לדרייב [לא יודע איך להעלות לגיטהאב @יאיר-דניאל ].
              כשיסיים - אעדכן.
              בנוסף, שלחתי מייל לוגשל שיסכימו להכניס את זה באופן רשמי, אני מחכה לתגובה.

              ד יאיר דניאלי 2 תגובות תגובה אחרונה
              3
              • הבל הבליםה הבל הבלים

                במהלך הלילה המחשב שלי עבד קצת בשבילכם, ואני חושב שהתוצאה די טובה, אם כי לא מושלמת.
                אני מעלה כעת את הש"ס עם OCR בעברית לדרייב [לא יודע איך להעלות לגיטהאב @יאיר-דניאל ].
                כשיסיים - אעדכן.
                בנוסף, שלחתי מייל לוגשל שיסכימו להכניס את זה באופן רשמי, אני מחכה לתגובה.

                ד מנותק
                ד מנותק
                דורש טוב
                כתב נערך לאחרונה על ידי
                #147

                @הבל-הבלים אז בעצם זה נהיה 2 שכבות טקסט אחת מעל השניה, הראשונה מג'וברשת והשניה OCR
                ובהעתקה זה לא מתערבב?

                הבל הבליםה תגובה 1 תגובה אחרונה
                0
                • ד דורש טוב

                  @הבל-הבלים אז בעצם זה נהיה 2 שכבות טקסט אחת מעל השניה, הראשונה מג'וברשת והשניה OCR
                  ובהעתקה זה לא מתערבב?

                  הבל הבליםה מנותק
                  הבל הבליםה מנותק
                  הבל הבלים
                  צוות פיקוח
                  כתב נערך לאחרונה על ידי הבל הבלים
                  #148

                  @דורש-טוב
                  לא, קודם הדפסתי את זה כתמונה, ואח"כ עשיתי OCR.
                  אבל כרגע הרשת שלי לא עומדת בזה, אני מקוה בערב להעלות את זה.

                  ד תגובה 1 תגובה אחרונה
                  1
                  • הבל הבליםה הבל הבלים

                    @דורש-טוב
                    לא, קודם הדפסתי את זה כתמונה, ואח"כ עשיתי OCR.
                    אבל כרגע הרשת שלי לא עומדת בזה, אני מקוה בערב להעלות את זה.

                    ד מנותק
                    ד מנותק
                    דורש טוב
                    כתב נערך לאחרונה על ידי
                    #149

                    @הבל-הבלים והמשקל סביר? כי כשניסיתי לעשות את זה זה הכפיל פי 15

                    הבל הבליםה תגובה 1 תגובה אחרונה
                    0
                    • ד דורש טוב

                      @הבל-הבלים והמשקל סביר? כי כשניסיתי לעשות את זה זה הכפיל פי 15

                      הבל הבליםה מנותק
                      הבל הבליםה מנותק
                      הבל הבלים
                      צוות פיקוח
                      כתב נערך לאחרונה על ידי
                      #150

                      @דורש-טוב
                      כן, זה שוקל 4.6 ג'יגה, וגם דחיסה לא עוזרת...

                      חנניהח תגובה 1 תגובה אחרונה
                      0
                      • הבל הבליםה הבל הבלים

                        @דורש-טוב
                        כן, זה שוקל 4.6 ג'יגה, וגם דחיסה לא עוזרת...

                        חנניהח מנותק
                        חנניהח מנותק
                        חנניה
                        כתב נערך לאחרונה על ידי
                        #151

                        @הבל-הבלים וכמה שוקל מה שיש היום באוצריא?

                        תגובה 1 תגובה אחרונה
                        0
                        • צ צדיק וטוב לו

                          ובכן.
                          זה בעיה בקידוד.
                          זה מקודד בקידוד ישן של Windows-1255
                          כאשר צריך להמיר אותו ל UTF-8
                          בוורד זה קלי קלות
                          השאלה איך עושים את זה ל PDF, בלי שיקרה דבר לשכבת התמונה מעל.

                          צ מנותק
                          צ מנותק
                          צדיק וטוב לו
                          כתב נערך לאחרונה על ידי
                          #152

                          כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                          ובכן.
                          זה בעיה בקידוד.
                          זה מקודד בקידוד ישן של Windows-1255
                          כאשר צריך להמיר אותו ל UTF-8
                          בוורד זה קלי קלות
                          השאלה איך עושים את זה ל PDF, בלי שיקרה דבר לשכבת התמונה מעל.

                          לאף אחד אין פתרון לבעיה הזו?
                          זה ישמור על טקסט מדויק 100%

                          חנניהח תגובה 1 תגובה אחרונה
                          0
                          • צ צדיק וטוב לו

                            כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                            ובכן.
                            זה בעיה בקידוד.
                            זה מקודד בקידוד ישן של Windows-1255
                            כאשר צריך להמיר אותו ל UTF-8
                            בוורד זה קלי קלות
                            השאלה איך עושים את זה ל PDF, בלי שיקרה דבר לשכבת התמונה מעל.

                            לאף אחד אין פתרון לבעיה הזו?
                            זה ישמור על טקסט מדויק 100%

                            חנניהח מנותק
                            חנניהח מנותק
                            חנניה
                            כתב נערך לאחרונה על ידי
                            #153

                            @צדיק-וטוב-לו אולי כבוד הרב ג'ימני?

                            תגובה 1 תגובה אחרונה
                            0
                            • י. פל.י מנותק
                              י. פל.י מנותק
                              י. פל.
                              כתב נערך לאחרונה על ידי
                              #154

                              אם שכבת הטקסט כבר קיימת ב-PDF, הבעיה היא לא “המרת PDF”, אלא חילוץ הטקסט עם קידוד נכון והמרתו ל-UTF-8.

                              יש כמה דרכים מקובלות:


                              ✅ דרך פשוטה (pdftotext + iconv)

                              ברוב המקרים זה מספיק:

                              1. חלץ טקסט מה-PDF:
                              pdftotext input.pdf output.txt
                              
                              1. המר מ-Windows-1255 ל-UTF-8:
                              iconv -f windows-1255 -t utf-8 output.txt > output_utf8.txt
                              

                              אם הטקסט יוצא ג’יבריש בשלב הראשון, אפשר לנסות להזרים ישר:

                              pdftotext input.pdf - | iconv -f windows-1255 -t utf-8 > output_utf8.txt
                              

                              ✅ דרך מדויקת יותר (Python)

                              טוב כשצריך שליטה מלאה:

                              from pdfminer.high_level import extract_text
                              
                              text = extract_text("input.pdf")
                              
                              # אם זה כבר מחרוזת לא תקינה, לפעמים צריך:
                              text_bytes = text.encode('windows-1255', errors='ignore')
                              fixed = text_bytes.decode('windows-1255')
                              
                              with open("output_utf8.txt", "w", encoding="utf-8") as f:
                                  f.write(fixed)
                              

                              ✅ אם הקידוד משובש בתוך ה-PDF עצמו

                              לפעמים ה-PDF לא באמת שומר “Windows-1255”, אלא משתמש ב-font encoding פנימי. במצב כזה:

                              • נסה pdftotext -raw
                              • או pdftotext -enc UTF-8
                              • או להשתמש ב-OCR (כמו Tesseract) אם שכבת הטקסט פגומה.

                              💡 טיפ חשוב

                              בדוק קודם מה הקידוד האמיתי של הקובץ שחולץ:

                              file output.txt
                              

                              או:

                              uchardet output.txt
                              

                              לפעמים זה בכלל ISO-8859-8 (עברית ישנה) ולא 1255.


                              אם תרצה, אפשר לתת פתרון מדויק יותר לפי:

                              • מערכת הפעלה
                              • כלי העבודה שלך (CLI / Python / תוכנה גרפית)
                              • דוגמה לפלט משובש

                              מה אתה משתמש כרגע? 😊

                              צ תגובה 1 תגובה אחרונה
                              1
                              • הבל הבליםה הבל הבלים

                                במהלך הלילה המחשב שלי עבד קצת בשבילכם, ואני חושב שהתוצאה די טובה, אם כי לא מושלמת.
                                אני מעלה כעת את הש"ס עם OCR בעברית לדרייב [לא יודע איך להעלות לגיטהאב @יאיר-דניאל ].
                                כשיסיים - אעדכן.
                                בנוסף, שלחתי מייל לוגשל שיסכימו להכניס את זה באופן רשמי, אני מחכה לתגובה.

                                יאיר דניאלי מנותק
                                יאיר דניאלי מנותק
                                יאיר דניאל
                                כתב נערך לאחרונה על ידי יאיר דניאל
                                #155

                                @הבל-הבלים כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                                [לא יודע איך להעלות לגיטהאב @יאיר-דניאל ].

                                א - יש לך כאן בספויילר הסבר
                                ב - אם אין לך כח תעלה את זה לדרייב, אוני אוריד משם

                                "כִּי רָצוּ עֲבָדֶיךָ אֶת אֲבָנֶיהָ וְאֶת עֲפָרָהּ יְחֹנֵנוּ"

                                הבל הבליםה תגובה 1 תגובה אחרונה
                                0
                                • י. פל.י י. פל.

                                  אם שכבת הטקסט כבר קיימת ב-PDF, הבעיה היא לא “המרת PDF”, אלא חילוץ הטקסט עם קידוד נכון והמרתו ל-UTF-8.

                                  יש כמה דרכים מקובלות:


                                  ✅ דרך פשוטה (pdftotext + iconv)

                                  ברוב המקרים זה מספיק:

                                  1. חלץ טקסט מה-PDF:
                                  pdftotext input.pdf output.txt
                                  
                                  1. המר מ-Windows-1255 ל-UTF-8:
                                  iconv -f windows-1255 -t utf-8 output.txt > output_utf8.txt
                                  

                                  אם הטקסט יוצא ג’יבריש בשלב הראשון, אפשר לנסות להזרים ישר:

                                  pdftotext input.pdf - | iconv -f windows-1255 -t utf-8 > output_utf8.txt
                                  

                                  ✅ דרך מדויקת יותר (Python)

                                  טוב כשצריך שליטה מלאה:

                                  from pdfminer.high_level import extract_text
                                  
                                  text = extract_text("input.pdf")
                                  
                                  # אם זה כבר מחרוזת לא תקינה, לפעמים צריך:
                                  text_bytes = text.encode('windows-1255', errors='ignore')
                                  fixed = text_bytes.decode('windows-1255')
                                  
                                  with open("output_utf8.txt", "w", encoding="utf-8") as f:
                                      f.write(fixed)
                                  

                                  ✅ אם הקידוד משובש בתוך ה-PDF עצמו

                                  לפעמים ה-PDF לא באמת שומר “Windows-1255”, אלא משתמש ב-font encoding פנימי. במצב כזה:

                                  • נסה pdftotext -raw
                                  • או pdftotext -enc UTF-8
                                  • או להשתמש ב-OCR (כמו Tesseract) אם שכבת הטקסט פגומה.

                                  💡 טיפ חשוב

                                  בדוק קודם מה הקידוד האמיתי של הקובץ שחולץ:

                                  file output.txt
                                  

                                  או:

                                  uchardet output.txt
                                  

                                  לפעמים זה בכלל ISO-8859-8 (עברית ישנה) ולא 1255.


                                  אם תרצה, אפשר לתת פתרון מדויק יותר לפי:

                                  • מערכת הפעלה
                                  • כלי העבודה שלך (CLI / Python / תוכנה גרפית)
                                  • דוגמה לפלט משובש

                                  מה אתה משתמש כרגע? 😊

                                  צ מנותק
                                  צ מנותק
                                  צדיק וטוב לו
                                  כתב נערך לאחרונה על ידי
                                  #156

                                  @י.-פל. אין לי פייתון, ולא מתחשק לי להתקין.
                                  אתה יכול לנסות להריץ את זה על חגיגה שהביאו למעלה?

                                  תגובה 1 תגובה אחרונה
                                  0
                                  • יאיר דניאלי יאיר דניאל

                                    @הבל-הבלים כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                                    [לא יודע איך להעלות לגיטהאב @יאיר-דניאל ].

                                    א - יש לך כאן בספויילר הסבר
                                    ב - אם אין לך כח תעלה את זה לדרייב, אוני אוריד משם

                                    הבל הבליםה מנותק
                                    הבל הבליםה מנותק
                                    הבל הבלים
                                    צוות פיקוח
                                    כתב נערך לאחרונה על ידי הבל הבלים
                                    #157

                                    @יאיר-דניאל
                                    כמובן שאני יודע להעלות לגיטהאב.
                                    לא הייתי מספיק ברור, בגלל הגודל, אני לא יודע, וגם אין לי כוח לבדוק.
                                    למעשה, עשיתי גם אופטימיזציה לקבצים, והם שוקלים - 1.6, אבל האיכות תמונה שלהם גרועה מאוד, יותר מהקבצים שיש היום לאוצריא, אבל בזום 100% זה בסדר, אני ינסה להעלות את שתיהם אם אני יצליח.

                                    תגובה 1 תגובה אחרונה
                                    0
                                    • צבי דורש ציוןצ צבי דורש ציון

                                      אגב לכל מי שחולם על ש"ס של עוז והדר, אם עוז והדר מאשרים את השימוש בש"ס שלהם אני מוכן להקריא בעל פה לכל מחשב כל מקום מבוקש בש"ס כאילו אני נמצא בתוך התוכנה...

                                      ולמי שלא הבין, זה לא יקרה!
                                      או יותר נכון יותר מהר שאני יצליח לעשות את הנ"ל בצורה קוונטית... 😁

                                      יהודי צעירי מנותק
                                      יהודי צעירי מנותק
                                      יהודי צעיר
                                      עורך ספרים מקצועי
                                      כתב נערך לאחרונה על ידי
                                      #158

                                      @צבי-דורש-ציון כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                                      אגב לכל מי שחולם על ש"ס של עוז והדר, אם עוז והדר מאשרים את השימוש בש"ס שלהם אני מוכן להקריא בעל פה לכל מחשב כל מקום מבוקש בש"ס כאילו אני נמצא בתוך התוכנה...

                                      ולמי שלא הבין, זה לא יקרה!
                                      או יותר נכון יותר מהר שאני יצליח לעשות את הנ"ל בצורה קוונטית... 😁

                                      דוקא היה איתם מו"מ, בינתיים לא אפרט בנידון

                                      מיכאלושמ תגובה 1 תגובה אחרונה
                                      3
                                      • יהודי צעירי יהודי צעיר

                                        @צבי-דורש-ציון כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                                        אגב לכל מי שחולם על ש"ס של עוז והדר, אם עוז והדר מאשרים את השימוש בש"ס שלהם אני מוכן להקריא בעל פה לכל מחשב כל מקום מבוקש בש"ס כאילו אני נמצא בתוך התוכנה...

                                        ולמי שלא הבין, זה לא יקרה!
                                        או יותר נכון יותר מהר שאני יצליח לעשות את הנ"ל בצורה קוונטית... 😁

                                        דוקא היה איתם מו"מ, בינתיים לא אפרט בנידון

                                        מיכאלושמ מנותק
                                        מיכאלושמ מנותק
                                        מיכאלוש
                                        כתב נערך לאחרונה על ידי
                                        #159

                                        @יהודי-צעיר כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                                        דוקא היה איתם מו"מ, בינתיים לא אפרט בנידון

                                        בינתיים יש את כאן שס עוז והדר לא לשימוש מסחרי

                                        הבל הבליםה יהודי צעירי 2 תגובות תגובה אחרונה
                                        0
                                        • מיכאלושמ מיכאלוש

                                          @יהודי-צעיר כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                                          דוקא היה איתם מו"מ, בינתיים לא אפרט בנידון

                                          בינתיים יש את כאן שס עוז והדר לא לשימוש מסחרי

                                          הבל הבליםה מנותק
                                          הבל הבליםה מנותק
                                          הבל הבלים
                                          צוות פיקוח
                                          כתב נערך לאחרונה על ידי
                                          #160

                                          @מיכאלוש
                                          אולי תשאל אותו? אוצריא זה לא שימוש מסחרי!

                                          תגובה 1 תגובה אחרונה
                                          0

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון