דילוג לתוכן
0
  • דף הבית
  • חוקי הפורום
  • מדריכים
  • פוסטים אחרונים
  • לא נפתר
  • פופולרי
  • משתמשים
  • חיפוש בפורום
  • צור קשר
  • דף הבית
  • חוקי הפורום
  • מדריכים
  • פוסטים אחרונים
  • לא נפתר
  • פופולרי
  • משתמשים
  • חיפוש בפורום
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
לוגו אתר

פורום אוצריא

אוצריא - דף הבית
|
קח שותפות בהוספת ספרים
|
תרום לאוצריא חיפוש
  1. דף הבית
  2. הוספת ספרים לספריית אוצריא
  3. להורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא

להורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא

מתוזמן נעוץ נעול הועבר הוספת ספרים לספריית אוצריא
198 פוסטים 26 כותבים 2.7k צפיות 25 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • יאיר דניאלי יאיר דניאל

    @יום-חדש-מתחיל כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

    צריך להשיג אולי את הש"ס של הרב פנחס ראובן מבני ברק [שיהי' בריא].

    מבחינת OCR איך הדרך הכי קלה ומהירה ליצור - לשס וגשל?

    הבל הבליםה מנותק
    הבל הבליםה מנותק
    הבל הבלים
    צוות פיקוח
    כתב נערך לאחרונה על ידי
    #126

    @יאיר-דניאל
    יש מדריך של @אלישי במתמחים, חפש שם.

    יאיר דניאלי תגובה 1 תגובה אחרונה
    0
    • הבל הבליםה הבל הבלים

      @יאיר-דניאל
      יש מדריך של @אלישי במתמחים, חפש שם.

      יאיר דניאלי מנותק
      יאיר דניאלי מנותק
      יאיר דניאל
      כתב נערך לאחרונה על ידי
      #127

      @הבל-הבלים כוונתך לABYY או משהו כזה?

      "כִּי רָצוּ עֲבָדֶיךָ אֶת אֲבָנֶיהָ וְאֶת עֲפָרָהּ יְחֹנֵנוּ"

      תגובה 1 תגובה אחרונה
      0
      • יום חדש מתחילי מנותק
        יום חדש מתחילי מנותק
        יום חדש מתחיל
        מנהל ספריית אוצריא
        כתב נערך לאחרונה על ידי
        #128

        כן. או התוכנה המקבילה, שכחתי את שמה.

        תגובה 1 תגובה אחרונה
        0
        • הבל הבליםה מנותק
          הבל הבליםה מנותק
          הבל הבלים
          צוות פיקוח
          כתב נערך לאחרונה על ידי
          #129

          XChange

          יאיר דניאלי תגובה 1 תגובה אחרונה
          0
          • הבל הבליםה הבל הבלים

            XChange

            יאיר דניאלי מנותק
            יאיר דניאלי מנותק
            יאיר דניאל
            כתב נערך לאחרונה על ידי
            #130

            @הבל-הבלים כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

            XChange

            זה שווה משהו? יש לי את זה - גירסה קצת ישנה.

            "כִּי רָצוּ עֲבָדֶיךָ אֶת אֲבָנֶיהָ וְאֶת עֲפָרָהּ יְחֹנֵנוּ"

            הבל הבליםה תגובה 1 תגובה אחרונה
            0
            • יאיר דניאלי יאיר דניאל

              @יום-חדש-מתחיל כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

              צריך להשיג אולי את הש"ס של הרב פנחס ראובן מבני ברק [שיהי' בריא].

              מבחינת OCR איך הדרך הכי קלה ומהירה ליצור - לשס וגשל?

              חנניהח מנותק
              חנניהח מנותק
              חנניה
              כתב נערך לאחרונה על ידי
              #131
              פוסט זה נמחק!
              תגובה 1 תגובה אחרונה
              0
              • יאיר דניאלי יאיר דניאל

                @הבל-הבלים כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                XChange

                זה שווה משהו? יש לי את זה - גירסה קצת ישנה.

                הבל הבליםה מנותק
                הבל הבליםה מנותק
                הבל הבלים
                צוות פיקוח
                כתב נערך לאחרונה על ידי
                #132

                @יאיר-דניאל
                בגדול זה אותו מנוע, האם יש הבדלים? לא יודע.
                ואם יש לך גירסה ישנה, למה שלא תעדכן? יש במתמחים.

                חפש אצל @בנימין-מחשבים

                יאיר דניאלי תגובה 1 תגובה אחרונה
                1
                • הבל הבליםה הבל הבלים

                  @יאיר-דניאל
                  בגדול זה אותו מנוע, האם יש הבדלים? לא יודע.
                  ואם יש לך גירסה ישנה, למה שלא תעדכן? יש במתמחים.

                  חפש אצל @בנימין-מחשבים

                  יאיר דניאלי מנותק
                  יאיר דניאלי מנותק
                  יאיר דניאל
                  כתב נערך לאחרונה על ידי יאיר דניאל
                  #133

                  @הבל-הבלים כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                  ואם יש לך גירסה ישנה, למה שלא תעדכן

                  שיקול של גודל - הישןם שוקל 500 מ"ב, החדש כמעט ג'יגה אאל"ט - ואין לי צורך מיוחד בחדש שאין לי בישן

                  "כִּי רָצוּ עֲבָדֶיךָ אֶת אֲבָנֶיהָ וְאֶת עֲפָרָהּ יְחֹנֵנוּ"

                  הבל הבליםה תגובה 1 תגובה אחרונה
                  0
                  • יאיר דניאלי יאיר דניאל

                    @הבל-הבלים כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                    ואם יש לך גירסה ישנה, למה שלא תעדכן

                    שיקול של גודל - הישןם שוקל 500 מ"ב, החדש כמעט ג'יגה אאל"ט - ואין לי צורך מיוחד בחדש שאין לי בישן

                    הבל הבליםה מנותק
                    הבל הבליםה מנותק
                    הבל הבלים
                    צוות פיקוח
                    כתב נערך לאחרונה על ידי
                    #134

                    @יאיר-דניאל
                    המודלי OCR אמורים להיות הרבה הרבה יותר טובים.

                    תגובה 1 תגובה אחרונה
                    1
                    • יאיר דניאלי יאיר דניאל

                      @יום-חדש-מתחיל כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                      צריך להשיג אולי את הש"ס של הרב פנחס ראובן מבני ברק [שיהי' בריא].

                      מבחינת OCR איך הדרך הכי קלה ומהירה ליצור - לשס וגשל?

                      ד מנותק
                      ד מנותק
                      דורש טוב
                      כתב נערך לאחרונה על ידי דורש טוב
                      #135

                      @יאיר-דניאל שמתי לב שזה בכלל לא קובץ תמונה עם שכבת טקסט כמו באוצריא, אלא זה קובץ שמוגדר כטקסט כמו קובץ וורד ששמרו כPDF
                      רק שמשום מה הוא לא מזוהה כעברית אלא משהו משובש
                      אם ככה יכול להיות שיש דרך להעתיק את הטקסט בעצמו בלי OCR בכלל ולהפוך אותו לOCR בדיוק מושלם
                      @מישהו שמבין בזה?

                      חנניהח צ 2 תגובות תגובה אחרונה
                      0
                      • ד דורש טוב

                        @יאיר-דניאל שמתי לב שזה בכלל לא קובץ תמונה עם שכבת טקסט כמו באוצריא, אלא זה קובץ שמוגדר כטקסט כמו קובץ וורד ששמרו כPDF
                        רק שמשום מה הוא לא מזוהה כעברית אלא משהו משובש
                        אם ככה יכול להיות שיש דרך להעתיק את הטקסט בעצמו בלי OCR בכלל ולהפוך אותו לOCR בדיוק מושלם
                        @מישהו שמבין בזה?

                        חנניהח מנותק
                        חנניהח מנותק
                        חנניה
                        כתב נערך לאחרונה על ידי
                        #136

                        @דורש-טוב כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                        שמתי לב שזה בכלל לא קובץ תמונה עם שכבת טקסט כמו באוצריא, אלא זה קובץ שמוגדר כטקסט כמו קובץ וורד ששמרו כPDF

                        אתה מתכוין לוגשל?

                        יאיר דניאלי תגובה 1 תגובה אחרונה
                        0
                        • חנניהח חנניה

                          @דורש-טוב כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                          שמתי לב שזה בכלל לא קובץ תמונה עם שכבת טקסט כמו באוצריא, אלא זה קובץ שמוגדר כטקסט כמו קובץ וורד ששמרו כPDF

                          אתה מתכוין לוגשל?

                          יאיר דניאלי מנותק
                          יאיר דניאלי מנותק
                          יאיר דניאל
                          כתב נערך לאחרונה על ידי
                          #137

                          @חנניה כן

                          "כִּי רָצוּ עֲבָדֶיךָ אֶת אֲבָנֶיהָ וְאֶת עֲפָרָהּ יְחֹנֵנוּ"

                          תגובה 1 תגובה אחרונה
                          1
                          • ד מנותק
                            ד מנותק
                            דורש טוב
                            כתב נערך לאחרונה על ידי
                            #138

                            כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                            @מישהו שמבין בזה?

                            ג'מיני

                            ניתוח מדויק מאוד. העובדה שאתה יכול למחוק את הטקסט או שהדף עצמו מוגדר כטקסט, מעידה על כך שמדובר בקובץ וקטורי (נוצר ישירות מתוכנה כמו Word או אינדיזיין) ולא בסריקה.

                            הסיבה שאתה מקבל "ג'יבריש" או סימנים משובשים כשאתה מעתיק, נובעת מבעיית קידוד (Encoding). התוכנה יודעת איפה להניח כל אות מבחינה גרפית, אבל היא לא "מבינה" איזו אות זו באמת במפת התווים.

                            כדי לפתור את זה ולהפוך את הטקסט המשובש ל-OCR איכותי ותקין בעברית, עקוב אחר השלבים הבאים:


                            שלב א': "השטחת" הקובץ לתמונה (כדי להיפטר מהקידוד הפגום)

                            כדי שה-OCR יוכל לזהות את האותיות לפי הצורה שלהן (ולא לפי הקוד הפגום שלהן), עלינו להפוך את הדף לתמונה נקייה:

                            1. עבור ללשונית "קובץ" -> "הדפסה".
                            2. בבחירת המדפסת, בחר ב-PDF-XChange Printer או Microsoft Print to PDF.
                            3. לחץ על כפתור "מתקדם" (או הגדרות הדפסה) וחפש את האפשרות "הדפס כתמונה" (Print as Image).
                            • הערה: הגדר רזולוציה של 300 או 600 DPI כדי לשמור על האיכות הגבוהה שחשובה לך.
                            1. אשר והדפס. כעת קיבלת קובץ PDF חדש שבו הכל הוא תמונה אחת איכותית, ללא קידוד משובש.

                            שלב ב': ביצוע OCR בעברית על הקובץ ה"נקי"

                            עכשיו כשהטקסט הוא רק "צורה" של אותיות, התוכנה תוכל לזהות אותו בקלות:

                            1. עבור ללשונית "המרה" (Convert).
                            2. לחץ על "זיהוי טקסט (OCR)".
                            3. בחלון שנפתח, וודא שהגדרת:
                            • שפות: עברית (אם אין לך, לחץ על "הוסף שפה").
                            • סוג פלט: "טקסט ניתן לחיפוש מעל תמונה" (Searchable Text over Image).
                            1. לחץ על אישור.

                            למה זה הפתרון הכי טוב עבורך?

                            • דיוק: מכיוון שקובץ המקור שלך באיכות גבוהה, ה-OCR יזהה כמעט 100% מהטקסט ללא שגיאות.
                            • תיקון הג'יבריש: ברגע שהפכת את הטקסט לתמונה, "מחקת" את המידע השגוי שהיה מוצמד לאותיות. ה-OCR יוצר מפת תווים חדשה ותקינה לחלוטין.
                            • שמירה על המראה: הקובץ ייראה בדיוק אותו דבר, אבל עכשיו תוכל להעתיק ממנו טקסט בעברית תקינה.

                            פתרון מהיר (ללא הדפסה):

                            אם אתה לא רוצה להדפיס, תוכל לנסות בלשונית "המרה" -> "זיהוי טקסט", ובאפשרויות לבחור ב-"Ignore existing text" (התעלם מטקסט קיים). זה יכריח את התוכנה לבצע OCR על סמך צורת האותיות למרות שהיא כבר "רואה" שם טקסט (את הג'יבריש).

                            ובלי OCR ?
                            כלומר להפוך את הטקסט עצמו למשהו שניתן להעתקה?

                            מבחינה טכנית, אם הטקסט שאתה מעתיק יוצא כ"ג'יבריש", זה אומר שהמפה שמקשרת בין הצורה הגרפית של האות לבין הערך הדיגיטלי שלה (מה שנקרא Encoding או Character Map) שבורה.

                            במצב כזה, המחשב רואה "צורה" של האות א', אבל ב"תעודת הזהות" של האות הזו רשום שהיא בכלל הסימן @. כשאתה מעתיק, הוא מעתיק את "תעודת הזהות" ולא את המראה.

                            האם אפשר לתקן את זה בלי OCR? התשובה היא: בדרך כלל לא, אבל יש ניסיון אחד ששווה לעשות לפני שנכנעים ל-OCR:

                            הניסיון היחיד ללא OCR: החלפת גופן (Font Replacement)

                            לפעמים הבעיה היא רק בגופן המוטמע (Embedded). אם נכריח את התוכנה להשתמש בגופן תקני שמותקן אצלך במחשב, אולי המיפוי יסתדר.

                            1. עבור ללשונית עריכה (Edit) ובחר בכלי ערוך תוכן (Edit Content).
                            2. סמן את הטקסט המשובש (או Ctrl + A).
                            3. לחץ עליו קליק ימני ובחר מאפיינים (Properties).
                            4. בחלון המאפיינים שייפתח בצד, חפש את סעיף Text Styles (סגנונות טקסט) ושם את Font (גופן).
                            5. נסה לשנות את הגופן לגופן עברי סטנדרטי כמו Arial או David.

                            התוצאה האפשרית:

                            • אם זה הצליח: הטקסט יהפוך לקריא וניתן להעתקה.
                            • אם זה נכשל: הטקסט יהפוך לריבועים (Empty boxes) או שיישאר ג'יבריש. זה סימן שהמידע על האותיות פשוט לא קיים בקובץ.

                            למה OCR הוא בעצם "מכונת תיקון" במקרה שלך?

                            חשוב להבין: OCR הוא לא רק לסריקות גרועות. ב-PDF-XChange, ה-OCR יודע "להסתכל" על הציור של האותיות (שנראה מעולה כי זה קובץ מקור) ולתת להן "תעודת זהות" חדשה ותקינה בעברית.

                            אם תשתמש באופציה "Ignore Existing Text" (התעלם מטקסט קיים) בזמן ביצוע ה-OCR:

                            1. התוכנה תמחק את ה"ג'יבריש" הנסתר.
                            2. היא תנתח את צורת האותיות האיכותית שיש לך.
                            3. היא תדביק מעליהן שכבת טקסט חדשה, הפעם עם קידוד עברי תקני.

                            התוצאה: הקובץ יישאר באיכות המקורית הגבוהה שלו, אבל הטקסט יהיה סוף סוף "חי" ואמיתי.

                            לסיכום:

                            אם החלפת הגופן (בשיטת המאפיינים) לא עזרה, אין דרך אחרת מלבד OCR. היתרון הוא שעל קובץ וקטורי איכותי, ה-OCR רץ בשניות והדיוק שלו הוא כמעט 100%.

                            אולי למישהו יש משהו לעשות עם המידע הזה

                            תגובה 1 תגובה אחרונה
                            1
                            • ד דורש טוב

                              @יאיר-דניאל שמתי לב שזה בכלל לא קובץ תמונה עם שכבת טקסט כמו באוצריא, אלא זה קובץ שמוגדר כטקסט כמו קובץ וורד ששמרו כPDF
                              רק שמשום מה הוא לא מזוהה כעברית אלא משהו משובש
                              אם ככה יכול להיות שיש דרך להעתיק את הטקסט בעצמו בלי OCR בכלל ולהפוך אותו לOCR בדיוק מושלם
                              @מישהו שמבין בזה?

                              צ מנותק
                              צ מנותק
                              צדיק וטוב לו
                              כתב נערך לאחרונה על ידי
                              #139

                              @דורש-טוב אתה יכול להביא לי דף אחד כזה לנסות לבדוק?
                              מה מקור הש"ס? היברובוקס? מהרשת?

                              חנניהח ד 2 תגובות תגובה אחרונה
                              0
                              • צ צדיק וטוב לו

                                @דורש-טוב אתה יכול להביא לי דף אחד כזה לנסות לבדוק?
                                מה מקור הש"ס? היברובוקס? מהרשת?

                                חנניהח מנותק
                                חנניהח מנותק
                                חנניה
                                כתב נערך לאחרונה על ידי
                                #140

                                @צדיק-וטוב-לו למה שלא תוריד מהריפו?

                                תגובה 1 תגובה אחרונה
                                0
                                • צ צדיק וטוב לו

                                  @דורש-טוב אתה יכול להביא לי דף אחד כזה לנסות לבדוק?
                                  מה מקור הש"ס? היברובוקס? מהרשת?

                                  ד מנותק
                                  ד מנותק
                                  דורש טוב
                                  כתב נערך לאחרונה על ידי דורש טוב
                                  #141

                                  @צדיק-וטוב-לו העלתי פה מסכת חגיגה

                                  @צדיק-וטוב-לו כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                                  מה מקור הש"ס? היברובוקס? מהרשת?

                                  אין לי מושג @יאיר-דניאל
                                  זה כמו של היברובוקס ואוצריא אבל זה נראה קובץ מקור

                                  הבל הבליםה תגובה 1 תגובה אחרונה
                                  0
                                  • ד דורש טוב

                                    @צדיק-וטוב-לו העלתי פה מסכת חגיגה

                                    @צדיק-וטוב-לו כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                                    מה מקור הש"ס? היברובוקס? מהרשת?

                                    אין לי מושג @יאיר-דניאל
                                    זה כמו של היברובוקס ואוצריא אבל זה נראה קובץ מקור

                                    הבל הבליםה מנותק
                                    הבל הבליםה מנותק
                                    הבל הבלים
                                    צוות פיקוח
                                    כתב נערך לאחרונה על ידי
                                    #142

                                    @דורש-טוב כתב בלהורדה | חדש! מאגר גיטאב - לספרים מותאמים לאוצריא:

                                    זה כמו של היברובוקס

                                    יש אותו דבר גם בהיברובוקס אבל שם הם הטביעו ע"ז סימן מים של זכויות יוצרים.

                                    תגובה 1 תגובה אחרונה
                                    0
                                    • צבי דורש ציוןצ מנותק
                                      צבי דורש ציוןצ מנותק
                                      צבי דורש ציון
                                      כתב נערך לאחרונה על ידי צבי דורש ציון
                                      #143

                                      אגב לכל מי שחולם על ש"ס של עוז והדר, אם עוז והדר מאשרים את השימוש בש"ס שלהם אני מוכן להקריא בעל פה לכל מחשב כל מקום מבוקש בש"ס כאילו אני נמצא בתוך התוכנה...

                                      ולמי שלא הבין, זה לא יקרה!
                                      או יותר נכון יותר מהר שאני יצליח לעשות את הנ"ל בצורה קוונטית... 😁

                                      כי ירושלים אמנם תבנה כשיכספו בני ישראל לה תכלית הכוסף עד שיחוננו אבניה ועפרה
                                      (רבי יהודה הלוי בכוזרי מאמר ה עפ"י הפסוק אתה תקום וגו')

                                      יהודי צעירי תגובה 1 תגובה אחרונה
                                      3
                                      • צ מנותק
                                        צ מנותק
                                        צדיק וטוב לו
                                        כתב נערך לאחרונה על ידי
                                        #144

                                        ובכן.
                                        זה בעיה בקידוד.
                                        זה מקודד בקידוד ישן של Windows-1255
                                        כאשר צריך להמיר אותו ל UTF-8
                                        בוורד זה קלי קלות
                                        השאלה איך עושים את זה ל PDF, בלי שיקרה דבר לשכבת התמונה מעל.

                                        צ תגובה 1 תגובה אחרונה
                                        1
                                        • יהודי צעירי יהודי צעיר

                                          עדיף לחפש תלמוד בבלי חדש לאוצריא
                                          אני ניסיתי קצת, וללא הצלחה בינתיים
                                          צריך לפנות למהדורות ספרים
                                          (עוז והדר פניתי)
                                          המאור
                                          בארות
                                          טלמן
                                          שס ארץ ישראל (בלום)
                                          שס יביע אומר
                                          ועוד...

                                          מיכאלושמ מנותק
                                          מיכאלושמ מנותק
                                          מיכאלוש
                                          כתב נערך לאחרונה על ידי יום חדש מתחיל
                                          #145

                                          @יהודי-צעיר
                                          כמדומני שכבר שנים מאורות הדף היומי משתמשים בש"ס וילנא של מסורת הש"ס רק ללא ההערות שמסורת הש"ס עבדו אליהם
                                          פנית לאחד משניהם ?

                                          תגובה 1 תגובה אחרונה
                                          0

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון