הצעת ייעול | שילוב פרויקט ״הכי גרסינן״ באוצריא
-
@חנניה כרגע הOCR שפותח לצורך תעתוק נכון של מאות סוגי כתבי יד עדיין לוקה בחסר, אבל גם אוצר החכמה בספרים הישנים לא עושה את העבודה.
זה קובץ TXT של ג'יגה וחצי.
את התוכנה בנה יהודי יקר בשם הלל גרשוני.
קובץ התעתיקים של מדרש: https://zenodo.org/records/17734473
תוכנת Genizah Search Pro:
https://github.com/gershuni/GenizahSearch/releasesאפשר להכניס עצמאית את הקובץ לתוכנה, רק לא רציתי לנסות האם אוצריא תעמוד בתוספת גדולה כזו, מאחר שזה קובץ בודד.
שלחתי בעבר את כל שו"ת פרי עץ חיים בקובץ אחד, ואני עדיין לא משוכנע שזה רעיון טוב.@סופר-סתם כתב בהצעת ייעול | שילוב פרויקט ״הכי גרסינן״ באוצריא:
שלחתי בעבר את כל שו"ת פרי עץ חיים בקובץ אחד, ואני עדיין לא משוכנע שזה רעיון טוב.
@סופר-סתם כתב בהצעת ייעול | שילוב פרויקט ״הכי גרסינן״ באוצריא:
אתה צודק, זה נפתח מעולה!
אז למה זה לא רעיון טוב?
-
@צבי-דורש-ציון כתב בהצעת ייעול | שילוב פרויקט ״הכי גרסינן״ באוצריא:
אני כותב לפעמים מאמרים בהלכה, וכמובן שכחלק מהנידונים זה דיוקים בלשונות הגמרא, וזה כמעט לא אפשרי בלי לראות כמה כת"י כמובן
לדעתך מי שלא בקי בכת"י לא יכול לפסוק בהלכה?
שינוי הנוסחאות המוסמכים נמצאים כבר בראשונים או באחרונים.@קטנטן כתב בהצעת ייעול | שילוב פרויקט ״הכי גרסינן״ באוצריא:
@צבי-דורש-ציון כתב בהצעת ייעול | שילוב פרויקט ״הכי גרסינן״ באוצריא:
אני כותב לפעמים מאמרים בהלכה, וכמובן שכחלק מהנידונים זה דיוקים בלשונות הגמרא, וזה כמעט לא אפשרי בלי לראות כמה כת"י כמובן
לדעתך מי שלא בקי בכת"י לא יכול לפסוק בהלכה?
שינוי הנוסחאות המוסמכים נמצאים כבר בראשונים או באחרונים.א. חלק מלעבור על נוסחאות זה כולל את הנוסחאות שהיו בידי הראשונים, אבל אם יש חיזוק בכתבי היד לאחד הגירסאות בראשונים זה ודאי מוסיף הרבה (וזה לכאורה גם לשיטת החזון אי"ש)
ב. ודאי שכשלא ראית שום כת"י ואתה רוצה לדייק ממילה מסויימת (לא משפט, מילה שייתכן בה שינוי) אתה צריך לקחת את זה בערבון מוגבל. -
@סופר-סתם כתב בהצעת ייעול | שילוב פרויקט ״הכי גרסינן״ באוצריא:
שלחתי בעבר את כל שו"ת פרי עץ חיים בקובץ אחד, ואני עדיין לא משוכנע שזה רעיון טוב.
@סופר-סתם כתב בהצעת ייעול | שילוב פרויקט ״הכי גרסינן״ באוצריא:
אתה צודק, זה נפתח מעולה!
אז למה זה לא רעיון טוב?
@יום-חדש-מתחיל בזמנו אז, זה לא נפתח בצורה מיטבית, אכן עכשיו אחרי שהסתבת את תשומת ליבי, בדקתי וזה מעולה.
-
@סופר-סתם כתב בהצעת ייעול | שילוב פרויקט ״הכי גרסינן״ באוצריא:
קובץ התעתיקים של מדרש
מה זה אומר?
@סופר-סתם כתב בהצעת ייעול | שילוב פרויקט ״הכי גרסינן״ באוצריא:
רגע הOCR שפותח לצורך תעתוק נכון של מאות סוגי כתבי יד עדיין לוקה בחסר, אבל גם אוצר החכמה בספרים הישנים לא עושה את העבודה.
התוכנה הזאת מה היא עושה
-
@u88 מדרש הוא פרויקט שקיבל מענק של האיחוד האירופי, והוא פיענוח OCR של כל קטעי הגניזה הקיימים בכל רחבי העולם.
התוכנה היא תוכנת חיפוש בעלת פונקציות שונות, וכן יכולת הצגת קטעי מקור של כתבי היד בצמוד לטקסטים, חיבור לבינה מלאכותית ועוד. -
מי שקשור כאן בפורום לדיקטה, זה @אהרן ניתן לפנות אליו.
-
אני הקטן יכול לומר רק על עצמי שאם יהיה אפשרות להכניס את הקבצים האלו אני יתחיל ללמוד הרבה יותר עם התוכנה
הנקודה הזאת הכי מפריעה לי שהגמ' אינה מוגהת כיאות@אביעד כתב בהצעת ייעול | שילוב פרויקט ״הכי גרסינן״ באוצריא:
אני הקטן יכול לומר רק על עצמי שאם יהיה אפשרות להכניס את הקבצים האלו אני יתחיל ללמוד הרבה יותר עם התוכנה
הנקודה הזאת הכי מפריעה לי שהגמ' אינה מוגהת כיאותאי מהא לא איריא.
גם אם יהיו אלף הגהות מכתבי יד בחלון צדדי - זה לא יועיל במקרה שנוסח הגמ' שבפנים אינו מוגה כדבעי.
כי במה שכל כתבי היד שווים בו - לא יהיה שום ציון בהגהות,
ואם בדיוק בשורה הזאת נפלה טעות במקור ממנו נלקח טקסט הגמ' [למשל 'ספרייה']- לא תראה על זה שום הערה. -
@אביעד כתב בהצעת ייעול | שילוב פרויקט ״הכי גרסינן״ באוצריא:
אני הקטן יכול לומר רק על עצמי שאם יהיה אפשרות להכניס את הקבצים האלו אני יתחיל ללמוד הרבה יותר עם התוכנה
הנקודה הזאת הכי מפריעה לי שהגמ' אינה מוגהת כיאותאי מהא לא איריא.
גם אם יהיו אלף הגהות מכתבי יד בחלון צדדי - זה לא יועיל במקרה שנוסח הגמ' שבפנים אינו מוגה כדבעי.
כי במה שכל כתבי היד שווים בו - לא יהיה שום ציון בהגהות,
ואם בדיוק בשורה הזאת נפלה טעות במקור ממנו נלקח טקסט הגמ' [למשל 'ספרייה']- לא תראה על זה שום הערה.