מנוע חיפוש גנאולוגי - לשימוש פרטי?

10david10

New member
מנוע חיפוש גנאולוגי - לשימוש פרטי?

שלום לכולם

שאלה זאת מופנית לכולם, אבל בעיקר לבעלי הידע הטכני שבינינו.

עם הזמן והמשך צבירת הידע והניסיון שלי במחקר גנאולוגי, נצברים אצלי גם כמויות של חומרים מסוגים שונים המכילים מידע גנאולוגי רב. מה שהציב לי אתגר להפוך את המידע הזה לנגיש ויעיל עבורי, ומי יודע אולי מתישהו גם עבור אחרים.
השלב הראשון שעשיתי היה להעזר בתוכנה שהופכת מסמכי PDF לטקסט הניתן לחיפוש.
דוגמא קטנה ויעילה: הורדתי מאתר ארכיון המדינה כמה וכמה תיקים המכילים מאות דפים של רשימות עולים לפי א,ב או לפי אוניות וכדו'. אין ספק שהאפשרות לחפש שמות בתוך הקבצים הללו ביחד היא אפשרות מדהימה הנותנת יכולות שרק מאגרי מידע יכולים לתת. (סביר להניח שאת הדבר הספציפי הזה יעשו מתישהו גם באתר של IGRA).
השלב השני היה למצוא תוכנה שמאפשרת לי לחפש בכמה מסמכים ביחד ולהציג תוצאות בקלות ובמהירות. גם את זה כבר עשיתי.
נתקעתי בשלב השלישי:
נכון לעכשיו, אני יכול לבצע חיפוש פשוט בלבד. לחפש מילה AS IS. אמנם התוכנה שלי מאפשרת לחפש כמה מילים גם לא רצופות שזה טוב יותר מהחיפוש המובנה בקוראי PDF, אבל עדייו יש כמה בעיות:
1. הטקסט לא מפוענח היטב, ועלולים להיות שגיאות כתיב.
2. כידוע בגנאולוגיה, לשמות יכולות להיות אלף וריאציות. קשה להתחיל לחפש את כולם.
יש עוד, אבל אלו הדוגמאות המרכזיות. מהסיבות הללו, כל מאגר מידע מחזיק מנוע חיפוש המכיל יכולות מתקדמות כמו חיפוש לפי שמיעה או חיפוש לפי התאמות פונטיות. זה פותר את רוב הבעיות.

השאלה שלי היא: האם מישהו יודע על כלי כזה שיכול להתאים לי כמשתמש פרטי? שיכול לבצע חיפוש (עם יכולות מתקדמות) בתוך טקסטים שאני יבחר?

למה אני בכלל שואל וחושב על רעיון כזה? בהתחלה חשבתי שזה רק עניין לארגונים ולאתרי אינטרנט גדולים. אבל ראיתי שבאתר של סטיבן מורס יש איזשהו כלי לבנות מנוע חיפוש לעצמך. אני לא יודע, לא הצלחתי להבין בדיוק מה זה. אולי זה בדיוק מה שאני מחפש ואני רק צריך עזרה והדרכה ממישהו שמכיר את זה. אבל גם אם לא, אולי זה אומר שמה שאני מחפש קיים, ובחינם, וזה עשוי להיות כלי עצום עבורי.

תודה לכולכם
דוד
 
המנוע שמציע סטפן מורס עובד על בסיסי נתונים/טבלאות

ואם אני מבין נכון, לך יש קבצים "שטוחים" (PDF, למשל) שאינם מסודרים בטבלאות. חוצמזה, האלגוריתמים של סטפן מורס עובדים באנגלית בלבד (אאל"ט).
&nbsp
אם תרצה להשקיע קצת זמן ומחשבה בנושא, תוכל אולי להשתמש בקודים לחיפוש-על-פי-סאונדקס שיש באינטרנט (בחיפוש זריז מצאתי עכשיו בקלות כמה) ולכתוב תוכנה קטנה שתדע לחפש במסמכים שלך.
&nbsp
לגבי בעיות בפענוח הטקסט אני לא בטוח שיש לי תשובה...
 
ובאותו הקשר - תכנה לאירגון המידע של החוקר

THE BRAIN היא תכנה ששמעתי עליה, שמסייעת לארגן את החומרים של החוקר ולייצר קשרים בין נושאים שונים. בדרך זו ניתן לארגן את חומרי המחקר .
יש לה חלק חינמי (טוב למסמכי טכסט) וחלק פרימיום (שווה יותר כי יכול לחבר גם תמונות וסרטים וכו')
מעניין אם היא מוכרת - מניסיון אישי - למישהו.
 
תכנה לחיבור בין פריטי מידע של החוקר THE BRAIN

טחנתי סרטוני יוטיוב וויבינרים
והדבר נראה לי מעניין
אבל עדיין לא תפסתי אומץ להרטיב את הרגליים
הנה לינק שיכול לעזור לסקרנים
https://www.youtube.com/c/thebrain 
 
למעלה