מנוע חיפוש גנאולוגי - לשימוש פרטי?
שלום לכולם
שאלה זאת מופנית לכולם, אבל בעיקר לבעלי הידע הטכני שבינינו.
עם הזמן והמשך צבירת הידע והניסיון שלי במחקר גנאולוגי, נצברים אצלי גם כמויות של חומרים מסוגים שונים המכילים מידע גנאולוגי רב. מה שהציב לי אתגר להפוך את המידע הזה לנגיש ויעיל עבורי, ומי יודע אולי מתישהו גם עבור אחרים.
השלב הראשון שעשיתי היה להעזר בתוכנה שהופכת מסמכי PDF לטקסט הניתן לחיפוש.
דוגמא קטנה ויעילה: הורדתי מאתר ארכיון המדינה כמה וכמה תיקים המכילים מאות דפים של רשימות עולים לפי א,ב או לפי אוניות וכדו'. אין ספק שהאפשרות לחפש שמות בתוך הקבצים הללו ביחד היא אפשרות מדהימה הנותנת יכולות שרק מאגרי מידע יכולים לתת. (סביר להניח שאת הדבר הספציפי הזה יעשו מתישהו גם באתר של IGRA).
השלב השני היה למצוא תוכנה שמאפשרת לי לחפש בכמה מסמכים ביחד ולהציג תוצאות בקלות ובמהירות. גם את זה כבר עשיתי.
נתקעתי בשלב השלישי:
נכון לעכשיו, אני יכול לבצע חיפוש פשוט בלבד. לחפש מילה AS IS. אמנם התוכנה שלי מאפשרת לחפש כמה מילים גם לא רצופות שזה טוב יותר מהחיפוש המובנה בקוראי PDF, אבל עדייו יש כמה בעיות:
1. הטקסט לא מפוענח היטב, ועלולים להיות שגיאות כתיב.
2. כידוע בגנאולוגיה, לשמות יכולות להיות אלף וריאציות. קשה להתחיל לחפש את כולם.
יש עוד, אבל אלו הדוגמאות המרכזיות. מהסיבות הללו, כל מאגר מידע מחזיק מנוע חיפוש המכיל יכולות מתקדמות כמו חיפוש לפי שמיעה או חיפוש לפי התאמות פונטיות. זה פותר את רוב הבעיות.
השאלה שלי היא: האם מישהו יודע על כלי כזה שיכול להתאים לי כמשתמש פרטי? שיכול לבצע חיפוש (עם יכולות מתקדמות) בתוך טקסטים שאני יבחר?
למה אני בכלל שואל וחושב על רעיון כזה? בהתחלה חשבתי שזה רק עניין לארגונים ולאתרי אינטרנט גדולים. אבל ראיתי שבאתר של סטיבן מורס יש איזשהו כלי לבנות מנוע חיפוש לעצמך. אני לא יודע, לא הצלחתי להבין בדיוק מה זה. אולי זה בדיוק מה שאני מחפש ואני רק צריך עזרה והדרכה ממישהו שמכיר את זה. אבל גם אם לא, אולי זה אומר שמה שאני מחפש קיים, ובחינם, וזה עשוי להיות כלי עצום עבורי.
תודה לכולכם
דוד
שלום לכולם
שאלה זאת מופנית לכולם, אבל בעיקר לבעלי הידע הטכני שבינינו.
עם הזמן והמשך צבירת הידע והניסיון שלי במחקר גנאולוגי, נצברים אצלי גם כמויות של חומרים מסוגים שונים המכילים מידע גנאולוגי רב. מה שהציב לי אתגר להפוך את המידע הזה לנגיש ויעיל עבורי, ומי יודע אולי מתישהו גם עבור אחרים.
השלב הראשון שעשיתי היה להעזר בתוכנה שהופכת מסמכי PDF לטקסט הניתן לחיפוש.
דוגמא קטנה ויעילה: הורדתי מאתר ארכיון המדינה כמה וכמה תיקים המכילים מאות דפים של רשימות עולים לפי א,ב או לפי אוניות וכדו'. אין ספק שהאפשרות לחפש שמות בתוך הקבצים הללו ביחד היא אפשרות מדהימה הנותנת יכולות שרק מאגרי מידע יכולים לתת. (סביר להניח שאת הדבר הספציפי הזה יעשו מתישהו גם באתר של IGRA).
השלב השני היה למצוא תוכנה שמאפשרת לי לחפש בכמה מסמכים ביחד ולהציג תוצאות בקלות ובמהירות. גם את זה כבר עשיתי.
נתקעתי בשלב השלישי:
נכון לעכשיו, אני יכול לבצע חיפוש פשוט בלבד. לחפש מילה AS IS. אמנם התוכנה שלי מאפשרת לחפש כמה מילים גם לא רצופות שזה טוב יותר מהחיפוש המובנה בקוראי PDF, אבל עדייו יש כמה בעיות:
1. הטקסט לא מפוענח היטב, ועלולים להיות שגיאות כתיב.
2. כידוע בגנאולוגיה, לשמות יכולות להיות אלף וריאציות. קשה להתחיל לחפש את כולם.
יש עוד, אבל אלו הדוגמאות המרכזיות. מהסיבות הללו, כל מאגר מידע מחזיק מנוע חיפוש המכיל יכולות מתקדמות כמו חיפוש לפי שמיעה או חיפוש לפי התאמות פונטיות. זה פותר את רוב הבעיות.
השאלה שלי היא: האם מישהו יודע על כלי כזה שיכול להתאים לי כמשתמש פרטי? שיכול לבצע חיפוש (עם יכולות מתקדמות) בתוך טקסטים שאני יבחר?
למה אני בכלל שואל וחושב על רעיון כזה? בהתחלה חשבתי שזה רק עניין לארגונים ולאתרי אינטרנט גדולים. אבל ראיתי שבאתר של סטיבן מורס יש איזשהו כלי לבנות מנוע חיפוש לעצמך. אני לא יודע, לא הצלחתי להבין בדיוק מה זה. אולי זה בדיוק מה שאני מחפש ואני רק צריך עזרה והדרכה ממישהו שמכיר את זה. אבל גם אם לא, אולי זה אומר שמה שאני מחפש קיים, ובחינם, וזה עשוי להיות כלי עצום עבורי.
תודה לכולכם
דוד