מחפש חיפוש יעיל עבור מחרוזת מקורבת בטקסט גדול

eitanamit

New member
מחפש חיפוש יעיל עבור מחרוזת מקורבת בטקסט גדול

שלום אני צריך לחפש מספר מילים בעלות אותו אורך בתוך טקסט ארוך (צריך לספור כמה פעמים כל מילה מופיעה) אני גם צריך לאפשר שההתאמה בין המילים לטקסט לא תהיה מלאה (המילים הם לא באמת מילים הטקסט הוא למעשה מחרוזת ארוכה של תווים ומספרים) יש למישהו רעיון? ואם זה לא המקום אז אם יש למישהו רעיון מה הפורום המתאים תודה מראש עמית
 

eitanamit

New member
אלגוריתמים

אני מחפש אלגוריתם לחיפוש מהיר בטקסט שהמטרה שלו היא למצוא כמות מופעים עם שגיאות של מילים (כמות השגיאות ידועה מראש) אני מתלבט בין מספר אלגורתמים עצי סיומות אבל אני לא בטוח לגמרי לגבי הסיבוכיות זמן שלהם בחיפוש עם שגיאות bitap שמבצע את מה שאני רוצה אבל סיבוכיות גבוהה ואלגוריתם שנקרא fast text searching allowing erros שעליו בנוי ה-agrep אני קורא עליהם מאמרים ואני אדע להשתמש בהם רק רציתי חוות דעת של מי שהשתמש באלגוריתמים מסוג זה והאם יש אלגוריתמים מומלצים אחרים או המצלות לגבי אחד מהנ"ל תודה מראש
 
תגובה

אני מניח שברור לך שהתשובה מאוד תלוי במאפיינים הפרטניים של הצורך הספציפי שלך. לשאלתך, אני לא התנסיתי בהם. אני לא יודע מה מידת העניין שלך בנושא, אולם כדאי לך לשקול פניה למכון לבלשנות חישובית באוניברסיטת בר אילן, המתמחה בשכאלו.
 
למעלה