חיפוש מחרוזות ושאר ירקות...

rontech

New member
חיפוש מחרוזות ושאר ירקות...

אז לפרוייקט אני צריך לפתח מיון וחיפוש של נתונים. אין לי נסיון בזה. ערכתי חיפושים בגוגל ויש גם קצת בקורמן הותיק. אשמח לקבל איזה טיפ או קצה של חוט....

הכי פשוט זה חיפושים בסגנון של str1==str2 (התאמה מלאה).... לא בטוח לגבי חיפושים חופשיים כאשר יש מרחק בין מחרוזות....
דומה ל auto complete או auto correct של גוגל....

האם אני מנסה להמציא מחדש את הגלגל? האם עדיף להשתמש בכלים קיימים או שיש הגיון בלכתוב קוד מאפס?

 

Miki Watts

New member
מה הדרישות בדיוק?

האם זה לחפש תת מחרוזות, או מחרוזות שמקורבות, או לאתר שינויים ?
עבור רוב הדברים האלה יש כבר אלגוריתמים או ספריות שנכתבו.
לדוגמה, חיפוש על "distance between sub strings" מביא את התוצאות הבאות:
https://en.wikipedia.org/wiki/Levenshtein_distance
https://en.wikipedia.org/wiki/String_metric
https://stackoverflow.com/questions...sted-fields-given-the-label/18775433#18775433
 

rontech

New member
אנחנו מפתחים פורטל

החיפוש הוא של כתבות באתר. המשתמש יוכל לחפש לפי טקסט חופשי. נדמה לי שזה נקרא שורת חיפוש או search bar.

בנוסף צריך גם לאפשר לאתר מידע לפי תפריטים.
 

Grosseto

New member
פורטל זה כל כך ניינטיז

מה השלב הבא?
אתר שמאחסן פורומים ובלוגים?
 

Grosseto

New member
ולגופו של עניין

אולי אתה צריך פקודת SQL שנקראת LIKE או פקודת REGEX במקומות אחרים
 

Han36

New member
תשתמשו בElastic Search

זו מעטפת וובית על לוסין של אפאצ'י (מנוע חיפוש).
 

user32

Well-known member
מנהל
יש כמה אפשרויות

חיפוש טקסטואלי בתוך מסמכי תוכן כפי שאתה מתאר מתאים בדרך כלל למנועי אינדוקס כמו שהזכירו כאן: Elastic Search, Lucene, Solr (כולם מבוססים על אותו מנוע מבית אפאצ'י). בגדול, זה מאפשר לך לאנדקס את המסמכים במנוע, לקנפג את סוג החיפוש שאתה רוצה (יש המון אופציות out of the box) ולמצוא מסמכים לפי דירוג (גם פה יש המון אופציות). זה די שואב השראה ממנועי חיפוש כמו גוגל.
אפשר גם לכתוב פלאגאינים עם קוד משלך ולשלב במנוע אם כי נדיר שיש צורך בכך כי הפיצ'רים המובנים מכסים כמעט כל תרחיש.
 

rontech

New member
אני רוצה להודות לכל העונים....


אני בודק כעת כמה אופציות וביניהן את השימוש באלסטיק....
 
למעלה