אינדוקס קבצי XML
יש לי מערכת שאמורה לאפשר למשתמשים להעלאות מסמכים בפורמט XML (מסמכי אופן אופיס או WORD בפורמט XML). המערכת שלי מחלקת את המסמך לכמה תתי מסמכים לפי לוגיקה מסויימת ואמורה לשמור את הכל על שרת או DB. בסופו של דבר אני רוצה לאפשר למשתמשים לעשות חיפוש free text ולמצוא את כל המסמכים שמופיעים בהם מילה מסויימת לא משנה באיזה תאג בXML. השאלה: איך לשמור ולאנדקס את קבצי הXML? ניסיתי מוצרי קוד פתוח שמתיימרים להיות "XML Database" אבל כולם נכשלו בחיפוש החופשי שלקח דקות ארוכות גם כשמדובר במספר לא גדול של מידע (כמה מגה בייטים ספורים). ניכר בעליל שהם לא ממש מאנדקסים את הטקסט אלא בזמן חיפוש פשוט טוענים כל קובץ לDOM ועושים חיפוש xPath שכמובן לוקח הרבה זמן בחיפוש חופשי. תוכנות ייעודיות כמו CMS למיניהן (ניהול תוכן) הן יקרות מה שלא יתאפשר לי מבחינת המחיר. האפשרות שעוד לא ניסיתי זה שמירה בתוך בסיס נתונים רלציוני כמו אורקל או SQL Server. אני יודע שיש תמיכה בXML השאלה אם זה יתאים לצרכים שלי: שמירה של מספר גדול של מסמכים וביצוע חיפושים?
יש לי מערכת שאמורה לאפשר למשתמשים להעלאות מסמכים בפורמט XML (מסמכי אופן אופיס או WORD בפורמט XML). המערכת שלי מחלקת את המסמך לכמה תתי מסמכים לפי לוגיקה מסויימת ואמורה לשמור את הכל על שרת או DB. בסופו של דבר אני רוצה לאפשר למשתמשים לעשות חיפוש free text ולמצוא את כל המסמכים שמופיעים בהם מילה מסויימת לא משנה באיזה תאג בXML. השאלה: איך לשמור ולאנדקס את קבצי הXML? ניסיתי מוצרי קוד פתוח שמתיימרים להיות "XML Database" אבל כולם נכשלו בחיפוש החופשי שלקח דקות ארוכות גם כשמדובר במספר לא גדול של מידע (כמה מגה בייטים ספורים). ניכר בעליל שהם לא ממש מאנדקסים את הטקסט אלא בזמן חיפוש פשוט טוענים כל קובץ לDOM ועושים חיפוש xPath שכמובן לוקח הרבה זמן בחיפוש חופשי. תוכנות ייעודיות כמו CMS למיניהן (ניהול תוכן) הן יקרות מה שלא יתאפשר לי מבחינת המחיר. האפשרות שעוד לא ניסיתי זה שמירה בתוך בסיס נתונים רלציוני כמו אורקל או SQL Server. אני יודע שיש תמיכה בXML השאלה אם זה יתאים לצרכים שלי: שמירה של מספר גדול של מסמכים וביצוע חיפושים?