תוכנות בבלשנות

mochama deaf

New member
בדיוק

ספירה רק של הערך המילוני. שלא יספור את שאני כמילה נפרדת מאני. בפעלים דווקא ניתן להתגמש. אבל שיוציא אותיות קישור, יחס, ותוספות רבים, קניין וכו'.
 
כדי לבצע זאת יש צורך בשני מרכיבים

נוספים: הראשון: מנתח צורני, אשר יפיק לכל מילה את כל הניתוחים הנכונים שלה השני: מפיג עמימות מורפולוגית, אשר יבחר לכל מילה את הניתוח הנכון בהקשר מתוך הניתוחים אשר סופקו ע"י המנתח הצורני רצוי לציין כי כלים אלה אינם עובדים ב-100% הצלחה, ולפיכך יש לקחת בחשבון ולא להתייחס לתוצאות כאילו הן התקבלו מעשה ידי בלשן. הטעויות בכלי הראשון נובעות בעיקר מאי-תמיכה במילים אשר לא מופיעות בלקסיקון שלו. הטעויות בכלי השני נובעות מהטעויות של הכלי הראשון ובנוסף, מ"רעש סטטיסטי" בדוגמאות האימון אשר בסייוען הכלי מפותח. את המרכיב הראשון כבר פיתחתי בעבודת המאסטר שלי. יש אפילו הזמנה להרצאה עליו ששלחתי בפורום. המרכיב השני תלוי במידה רבה במרכיב הראשון. כלי כזה אשר מסוגל לעשות שימוש בפלט של המנתח הצורני שפיתחתי, אמור לראות אור בעוד כחודש ע"י רועי בר-חיים מהטכניון. כדאי לך לבדוק את אתר מרכז הידע לעיבוד העברית כדי לראות מתי בדיוק הוא יראה אור. לסיכום: כשגם הכלי השני יהיה זמין, ולאחר כמה בדיקות והתאמות אוכל לשכלל את הסטטיסטיקות כך שתוכל לקבל גם נתונים באופן הזה. לעת עתה, אין לי אפשרות לבצע זאת.
 
למעלה