שלום לציבור הנכבד

שלום לציבור הנכבד ../images/Emo13.gif

מזל טוב (קצת באיחור) על הקמת הפורום ושאלתי הראשונה היא: האם יש פה מישהו/י שעוסק (מתעניין) בבלשנות חישובית? מקווה להיות משתתפת פעילה למרות הבורות היחסית שלי (עדיין)
 

הכימאית

New member
כמה מלים על בלשנות חישובית

"בלשנות חישובית" היא שילוב של בלשנות עם מדעי המחשב. זהו ענף במדע העוסק בבניית תוכנות מחשב המבינות שפה טבעית (לא שפת תכנות) - בין אם מדובר בטקסט כתוב, ובין אם הכוונה לדיבור בקול. אחד השימושים הידועים יותר של הבלשנות החישובית הוא תוכנות לתרגום אוטומטי משפה לשפה. כולכם יודעים בוודאי שתוכנות כאלה מספקות בדרך כלל תרגום מלה במלה שאינו מוצלח במיוחד... יש סיפור מפורסם מאד על תוכנה שידעה לתרגם מאנגלית לרוסית ולהיפך. נתנו לה לתרגם את המשפט
The spirit is willing but the flesh is weak.​
לרוסית, ואת מה שהתקבל הזינו מחדש לתוכנה ותרגמו מחדש לשפת המקור. אלא שהתוצאה היתה:
The vodka is strong but the meat is rotten.​
לא מזמן קראתי שהסיפור הזה לא היה ולא נברא, ושזהו רק מיתוס מרושע. אך זה בכל זאת משעשע, גם אם זה לא נכון. בכל מקרה, נעשים הרבה מאמצים בשנים האחרונות בתחום זה. כמובן שקל יותר לתרגם בין שפות קרובות (למשל בין צרפתית לספרדית) מאשר בין שפות ממשפחות שונות לגמרי. כמו כן, אם מגבילים את תחום הפעולה של התוכנה למספר מצומצם של נושאים, אפשר להשיג תרגום ברמה טובה יותר: למשל (אם זכרוני אינו מטעני), קיימת תוכנת תרגום יפנית-גרמנית, שכל מטרתה היא לאפשר לדוברי השפות הללו לקבוע ביניהם מועד לפגישה עסקית. הבלשנות החישובית צריכה להתמודד לא רק עם התחביר אלא גם עם הסמנטיקה. דוגמה מפורסמת של נועם חומסקי היא המשפט
Colorless green ideas sleep furiously.​
שהוא מושלם מבחינה דקדוקית, אך אין לו שום משמעות. כיצד ניתן לגרום למחשב להבדיל בין משפט משונה שכזה לבין משפט נורמלי, כמו
Toothless brown dogs bark loudly.​
למשל? בבלשנות חישובית עברית יש גם בעיות שלא קיימות בשפות אחרות: כאשר אין ניקוד, לעיתים קרובות ניתן לקרוא צירוף אותיות מסויים בכמה דרכים. גם העובדה שמלות היחס מתחברות למלים יוצרת קושי. כיצד ידע המחשב לזהות את צירוף האותיות "שמנה", נניח? אנחנו מבינים לפי ההקשר, אך המחשב לא מבין את התוכן... איני מומחית לבלשנות חישובית, אך זה לדעתי תחום מחקר מרתק. אם מישהו יכול להמליץ על ספרים בנושא, אשמח לשמוע...
 

הכימאית

New member
מה, באמת?!

אוי ואבוי! חבל שלא הזהרת אותי מראש! הייתי משתדלת לכתוב משהו מסודר יותר...
 

הכימאית

New member
ואגב, רציתי לשאול אותך, פיה כחולה,

לפי מה נקבע סדר הופעת השרשורים? הם לא מופיעים לפי סדר כרונולוגי של פתיחת השרשור, וגם לא לפי סדר כרונולוגי של הוספת ההודעה האחרונה. אז לפי מה? (תראי אילו שאלות טפשיות מטרידות אותי...)
 
את צריכה להיות גאה במה שעשית...

הלוואי שתמשיכי לספק לנו עוד מידע נחמד כזה
-לגבי השרשורים: הדיונים כאן לפעמים, לדעתי, הם בעלי פוטנציאל כזה או אחר- אולי אני טועה ואז בשביל זה אתם כאן- לתקן אותי, ולעיתים דיון מסוים נזנח מאחור ואני חושבת להביא אותו פה לדיון ממצה יותר (שאלות שנשאלו ולא נענו...). זה הרעיון. הארת עיני בנושא שרשור שנס ליחו או שברצונכם להקפיץ אך הוא כבר עבר לדף הבא בהחלט תתקבל בברכה.
 
גם לי יש סיפור מצחיק על תוכנת תרגום

פעם אחת מנהל המלון שבו עבד אבא שלי לא שמע לעצת החשב הראשי שלו (אבא'לה) והחליט על קניה של תוכנת תרגום זולה במיוחד. ברגע האמת התוכנה עבדה בדיוק לפי הציפיות ותירגמה: "משיכת מפות" ל-"attracsion from vergina"
 

ססילי

New member
סדר הופעת השרשורים

1. הכלל הראשון והעיקרי הוא סדר כרונולוגי, של השרשור האחרון שנוספה לו הודעה. (ובכלל זה, ההודעה שפותחת את השרשור - כלומר, שרשור חדש, יופיע ראשון, עד שמישהו יוסיף הודעה לשרשור אחר) 2. סייג לכלל הראשון הוא שלא כל הודעה "מקפיצה" את השרשור לראש הדף: כדי שהודעה תקפיץ, א. צריכים להיות בתוכן שלה לפחות 10 תוים (כלומר, הודעות עם כותרת בלבד לא מקפיצות) וב. שרשור יכול לקפוץ לראש הדף רק 72 שעות (נדמה לי) לאחר פתיחתו. כך שהודעות שנוספו לשרשור בזמן מאוחר יותר לא יקפיצו אותו. 3. בזמן האחרון נוספה אפשרות למנהלי פורום, "לנעוץ" שרשורים בראש הדף כך שהכללים שפרטתי יכולו על שאר השרשורים, אבל השרשור ה"נעוץ" יופיע ראשון בכל מקרה. אני לא בטוחה אם ניתן לנעוץ שרשור יחיד או יותר, וגם לא מתי שרשור כזה מפסיק לקבל עדיפות (האם אוטומטית לאחר זמן קצוב, או שבעקבות פעולה אקטיבית של מנהל הפורום).
 
בלשנות חישובית

מאמר יפה הסוקר בלשנות חישובית עברית נכתב ע"י הד"ר שולי וינטנר מאוניברסיטת חיפה: Shuly Wintner. Hebrew computational linguistics: Past and future. In Shlomo Izre'el, editor, Speaking Hebrew: Studies in Spoken Language and in Linguistic Variation in Israel, volume XVIII of Te'uda, the Yearbook of the Rosenberg School of Jewish Studies at Tel-Aviv University, 2002. (In Hebrew) אותו המאמר באנגלית: Shuly Wintner. Hebrew computational linguistics: Past and future. Artificial Intelligence Review, accepted for publication, 2003. אנסה להעלות את המאמר בעברית, אם אמצא אותו. וודאי תשמחו לדעת כי ישנו מרכז ידע במימון משרד המדע אשר מרכז מחקרים ותוצרי מחקרים בעיבוד שפה טבעית בעברית. הנה כתובת האתר, אשר לצערי מכיל מעט מאד תכנים: http://mila.cs.technion.ac.il שני ספרי מבוא חביבים ומועילים לתחום עיבוד שפות טבעיות (עיקר המחקר נעשה על אנגלית ולכן הספרים בעיקר מביאים דוגמות מהשפה האנגלית): Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition by Daniel Jurafsky , James H. Martin וכמובן, Foundations of Statistical Natural Language Processing by Christopher D. Manning, Hinrich Schtze תחום המחקר רחב מאד ומכיל תתי תחומים רבים. ישנם כנסים רבים המתקיימים בעולם (גם בארץ) וכן כתבי עת בנושא. אשמח לפרט אם יהיה עניין.
 
למעלה