שנות ניסיון data scientist

עיבוד אותות הוא תת תחום ענק

זה שיש בתת תחום הרבה מאוד עבודה ובאמת יש בדיפ לרנינג הרבה עבודה לא אומרשזה כל ה-ML.
יש ML "סטנדרטי" שהוא הרבה יותר גדול מבחינת תעסוקה. אני מכיר הרבה מאוד משרות שלא עושים בהם DL אבל רושמים את זה בדרישות משרה כיתרון. אשמית כי הם רוצים הלתרחב לשם. מעשית בשביל להרגיע את האגו של המגייס שהוא גם מתעסק בדיפ לרנינג.
 

user32

Well-known member
מנהל
בדיוק

הרבה מהחברות שהזכרתי עושות ML קלאסי אבל מקוות להתרחב בעתיד לכיוון של הDL כאופציה לשיפור האלגוריתם ולהוספת יכולות. ואכן מפרסמים את זה במשרות בדרך אגב.
 

user32

Well-known member
מנהל
רק לגבי המשפט האחרון

בועות מזהים בדיעבד. אז עד שהביקוש לא ידביק את ההיצע או לחילופין עד שהבועה תתפוצץ.

הרושם שלי הוא שהבועתיות בתחום הזה דומה להייפים המוגזמים שנוצרו בעבר סביב טרנד כזה או אחר. מאפיינים:
1. ניפוח מוגזם ומצגות שווא. למשל חברה שטוענת שיכולה לזהות מתקפת סייבר כזו או אחרת על פי ניתוח דאטה כשבעצם יכולות הזיהוי הרבה יותר מנוונות ממה שמציגה. לא תמיד יש לשוק דרך לבדוק את היכולות האלו מראש.
2. הרבה יותר מדי פיתוחים מקבילים של אותו דבר. פגשתי עשרות מיזמים שטוענים שהמערכת שלהם מציגה את הפרסומות באופן הכי טוב, הכי רווחי וכו'. אין לי מושג איך כל כך הרבה חברות עושות אותו דבר.
3. ניפוח טכנולוגיות. יותר מדי פעם אתה שומע על חברות שמנופפות במודלים ואלגוריתמים שפיתחו ובסוף מגלה שמאחורי כל זה עומד חישוב סטטיסטי בנאלי. זה אולי לא deep אבל לאף אחד לא אכפת ומכבסת המילים שמה את deep learning, big data, machine learning וכמובן רשתות ניורונים בסלסלה אחת ומוכרת למשקיעים וללקוחות. למשל החברות הרבות שמציפות לאנשי מכירות לקוחות מתוך מערכות הCRM, עם כל הכבוד מדובר בקצת הסתברות ולא שום דבר מעבר.

ודבר אחרון ותקן אותי אם אני טועה: יש היום סביבות שבהן אפשר להריץ DL באופן כמעט אוטומטי. כלומר, אתה מזין את המידע והמקורות והמחשב ימצא את הקשרים. אלגוריתמאי אחד שאני עובד איתו ומעריך מאוד אמר לי בפירוש שגם מישהו עם אפס ידע יכול לבנות מודלים בעזרת כלים זמינים.
מה שאני אומר זה שלו אני סטארטאפיסט ממולח, אני מרים מערכת יפה וצבעונית שמוצאת קשרים במערכת הCRM, או באתרי חדשות או בכל שטות אחרת ומוכר סיפור על AI שפיתחתי. מה שמצחיק הוא שבהרבה מקרים זה אשכרה יעבוד.
הנה, קח למשל את הליצן התורן:
https://www.themarker.com/markerweek/1.4511218
 

user32

Well-known member
מנהל
לזכותו של הבחור בראיון

נכנסתי לאתר שלהם https://www.rootclaim.com/inside_the_calculation והם לא רק פורשים את החישוב הסטטיסטי בצורה שקופה ודי ברורה, האם אפילו לא מזכירים את המילה deep learning אצלם. אז אולי בכל זאת יש כמה הגונים שאם כבר מפתחים משהו אז מציגים אותו כמו שהוא אבל יש יותר מדי כאלה שלא. אני עדיין חושב שזה סוג של גימיק אבל ימים יגידו.
 

יבגניי34

New member
הוא אומר בראיון שהם משתמשים ברשת בייסיאנית אז הוא לא יכול

להגיד גם deep learning באותה נשימה.
 

user32

Well-known member
מנהל
נכון. זה היה ארוך מדי לקריאה מפורטת

מתנצל בפניו במקרה שהוא קורא כאן בפורום.
 

דייהטסו

New member
הם באמת לא עושים deep learning

אני דווקא די התרשמתי מהראיון, אני לא יודע כמה חידוש יש שם, אבל הגישה להחלטות שיפוטיות או איסטרטגיות מעניינת.
 

דייהטסו

New member
זה נכון

שבהייטק כל דבר הופך להייפ, העיתונאים לא מבינים ומנפחים. למעשה כמעט כל הפרנסה שלנו מתבססת על זה - אם ניקח מצב היפותטי שבו רק מספר חברות מועטות עובדות על כל תחום וברצינות, רק חלק זעיר מהמשרות בתחום יהיו נחוצות.
גם בתחום של למידה עמוקה יש הגזמה, בעיקר כשמחברים את זה לתסריטי יום הדין בסגנון טרמינטור. אבל למרות כל אלו, בתחום היתה פריצת דרך אמיתית, שאיפשרה התפתחות של תחומי מחקר וטכנולוגיה חדשים, מה שמצדיק משרות נוספות. אפקט ה"בועה" אולי מנפח קצת את המשכורות - ולמה שלא נהנה מזה לטווח הקצר לפחות?
 

user32

Well-known member
מנהל
ועל זה אמרו "נצל את הבועה"

כן בועה, לא בועה, כרגע התחום חם. מה יהיה מחר אין לדעת.

בשנה הנוכחית עבדתי עם 5 חברות קטנות (1-2 אלגוריתמאים + 1-2 מתכנתים). בחלקן האלגוריתמאים עושים עבודה פורצת דרך בעיניי על גבול הקסמים ובאחרים אני יכול לומר בבטחון שהם עושים משהו ברמה של סטטיסטיקה בתיכון אפילו שאחד מהם מחזיק בדוקטורט מסטנפורד ושני תארים מת"א בתחום. זה לא אשמתו שהוא אובר קווליפייד. החברה משלמת, הוא עושה עבודה טובה, כנראה שאני יכולתי לעשות את אותה העבודה ולזה קוראים "בועה" או "הייפ".
 

user32

Well-known member
מנהל
לא רוצה לחשוף את עצמי אז אתן דוגמא "ליד"

נגיד שיכולת לצלם את גלגל העין שלך בטלפון ואפליקציה תאבחן מחלה מסויימת בדיוק גבוה מאוד. למעשה, התוצאות שהוא נותן זהות לרופא הכי טוב בתחום. ומי שחושב שמספיק מאגר של 2000 תמונות עיניים עם סיווג "חולה" "לא חולה" אז לא, זה לא מספיק.
 
אני מכיר חברה שרשמית עושה את זה

ובאמת לא עושה כלום. קצת איסוף דטה וסטטיסטיקות ממש פשוטות.
אנחנו חיים בעולם השקר.
על זה אומרים שנס שאנחנו בעולם השקר, אם לא היינו בעולם האמת.
&nbsp
כל שאני רואה את זה יותר ויותר אני מאבד את החשק לעשות סטרטאפ. בשביל להגזים ולנפח את מה שאני עושה?
אני מוצא את עצמי נהנה הרבה יותר מלבנות אתר יחסית מורכב לאיזה חנות. לפנות אפליקציה לתנועת נוער ולפצח UX שיתאים לדור ה-W. לפתח מערכת מידע ארגונית לגוף עסקי. וזה בדיוק מה שאני עושה בימים אלו.
&nbsp
 

user32

Well-known member
מנהל
מה שנקרא המציאות עולה על כל דמיון

כי באמת שהמצאתי את הדוגמא הזאת. אבל, מסטארטאפים שאני עובד איתם האתגר הוא גם לחלץ את המידע המעניין מתוך התמונה ו/או הקול ואז להשתמש במודל בשביל להסיק מסקנות. כמו שאמרת, הרבה פעמים זה דברים שלא מסובך לעשות.
כשהמחשוב היה בראשיתו, לקחו תהליך מסויים, נגיד ניהול מחסנים, פיתחו עבורו תוכנה שכל מתכנת יכול לכתוב, קראו לזה "טכנולוגיה" והפכו לסיפור הצלחה. אז אולי היום, כשיש כלים מספיק טובים, אפשר לקחת המון תהליכים, להלביש עליהם מודלים פשוטים למדי ולנבא אירועים.

מחר מישהו יציע לקופות החולים לנבא מי צריך חיסון שפעת וכמה זה יחסוך לו במקום סתם לנסות לדחוף לכולם. אם יעטפו את זה בUX טוב ופיצ'רים מגניבים, מיתוג כמו שצריך והנה עוד סטארטאפ גאוני. כמו המקרה הידוע של קירה רדינסקי. אולי העבודה האקדמית שלה אמיתית אבל ממה שמשתקף בראיונות הרבים שהיא מעניקה, נראה שיש הרבה יותר PR מאשר טכנולוגיות פורצות דרך:
http://www.globes.co.il/news/article.aspx?did=1000869027
 
אם לא הייתי ברור אז לא התכוונתי ממש את זה

אלא מחלה אחרת על סמך מדד (יחיד) אחר. זה עובד בערך אותו דבר, כלומר פשוט לא עובד.
 
אני מכיר מקרוב סטקרטאפ

שגייסה ארבע מליון דולר על סמך הבאזוורדים של big data, NLP, ML, DL ומעשית אין שם שום דבר מאלה אלא תיוג ידני של טקסטים.
את האלגרותמיקה "אנחנו" (לא משנה מי זה אנחנו בדיוק) הכנסנו אחר כך והיא כוללת NLP חצי מנוון ואלגוריתמיקה ML סטנדטרטית בלי DL וזה ממש אל ביג דטה.
&nbsp
הם כמובן גם השתמשו בבאזוורדים דוקר, מיקרו סרביסס, CI/CD ותאמין לי שתשעים אחוז מזה היה מיותר ושרת חינמי בארוקו היה נותן עבודה טובה יותר.
 

user32

Well-known member
מנהל


 
למעלה