פרוייקט ב-Data Mining

fatnoam

Active member
פרוייקט ב-Data Mining

*מנהלים אני אשמח אם אפשר יהיה לנעוץ את הדיון הזה, שלא ייבלע בכל "קשקושי" הפלייאוף.

חברי פורום יקרים,
אני עושה פרוייקט ללימודים בנושא של Data Mining. למי שלא מכיר את התחום, מדובר על מעבר על קבצי נתונים עצומים, והוצאת תובנות מהם.
בכל אופן, אני החלטתי לעשות על נושא ה-NBA.
דוגמאות אפשריות לפרוייקטים -
לעבור על הסטטיסטיקות של כל הקבוצות שלקחו אליפויות ולמצוא מכנה משותף סטטיסטי.
לעבור על הסטטיסטיקות של כל השחקנים מעונות מסוימות, ולהמציא מדד יעילות חדש כמו PER או WP.
לעבור על הסטטיסטיקות של כל השחקנים ב-15 שנה האחרונות, ולנסות למצוא קשר סיבתי בין נתונים פיזיים (גיל, משקל, גובה), לסטטיסטיקות נמדדות (אסיסטים ריבאונדים וכו').

אלה פחות או יותר הרעיונות שהיו לי. המטרה של הפרוייקט היא לקחת גוש נתונים ענקי, להגדיר Attributes (לדוגמא, נקודות למשחק, גיל השחקן, גובה וכו'), ולנסח משוואה שתתן לנו Y מסויים.

האם מישהו רצה לחקור כאן איזה נושא שלדעתו מעניין? האם למישהו יש רעיון? האם מישהו ניסה להסביר פעם תופעה במגרשים באמצעות סטטיסטיקות ולא הצליח?

אני מקווה שתציפו רעיונות, ויהיה לי רעיון לפרוייקט שלי. את התוצאות והתובנות אדביק בפורום כשאסיים כמובן.

תודה מראש!
נעם.
 

Executioner

New member
יש שאלה אחת שמעניינת אותי

מה העמדה החשובה ביותר בNBA, ז"א אם אני בונה קבוצה, איזו עמדה חשוב לאייש עם שחקן בקאליבר גבוה. חשיבות יכולה להמדד לפי מדדי יעילות למיניהן בקבוצות פלייאוף.
 

Lechoke Lames

New member
עמדות זה אחד הדברים הכי פחות מוגדרים בכדורסל

מה למשל הופך שחקן ל-SG? זה שהוא השני בגובהו בקבוצה, שומר על השחקן השני בגובהו בקבוצה היריבה, לא מחזיק את הכדור בתחילת התקפה וזורק בעיקר מחוץ לצבע? כי מלבד נושא הגובה, שחקנים גבוהים כמו סטיב נובאק וצ'נינג פריי הם יותר SG משחקנים כמו דווין וויד או טייריק אוונס.

תזכורת לדברים שג'יילן רוז אמר פעם לגבי עמדות בכדורסל:

http://www.youtube.com/watch?v=B5GQLPVOGs0&feature=player_detailpage#t=21s

אני בהחלט מסכים איתו.
 

Executioner

New member
כולם יודעים שג'ורדן וקובי הם SG

ושהאקים, שאקיל וקארים הם סנטרים. מעטים השחקנים שאי אפשר לקטרג לפי עמדה. ולמה שג'יילן אמר, רכז לא תמיד מרכז וסנטר לא תמיד לוקח ריבאונד. לדעתי עמדות מתחלקות יותר לפי מבנה גוף ויכולת פיזית מאשר ליכולות של השחקן בתור כדורסלן.
אם אתה בוחר להסתכל על נושא מנק' מבט אחת אז אתה יכול להסכים אבל אתה לא יכול לבטל נק' מבט אחרות.
 

Lechoke Lames

New member
מסכים שנתונים פיזיים הם המדד העקרי.

מה בדיוק הופך את ג'ורדן וקובי ל-SG ולא ל-SF? כנראה העובדה שהם היו ברוב המקרים השחקנים השניים בגובהם בקבוצה שלהם, ושמרו ברוב השנים על השחקנים השניים בגובהם בקבוצה היריבה. זה הכל.

מה שג'יילן אמר זה לא שאי אפשר לקטרג לפי עמדה, אלא שכל הרעיון הזה נוצר כדי לעזור לאדם הפשוט לעקוב אחרי המשחק. המשמעות לגבי השחקנים בפועל מוגבלת מאוד. גארדים בעלי יכולת קליעה חלשה מבחוץ אבל חדירה טובה יינצלו את מה שהם טובים בו, וכנ"ל שחקנים גבוהים עם קליעה טובה מבחוץ.
 

Executioner

New member
אם מה שג'יילן רוז אמר היה קונצנזוס

אז אולי הייתי מסכים. אבל זה לא. וגם מה שאתה כותב לא בדיוק נכון. כריס בוש או האסלם פותחים ב5 ואף אחד לא יגיד שהם סנטרים.
יכול להיות שאני טועה ואתה צודק וג'ורדן היהSG כי פיפן היה SF אבל מג'יק היה PG וביירון סקוט היה SG.
היום יש גם קומבו גארדים ופורווארד-סנטר. העמדות משתנות עם המשחק ולכן אני לא חושב שזה פשוט כמו שג'יילן רוז אומר.

מה שאני בטוח לגביו, זה שהנושא לא שחור ולבן. אני חושב שהנושא הזה עמוק יותר ושווה דיון משל עצמו. תרים את הכפפה.
 

fatnoam

Active member
שאלות המשך

דבר ראשון יופי של הצעה.

לעניין -
אתה חושב שצריך לעבור רק על אלופות \ פיינליסטיות \ קבוצות פלייאוף בשנים האחרונות (נגיד 15 שנה), ולבדוק מי היה השחקן הדומיננטי? איך בודקים מי היה השחקן המוביל? סקורינג? מדד PER או EFF? אולי +\-?

אבל יופי של רעיון. אהבתי את הכיוון, ואם אתה או מישהו אחר יכול להוסיף רעיונות זה יהיה נהדר.
 

Executioner

New member
תשובות

לדעתי לפחות אפשר להתייחס רק לפיינליסטיות במערב ובמזרח.
אני לא בטוח איזה מהמדדים הוא זה שמודד שורה סטטיסטית רחבה אבל לדעתי זה המדד הטוב ביותר למדוד יעילות. אם יש לך דרך לשלב את המדדים האלה אולי זו התשובה.


אגב יש הרבה מאוד סטט' בבייסבול שעוזרות למאמן לבנות קבוצה או להרכיב את השחקנים הטובים ביותר. אני לא מבין בבייסבול אבל אולי כדי לך לחקור את הנושא ותמצא משהו מבייסבול שתוכל ליישם בכדורסל.
 

Lechoke Lames

New member
מדד דמויי PER שמודד יכולות של שחקן בהגנה

PER ממוקד ביכולת התקפיות וזה רק חצי מהתמונה.
 

fatnoam

Active member
רעיון יפה אבל יש לי שאלה

1.מהם המדדים ההגנתיים? ריבאונד זה הגנתי?
2. איפה אני משיג מדדים מתקדמים (לדוגמא שינויי זריקות או כמה קלע השחקן ששמרתי עליו), פרקטית אני לא מכיר אתר עם הנתונים האלה.
3. PER הוא יחסי, לקצב המשחק, לכמות הפוזשנים בקבוצה, לסטטיסטיקות של הקבוצה כולה והמיקום שלה בליגה בסטטיסטיקות אלה. איך אתה מציע לעשות את זה עבור מדדים הגנתיים?

צריך לפתח את הכיוון הזה. הוא כיוון טוב.
 

Lechoke Lames

New member
תשובות

1. ריבאונד הגנה הוא בהחלט מדד הגנתי. יש מספר מדדים הגנתיים. ראה למשל מדדים כגון DRtg, DWS, DRB%‎, BLK%‎ ו-STL%‎ בלינק הבא:
http://www.basketball-reference.com/about/glossary.html
2. אתרים כגון basketball-reference.com, hoopdata.com ו-82games.com הם התחלה טובה
3. אין לי רעיונות. כאן אתה נכנס
 

billc

New member
אני בעד שפלייאוף יהיה נושא המרכזי בפלייאוף

 

billc

New member
קח את היום הזה, אתמול היה יום פלייאוף גרוע

אפשר לנצל את היום הזה לדבר על נושאים אחרים כידי להשכיח את הזוועה של אתמול
 

yoavj1

New member
כמה רעיונות

- מהן השנים הטובות של שחקנים (לפי גיל/ותק בליגה, ואולי לפי עמדות)
- קבוצות/מאמנים/שחקנים שגורמים לשחקנים אחרים לפרוח
- השפעות של פציעות רציניות (נגיד השבתה של עונה) על המשך הקריירה של שחקנים
- שינויים בסטטיסטיקות בליגה לאורך השנים - האם אחוזי השדה משתנים, נקודות, וכו
 
יד חמה

לא יודע אם יש לך את הרמה הזו של המידע, במיוחד שצריך לקחת בחשבון גם את איכות הזריקה, אבל זה הנושא:
במשחקים רבים מועברת תחושה מאד חזקה שיש כזה דבר שנקרא "יד חמה" (אני גם מרגיש את זה לגבי זריקות שלי עצמי). הקונספט הופרך בכל מיני מאמרים, אבל לפי מה שקראתי הגעתי למסקנה שהם פירשו את המונח בצורה לא נכונה.
הרעיון הוא לא שאם שחקן קלע שתי זריקות צריך לבדוק אם יש יותר סיכוי שהוא יקלע את השלישית, אלא ששחקנים מסויימים נכנסים ל"זון", והזריקות שלהם מכל הטווחים משתפרים בצורה ניכרת.
בשביל לבדוק את הנושא, צריך לזהות מתי שחקן נכנס לזון, שזה קצת קשה להגדיר. אולי משהו כמו, 4-5 זריקות רצופות, או 8 זריקות עם החטאה בלבד, כאשר מתוכן רוב הזריקות היו פתוחות ממרחק, אך גם מעט זריקות קשות שצללו פנימה.
אחרי שקובעים קריטריון צריך לבדוק איך השחקן מתפקד בהמשך המשחק, או לפחות עד המחצית או הפסקה ארוכה אחרת.
הבעייתיות רק מתחדדת כשיש חשש שההגדרה של שחקן בזון כבר תסמן את המטרה, אז צריך לחשוב על זה. לדעתי זה נושא מאד מעניין, וכצופה קבוע במשחקים מעניין אותי לדעת אם יש סטטיסטיקה שתומכת במונח ה"יד החמה".
 
למעלה