הטור של מל למוצאי שבת: הדראפט של 2017 (מבחינה סטטיסטית)

ביליתי ארבעה ימים במרומי ההרים של מדינת וירג'יניה בשמורה אינדיאנית כשאנחנו ישנים בבונגלו על  מחצלות ואוכלים אוכל אינדיאני (שלא נדע! אבל לאניני הטעם היה  תפריט אמריקאי) ומקשיבים לצי'ף אינדיאני זקן, כוהנים למיניהם, רופאי אליל, ועוד כמה מכשפים, אבל הדגש הוא על מדיטציה לאור אש המדורה המפזרת ריחות לענה וקריז , ובקרע קולות אופל קודרים שמטרתם להעצים את הקדרות והצלמוות בזמן שהאמת ניגלית לפנינו בכל מערומיה.

התענוג עולה $370 ליום לזוג, אבל מה לא עושים כדי לגלות את האמת?

בערב הדראפט נמאס לי מכל האינדיאנים והשמורה שלהם, ונסעתי עם גייל וזוג חברים ל-GOLF RESORT חצי שעה מהשמורה לחזות בסיבוב הראשון וחצי של הדראפט. עקבתי באדיקות בדראפט שהפתיע אותי מעט פה ושם, אבל הוא היה צפוי כמעט לחלוטין ב-7-8 הבחירות הראשונות, אבם אילו הייתי פילדלפיה הייתי בוחר אחרת, ואילו הייתי בוסטון לא הייתי מעביר את הבחירה הראשונה שלי לפילדלפיה, אבל אחרי שההחלפה נעשתה, בוסטון עדיין היתה יכולה לסיים כמנצחת הגדולה בגלל בחירתה של פילדלפיה.

מחר אחזור לבחירות עצמן.  קודם כמה מילים על כל העסק הזה הנקרא דראפט מבחינת יכולת נבוי סטטיסטית.

ישנם דראפטים בהם אין שאלה מי יהיה  כוכב גדול ב-NBA. כשווילט צ'מברליין ניבחר ראשון, לא היתה כלל שאלה. כשקרים עבדול ג'אבר ניבחר (כשהיה עדיין לו אלסינדור) לא היתה שאלה. כששאקיל או'ניל ניבחר לא היתה שאלה. כשמג'יק נבחר לא היתה שאלה. כשלברון ג'יימס ניבחר לא היתה שאלה. כולם ניבחרו ראשונים והבחירה שלהם היתה ידועה, אוטומטית ממש, ונכונה.  ההבדל ביכולתם (וב'יכולת' אני כולל גם ממדי גוף) לבין הבאים אחריהם היתה נחרצת, מוחלטת, ולא נתונה לספק.

הם נמצאים כל כך רחוק בקו הריגרסיה שעוד מעט נדבר עליו, שאיתם אין סכוי ל- FALSE POSITIVE (בחירה שאתה בטוח שתצליח, והיא ניכשלת).

אין לנו מספיק ידע על היחסים שבין מיקום השחקנים בדראפטים למיניהם משך השנים לבין "הצלחת" השחקנים בקריירה שלהם ב-NBA? אנחנו אפילו לא יודעים אם היחס בין מקום הבחירה ו'הצלחה' בליגה הוא ליניארי (קו ישר) או CURVY-LINEAR. אנחנו יודעים על מקרים בודדים  של כשלון מחלט של בחירות גבוהות, או הצלחות של בחירות נמוכות, אבל מה היא הקורלציה בין הדראפט וה"הצלחה" ב-NBA?

 

ישנם מאמרים בודדים בנושא מהסוג של

http://www.worldcat.org/title/study-on-the-relationship-between-draft-position-and-success-in-the-nba/oclc/54476217

אבל המאמר הטוב ביותר בנושא הוא:

http://www.82games.com/barzilai1.htm

בו החוקר מנסה לקבוע יחסים בין מיקום בדראפט והצלחה ב-NBA אבל מסקנתו היא שמיקום בדראפט הוא לא יותר מאינדיקציה על יכולת, ולא יותר. אגב, מחקרויו מראים שהיחסים בין הדראפט והצלחה ב-NBA הם לא קווים ליניארים אלא קשתיים.

מסקנתו הראשית?

While these estimates can be a valuable tool for general managers in evaluating trade proposals that include draft picks, like all basketball analytics it cannot establish with certainty the value of those picks

מאמר מעניין אחר הוא של סטודנט שעשה עבודת SENIOR THESIS בבארקי בנושא:

https://www.econ.berkeley.edu/sites/default/files/AdhirajWatave_Thesis.pdf

לאלה שלא למדו סטטיסטיקה, מתאם או קורלציה הוא מדד סטטיסטי המעריך את העקביות ביחסים בין כמה משתנים, כלומר, האם ישנה עקביות בין שינוי במשתנה אחד מהם לבין שינוי במשתנה אחר. כאשר המתאם מלמד התאמה גבוהה ביחסים בין המשתנים לעתים הדבר רומז גם על קשר של סיבתיות אך לא בהכרח (למיקום השחקן בדראפט אין כל השפעה על טיב משחקו. אבל אם עושים מתאם בין גובה למשקל, לגובה ישנה ה-ש-פ-ע-ה על המשקל).

ערכו של מתאם המבטא התאמה מוחלטת הוא 1.0+, ושל מתאם המבטא התאמה הפוכה 1.0-.

ז"א, ברור שמיקום בדראפט לא גורם להצלחה אבל הוא מראה על קשר, על עקביות מסויימת בין המשתנה הבלתי תלוי (INDEPENDENT) שהוא המיקום בדראפט, לבין המשתנה התלוי (DEPENDENT VARIABLE) שהוא ההצלחה הכדורסלנית של השחקן נניח 7 שנים אחרי הדראפט. כדיי שהקשר בין הדראפט והצלחה עתידית  יהיה הגיוני, עלינו להחליט שבחירות הדראפט של 60 השחקנים  מ-1 עד 60 לפי יכולתם בכדורסל לפני הדראפט שנקבעה ע"י מומחי הקבוצה הבוחרת הן "נכונות", וכך "מיקום הבחירה בדראפט" הוא המשתנה הבלתי תלוי. ז"א הניבחר ראשון הוא 'הטוב ביותר'. השני אחריו הוא 'השני בטיבו', וכו'.היכולת של השחקנים אחרי, נניח, 7 שנים, הוא המשתנה 'התלוי'. אם המתאם מושלם (r=1.0) השחקן שניבחר ראשון יהיה הטוב ביותר מבין ה-60 וזה שניבחר אחרון (r=-1.0) יהיה הגרוע ביותר.

הנה דוגמא גראפית של r= – 0.87. על קו ה-X המאוזן נמצאים הנבחרים מ-1 עד 60 ובקו ה-Y האנכי הוא הציון  ב"בצלחה" שכל שחקן ניבחר זכה בו אחרי 7 שנות משחק. מנכ"לי ה-NBA היו נותנים את יד ימינם עבור יכולת דיוק כזאת בדראפט. האחד שהוא העליון מכולם, לבדו עומד היכן שקווי ה-X וה-Y נפגשים למעלה בצד שמאל הוא הלברון ג'יימס. הוא הקרים עבדול ג'אבר. הוא השקיל או'ניל. איתו לעולם לא תטעה כי אין לו כל FALSE POSITIVE ב-REGRESSION BELT ('חגורת השחקנים' אחרי 7 שנים).

אם חגורת הרגרסיה היתה כמו בדיאגרמה שלמעלה, הדראפט היה קל ופשוט.

דרך אחרת להסביר את המתאם היא להכפילו בריבוע. אם המתאם בין בחירות הדראפט והצלחה ב-NBA הוא 0.87-, הרי שבריבוע אתה מקבל 75%. זה אחוז הדיוק שיש לך מנבואת הצלחה עתידית לפי המיקום בבחירת הדראפט, נגד נבואה שרירותית. זה אחוז כלל לא רע. הצרה היא שהמתאם בין הדראפט להצלחה ב-NBA לא מתקרב ל-r= – 0.87

זוהי לפחות דעתי, מבלי שיהיו לי הוכחות מדעיות שלא מצאתי. לדעתי הבעייה של הדראפט היא שקו הריגרסיה האמיתי יותר הוא משהו מהסוג הזה כשהמתאם r= -0.54

כאן ה-r=-0.54 והקיצוני הימני למעלה הוא מאנו ג'ינובלי,שניבחר איפה דשהוא בסוף הסיבוב השני. השמאלי הראשון בקו המאוזן ל6.0 הוא מין אנטוני בנט. העליונים משמאל הם קרים עבדול ג'אבר ולברון.

מה אומר מתאם של, למשל, r=.8? תלוי בחשיבות הקשר בין המשתנה הבלתי תלוי והתלוי. אוניברסיטת הארווארד (ואני משער שבקבלת חניכים להיות טייסי קרב בחיל האוויר שלנו הסלקציה די דומה) מחפשת מתאם גבוה בין כל המשתנים הבלתי תלויים שהיא משתמשת בהם לקבלה (SAT, ציוני גמר, מיקום בכיתה המסיימת, ועוד ועוד) לבין הצלחה בלימודים באוניברסיטה, אבל בגלל שחתך הקבלה שלה על קו ה-X הוא כה גבוה, היא לא חייבת לדאוג שהמתאם בין X ל-Y יהיה גבוה במיוחד: מאחר והיא מקבלת רק סטודנטים עם SAT של 1,600 (שהוא המקס. שהיה פעם), הקורלציה שלהם לא חייבת לשאוף ל-1.0+ כי החתך של אלה שמתקבלים הוא כה גבוה והם כמעט לא עושים שגיאות של FALSE POSITIVE או FALSE NEGATIVE. (ובגראף עם r=-0.54" 'הקליעה' בבחירה בהסתמך על ידע מוקדם היא רק 25% מדוייקת יותר מסתם ניחוש)

אוניברסיטת הארווארד יודעת שקשה לנבא הצלחה לפי ציונים בתיכון ואפילו SAT, אלא אם כן הולכים לקיצוניות מחלטת. תכפילו את שורת ה-X ב-100, ואלה בקשות להרווארד עם SAT של 1300, 1400, 1500, 1600 ו-1700 (אם הוא המקסימום). הארווארד יודעת שהיא תקבל 7,000 בקשות כניסה מתלמידיםם עם SAT של 1,700 אז היא קובעת 1680 כמינימום הנידרש לכניסה לאוניברסיטה והיא כמעט אף פעם לא תשגה כי לא יהיו לה FALSEE NEGATIVES. אם נניח ש"הצלחה" בהרווארד היא ציון "70" אז במקרה הזה יהיה לה כנראה סטודנט אחד עם FALSE NEGATIVE שלא התקבל, אבל אילו התקבל היה  מצליח (הרביעי בגובהו שבא עם SAT שנראה לי כמו 1570 והיה נידחה, אבל לו התקבל היה מסיים עם ציון ממוצע של 72 או משהו כזה.\

ישנה עוד בעייה שלמיטב ידיעתי לא נחקרה, והיא אם המתאם בין ה'דראפט' ל'הצלחה' הוא קו ישר (ליניארי) או קו שהוא CURVY-LINEAR כמו בגראף הזה. הCURVY-LINEAR יכול להיות גיל, משחק בקבוצה מפסידנית כרונית כמו הקליפרס, או שחקן שיש לו בחשבון הבנק 100 מיליון והוא איבד את המוטיבציה. גם פציעות תשננה את הקו כמובן.

: ישנן כמה דוגמאות להסביר את היכולת הבינונית לנבא יכולת לפי מיקום בדראפט.היודעים אתם שרק 4 נבחרים ראשונים מאז תחילת הלוטרי ב-1985 זכו באליפות NBA בקבוצה שבחרה בהם? (דייויד רובינסון, טים דנקן, לברון ג'יימס וקיירי אירוינג)?

כנראה שהבעייה היא שישנו יותר מדי "ליכלוך" (חוסר דיוק) גם במשתנה ה-INDEPENDENT (המיקום בדראפט) וגם במשתנה ה-DEPENDENT ("הצלחה ב-NBA"). "הליכלוך" במשתנה הלא תלוי הוא יכולת הבוחרים לבחור את השחקנים בסדר הנכון לפי "טיבם" (אבל כמובן שגורם "צורך הקבוצה" הוא כבר גורם ל'לכלוך'). "הליכלוך" במשתנה התלוי ("הצלחה ב-NBA) הוא תוצאה של משחק עם שחקנים אלה ולא אחרים (בקבוצה X ולא בקבוצה Y), צורךך הקבוצה המיוחד, השפעת מאמן, הימצאות בדיביזיה זו ולא אחרת, מזל, והדבר החשוב ביותר – חוסר היכולת המדוייקת לדרג "יכולת". כיצד לתת מספר סופיי לשחקן על "יכולת" כשיש PER, "תרומה לנצחונות" , יעילות הנה, יעילות התקפה, ועוד ועוד? אולי בגלל כל הקשיים  אלה אין לנו ידע ברור על "יעילות" הדראפט, וכל הבירבורים והמסקנות על "טיב הבחירה" של הקבוצה הזאת או האחרת אינם יותר מדעות, סברות, השערות, אמונות, ובעיקר ניחושים המבוססים על הכרה, חשיבה, והרגשה.

ישנם גולשים באתר שלא מנחשים ולא סבורים אלא י-ו-ד-ע-י-ם, ו-ק-ו-ב-ע-י-ם מי בחר נכון ומי לא, אבל לא נזכיר אותם בשמם. ישנם מספיק שחקנים מהסוג של קאווי לינארד או סטפן קרי שכששיחקו בתיכון או בקולג' טובי המוחות הכדורסלנים בעולם והמיכשור המודרני ביותר עם הסינמטוגרפיה של נ.א.ס.אא לא יכולים היו לנחש מה יתפתח מהם. קשה ביותר לנבא מי יהפוך להיות כוכב NBA ומי לא.

מחר אכתוב על שחקן אחד במיוחד בדראפט שפילדלפיה ובוסטון פיספסו עליו! (מאחר ואין דרך מדעית ומדוייקת לנבא, זוהי דעתי, ולא יותר)

 

מנחם לס

הזקו והוותיק מכולם בצוות. מנסה לכתוב יומית - כל זמן שאוכל!

לפוסט הזה יש 38 תגובות

  1. מאוד מעניין. אני חושב שפה יש יותר ממתאם סטטיסטי, כי יש גם את האישיות של השחקן וכמה הסביבה שלו מותאמת אליו והוא מתאים לה. בכל מקרה, חומר למחשבה

  2. מנחם תודה על הכתבה. די מפתיע שאף אחד לא עשה על זה מחקר רציני לאור כל סכומי הכסף והמשמעות שמעורבת בעניין. אם רוצים לבדוק את זה בקלות יחסית ( מישהו יותר נמרץ ממני פה מהאתר ) יכול לבדוק את המתאם בין גובה הבחירה בדראפט להפיכה של שחקן לאול סטאר. זה פרמטר לא מדעי אבל דוקא בגלל שבאן בי אי המוסד הזה קיים והוא כן מבטא סקר שנתי של דעת ההמון זה יכול להיות מעניין.

      1. תוצאות המתאם כמובן שהן מדוייקות. הבעייה היא שהמשתנה העצמאי (INDEPENDENT VARIABLE; במקרה שלנו סדר בחירות הדראפט) הוא טוב רק כפי שהבוחרים צדקו בסדר הבחירות

    1. יש לא מעט סקרים ומחקרים על בחירות הדרפאט בענפים השונים
      מאז שנות ה 80 לא היה מחזור שכל הבחירות 1 עד 5 היו אולסטארים
      תמיד יש איזה באסט או רול פלייר בבחירה טופ 5
      פעם בכמה שנים נופל לך פרנצייז פלייר כמו שאק , מג'יק , לברון או דאנקן
      צריך להבין שמתוך 30 בחירות דרפאט בסיבוב הראשון בערך 10 שחקנים יוצאים עם קריירה לגיטימית
      פה ושם מתחבא איזה דרימונד גרין או קוואי שלא לדבר על הגריק פריק
      גם בדראפט הזה כמו בכל דראפט יהיו אול סטארים ,באסטים ורול פליירס לרוב עם קורלציה לבחירה
      ( בדרך כלל שחקני עשירה ראשונה ומטה אין ציפיות לקבל אול סטאר אלא יותר רול פלייר )

        1. מענין אם ג׳ורדן לא היה נבחר אחריו, מה היה גודל האכזבה ממנו, בסך הכל אני חושב שהפציעה גמרה אותו, אחרת יכל לגדול לשחקן מצוין.
          מה בעצם ההגדרה של באסט והאם פציעה נחשבת?

    2. מההיכרות שלי עם תחום הסקרים והסטטיסטיקה יש סיכוי טוב שחלק לא מבוטל מהקבוצות מימנו מחקר כזה ואינן מפרסמות אותו

    3. לא כל כך מפתיע שאין מחקר, כי ברגע ששחקן נבחר זה כבר פחות מעניין לנבא לאן יגיע.
      הכסף הגדול זה לנבא מי יצליח ובתור מה ובאיזו סביבה לפני הבחירה.

  3. אפרופו הסיבתיות הסטטיסטית, קראתי כתבה על הדראפט שבה ניתחו והראו גם שככל שהבחירה גבוהה יותר כך השחקן זוכה לדקות רבות יותר ומוקדם יותר (סך הכול הגיוני). מראה שהשחקנים שנבחרים גבוה לא רק מוכשרים יותר (על הנייר), אלא גם זוכים להרבה יותר קרדיט והזדמנויות מהקבוצות שלהם כדי להצליח ולפרוץ. יכול להסביר חלק מהמתאם.

      1. בנושא החוזה של מוזגוב וכמה הוא עלה להם, באיזה נושא כבר יכול להיות?
        מעניין מה יצטרכו למכור בשביל החוזה של דנג

        1. גם לדעתי זה מכיר גדול אבל זה שיקול שאני יכול להבין אותו בגלל שהם רוצים שלונזו בול יוביל אותם וביחד זה בעייתי מדי עם 3 בחירות מספר 2 מתוכם 2 רכזים. לי כואב על ראסל…

  4. תודה מנחם על המידע המרתק וברוך שובך לציביליזציה 🙂

    פגעת בול, כי באמת יש עניין של היזדמנות. האם לשחקן שנבחר גבוה יותר אין סיכוי גבוה יותר לקבל תפקיד חשוב בקבוצה פחות טובה מאשר נגיד לנחר 30. בדראפט שמלא בטריידים זה גם פחות קורה.

    מה נחשב בחירה של קבוצה?. זו שבחרה או זו שהפרוספקט החל את שנת הרוקי שלו בה? האם למשל הקבוצה בחרה לפי צורך בעמדה מסויימת או לפי מי שנחשב הטוב בתפקידו?

    בסוף הדרך האמיתית שלי להעריך זה פשוט לצפות בשחקן ולדמיין את התפקיד שיעשה בקבוצתו החדשה. וגם אז מי אמר שזה התפקיד שמיועד לאותו שחקן על ידי המאמן… ומי אמר שהשחקן יעמוד בלחץ ושהחברים שלו יסמכו עליו ויסמכו עליו.

    מנחם אתה צפית במריו חזוניה בלא מעט הזדמנויות. הוא באמת פחות כישרוני מהבינוניות שמשחקת באורלנדו? אתה מדמיין מה היה הופך בספרס? ארון גורדון המסכן היה צריך לשחק בעמדה 3 כשחקן חוץ בגלל שהארגון המוזר שלו לא ידע עם מי לצוות אותו או מה לעשות איתו. אולי אורלנדו בוחרת 'רע' או שאורלנדו בוחרת שחקנים בעמדות שהיא לא צריכה ומייעדת להם תפקידים לא מתאימים ובלי קשר לא מפתחת אותם כמו קבוצ7ת אחרות.

    1. ג'ון, ישנם כאן יותר מדי משתנים המשפיעים גם על ה-INDEPENDENT VARIABLE (מיקום בדראפט) וגם ב-DEPENDENT VARIABLE (""טיב השחקן"). וואללה שהרגע עלה לי בראש רעיון. אכתוב עליו למחר.
      בקשר למריו חזוניה, למעשה לא ראיתי אותו אף פעם מלבד בטיווי. הרגשתי האישית היא שהוא יותר מדי FLASHY מהסוג של ג'ייסון ויליאמס, מבלי להיות שחקן כדורסל טוב כג'ייסון ויליאמס.

  5. מנחם. ישנה בעיה שלא נחקרה…… לדעתי אתה מתכוון לניתוח רב גורמי. ישנן מתודות כמו ; רגרסיה רבת משתנים, ניתוח אשכולות, ניתוח גורמים…
    הקושי במודלים מורכבים הוא הסבר של האומדן המתקבל וגם קידוד משתנים איכותיים.

  6. תודה רבה מנחם. מעניין מאוד.
    אני מניח שיש מחקרים רבים ויסודיים על הניבוי בדראפט, הם פשוט נעשים על ידי הקבוצות ולא מפורסמים.
    הייתי נותן הרבה כדי לפתוח את הפולדר הרלבנטי ברשת של הספרס, לדוגמא, ולהבין מה הם מודדים ואיך הם ממדלים. לא אתפלא אם יש שם חוקרים שהיו נחשבים ברמה עולמית או לפחות לאומית, אם רק היו מפרסמים את המחקרים שלהם. גיבורים אלמונים 🙂

  7. וואי וואי וואי….
    נראה לי אני היחיד שדילג על חצי מהטור כי זה היה קריא בערך כמו רומנית מצויה עם הגיה שבדית…
    יותר מדי חכמים במקום אחד….
    נוצרו לי בעיות דימוי…

  8. תודה מנחם.
    נקודה אחת למחשבה.
    ראיתי מישהו שכתב (לא זוכר איפה ייתכן בישראל היום ).
    כי הרבה פעמים המנצחות. ..מנצחות והמפסידות מפסידות.
    רצה לומר.
    כשאתה חושב כמו מנצח …אז תדע להיות מנצח גם בבחירות נמוכות …כמו ס.א של דורנו ( גינובלי ,לילארד , פארקר ועוד ).
    אך כשאתה חושב להפסיד …בפארקט בכדי לנצח בדראפט …אתה הרבה פעמים מפסיד.
    לדידנו ….נדמה לי שהרבה קריירות היו נראות אחרת לו הנבחר היה מגיע למקום אחר.

    בשורה התחתונה.
    כמות המחקרים בנושא היא אין סופית.
    אותי מעניין גם חקירות לפי קבוצה.
    ס.א הצליחה למשל בבחירות הגבוהות ביותר (דאנקן רובינסון ) אך גם בבחירות נמוכות.
    היו כאלו שזה הפוך ( נדמה לי פורטלנד ).
    מעניין אם יהיה חוקר שידע ראשית להציב קריטריונים ברורים ומוסכמים של הצלחה (דבר לא מדעי שלא פשוט בכלל להסכים לגביו ).
    ועל פי זה לתת ציון לכל קבוצה ב 30 -40 שנה האחרונות .

    1. דנקן ורובינסון הם 2 מהשחקנים שהיה ברור שהם יהיו שחקנים טובים
      (ע"ע לברון, שאקיל).

      אבל היכולת שלהם לזהות ולפתח כישרונות בבחירות נמוכות, היא באמת יוצאת דופן.

  9. הרגת אותי בפיסקה הראשונה, דוק. צחקתי פה בקולי קולות. זה הזכיר לי משהו שכתבתי על פסטיבל ה"מידברן" (ה"ברנינג-מאן" הישראלי) וחטפתי עליו. שהפסטיבל מציע מציאות רוחנית שבה אין כסף וחומר וקפיטליזם לארבעה ימים, וכל זה ב 900 שקל בלבד

  10. תודה מנחם על טור מעניין

    נ.ב. בגלל ה OCD שלי, אם אתה עושה רגרסיה לינארית בין גובה לבין משקל צריך לעשות רגרסיה רק על משתנה השיפוע תוך כדי שכופים את החיתוך לעבור בראשית (גובה אפס ==> משקל אפס)

להגיב על א.ב לבטל

סגירת תפריט