תיאוריה בגרוש 2

מאזן העוצמה בין מזרח ומערב – איך אחוז הנצחונות של המזרח והמערב משתנה ככל שהעונה מתקדמת

לפני כמה זמן כתבתי טור שמטרתו היתה להציג מודל מאוד פשוט שמתאר איך הבדלים קטנים בין העוצמות של שני קונפרנסים יכולים להתפתח להבדלים מאוד גדולים אחרי כמה שנים [http://www.hoops.co.il/?p=42492]. כאן אני רוצה לתאר איך אחוז הנצחונות של הקונפרנסים משתנה ככל שהליגה מתקדמת. כמו בטור הקודם אני מניח שניתן להתייחס אל המזרח כאל מכלול אחד ואל המערב כאל מכלול בלי להיכנס לפרטים שכל קונפרנס מורכב מקבוצות שלא שוות בכוחן.

בתחילת העונה כל קונפרנס, מזרח או מערב, מתחיל עם כוח יחסי מסוים, e ו-w. כאן e ו-w מייצגים את אחוז הנצחונות בנקודת זמן מסוימת. הערך שלהם בתחילת העונה הוא "התוצר" של המודל הקודם.

אני מניח שהמזרח משחק α אחוז מהמשחקים נגד המזרח ואת השאר נגד המערב. אם  α=0.7 זה אומר שהמזרח משחק 70% מהמשחקים נגד עצמו ו-30% מהמשחקים נגד המערב.

נניח שבשבוע ישנם בממוצע שלושה משחקים. מה הוא השינוי של e בשבוע זה ? ובכן, אם קבוצה מהמזרח משחקת נגד קבוצה אחרת מהמזרח, סיכוי הנצחון הוא 50% כי אני מניח שכל הקבוצות במזרח שוות זו לזו, וישנם  3α משחקים כאלה. אם לעומת זאת המזרח משחק נגד המערב סיכוי הנצחון הוא

e/(e+w)

וישנם 3(1-α)- משחקים כאלה. כלומר סך השינוי בכמות הנצחונות של e הוא

3(α/2+(1-α)e/(e+w))

אם כך, ניתן לכתוב את השינוי ליחידת זמן של e ו-w בצורה:

equation

את השורה השניה קיבלנו מהראשונה על ידי החילוף הסימטרי של e ב-w בכל מקום.

מה הן תוצאות המודל ? בגרף 1 למטה רואים את אחוז הנצחונות של המזרח והמערב עם הזמן (הזמן הוא שרירותי, ניתן לחשוב שהוא מס' השבועות). התחלתי עם 60% הצלחה למערב ורק 40% הצלחה למזרח. מכיוון שכל קונפרנס משחק יותר עם עצמו מאשר עם הצד השני אחוז ההצלחה שואף עם הזמן לכיוון ה-50%, כלומר אחוז ההצלחה המערבי יורד עם הזמן בעוד זה של המזרח עולה. בזמן ארוך יותר ממה שנראה בגרף שניהם מתייצבים על 50%.

fig3
אחוז הנצחונות של המזרח והמערב ככל שהעונה מתקדמת. הזמן הוא שרירותי ו- alpha=0.7.

איך זה מסתדר עם נתוני ההצלחה של המזרח והמערב בפועל ? בגרף מס' 2 רואים את אחוז הנצחונות של המזרח והמערב בנקודות זמן שההפרש בינהן הוא בערך 10 ימים. לכל קונפרנס לקחתי את אחוז הנצחונות הממוצע. הנקודות הן הנתונים והקווים השחורים הם מהמודל שלי. רימיתי קצת בשתי נקודות: ראשית, מכיוון שכל קונפרנס מתחיל ביומה הראשון של הליגה ב-50% סיכויי הצלחה ואז "צולל" (מזרח) או "נוסק" (מערב) אל כוחו האמיתי, נקודת ההתחלה היא ה-30 בנובמבר 2014. שנית, לא טרחתי לברר מה הוא האלפא האמיתי ובחרתי ערך של α=0.6, כלומר שכל קבוצה במזרח משחקת 60% ממשחקיה עם קבוצות אחרות במזרח. זה נראה כאילו המגמה היא בעיקרה נכונה אם כי העקמומיות של עקומת הנתונים האמיתיים שונה מזו של המודל.

אחוז הנצחונות הממוצע של כל קונפרנס (מזרח/מערב) מול מספר הימים מתחילת הליגה. היום הראשון שמופיע הוא ה-30 בנובמבר והאחרון הוא ה-8 לפברואר. קווים שחורים הם קווי המודל עם alpha=0.6.
אחוז הנצחונות הממוצע של כל קונפרנס (מזרח/מערב) מול מספר הימים מתחילת הליגה. היום הראשון שמופיע הוא ה-30 בנובמבר והאחרון הוא ה-8 לפברואר. קווים שחורים הם קווי המודל עם alpha=0.6.

ניתן להכליל את המודל הפשוט הזה לתיאור של ליגה קצת יותר ריאליסטית בה יש N קבוצות שמשחקות האחת נגד השנייה. כולן מתחילות עם "עוצמה" מסוימת, כלומר אחוז ניצחונות מסוים, ואחוז זה גדל אם קבוצה משחקת נגד קבוצה נחותה ממנה וקטן אם היא משחקת מול קבוצה טובה ממנה. גם כאן מסתבר שכל הקבוצות שואפות לאחוז נצחונות קבוע, כפי שמשתקף מגרף 3.

השינוי של אחוז הנצחונות עם הזמן עבור "ליגה" בה ישנן 9 קבוצות שמתחילות את העונה עם אחוז הצלחה של 0.1, 0.2, 0.3, . . .
השינוי של אחוז הנצחונות עם הזמן עבור "ליגה" בה ישנן 9 קבוצות שמתחילות את העונה עם אחוז הצלחה של 0.1, 0.2, 0.3, . . .

כאן הנחתי שכל קבוצה משחקת באותה תדירות עם כל קבוצה אחרת.

המסקנה העיקרית ממודל מפושט זה היא שאחוז הנצחונות של כל הקבוצות שואף ל-50%.

מנחם לס

בעל האתר, הבוס הראשי, וכותב יומית - כל זמן שאוכל!

לפוסט הזה יש 23 תגובות

  1. אלו הרבה חישובים מאוד מסובכים בשביל להגיע לנק' שאם אתה מסתכל על כל הקבוצות יחדיו אז אחוז הנצחונות הוא 50, איך זה יכול להיות אחרת כשבכל משחק יש קבוצה אחת שמנצחת וקבוצה שניה שמפסידה?

  2. לא הבנתי למה אי אפשר להכניס את הנתונים רק של המפגשים בין הקונפרנסים? מה הערך של המפגשים בתוך הקונפרנס לטובת חיזוק הטענה כי הפערים מצטמצמים? לא יותר פשוט לקחת את כל המפגשים בין הקונפרנסים ולחלק אותם לפי תקופות זמן או לחילופין חלוקה אחרת, נגיד קפיצות של 20 מפגשים? כל קבוצה משחקת בערך 30-35 משחקים נגד קבוצות מהקונפרנס המקביל, כלומר סה״כ בסביבות 400 משחקים בין הקונפרנסים, הכי פשוט יהיה לחלק לקבוצות יותר קטנות ולראות אם יש שינוי עם הזמן.

    1. לשגיא – אתה צודק, הנקודה היא שהמשחקים בין הקונפרנסים לא מקטינים את הפערים אלא מגדילים אותם. המשחקים בתוך הקונפרנסים גורמים לאחוז הנצחונות להתקרב ל-50%.
      (מסתתרת פה נקודה עדינה שהעוצמה של כל קונפרנס נקבעת לפי אחוז הנצחונות בנקודת זמן מסוימת).
      לגיא – סה"כ המאזן של כל הליגה הוא 50% כמו שציינת, כאן אנחנו מתחקים על ההתפלגות הלא טריוויאלית בין שני הקונפרנסים ובעיקר על ההשתנות שלה בזמן.

      1. ברור שהמשחקים בכל קונפרנס מקרבים ל50% ובגלל זה נראה כאילו ההבדלים אינם כל כך גדולים כי עומדים על בערך 55% למערב אבל דווקא בגלל זה אני לא מבין למה מראש להכניס את אותם מפגשים לתוך המאזן והגרפים. בתכלס, המשחקים בתוך הקונפרנסים לא משנים את הכיוון אבל הם מטשטשים את ההבדל האמיתי, במיוחד בגלל שרוב המשחקים משוחקים בתוך הקונפרנס

  3. פתרת את הויכוח עתיק היומין בין פילוסוף לסטטיסטיקאי….
    מה הסיכוי שתדרוס אותך משאית ?

    חישוב הסתברותי מסובך
    או 50% – או שכן או שלא…..

    יפה לראות תוצאות אמת מסתדרות עם הגרף שלך…. ואל תדאג על הרמאויות הקטנות…. גדולי וטובים ממך (או כמוך) עשו את זה קודם 🙂

    1. סתם לידע (אולי אתה יודע..)

      בסטטיסטיקה מסתכלים על כל תוצאות העבר ועל כל או רוב המשתנים העיקריים ולפי זה בונים מודלים שמתארים את ההתנהגות של התוצאות לפי הזמן ושאר המשתנים

      בהסתברות לוקחים את המודל המתאים וחוזים בעזרתו תוצאות עתידיות בקירוב

      זה בגדול. מכאן שהחישובים ההסתברותיים מאוד פשוטים כל עוד יודעים את כל הפרמטרים 🙂

    2. הדוגמה הכי טובה שיש לי זה שסטטיסטיקה מראה אחרי משחק כמה כל אחד קלע, באילו אחוזים, איך שומר מסוים השפיע על המשחק שלו..

      כך זה מצטבר לעונה שלמה ואפשר להתקדם עם חישובי יעילות יותר מסובכים (השאלה כמה חשיבות נותנים לכל פעולה חיובית כמו נקודה, אסיסט ושלילית כמו איבוד, עבירה) ולראות מי ה-MVP לפי שקלול הדברים.

      בעזרת זה בונים מודל הסתברותי ואפשר להשתמש בו לדוגמה במשחקי מחשב שמנתחים התפתחות של שחקן ומכניסים לזה גורמים שונים לכדי rating ושינוי בו, ויכולים גם לבצע סימולציה של משחקים בין קבוצות..

  4. לא ירדתי לסוף דעתך
    אולי כי מתפוצץ לי הראש או אולי כי על צד המומי שלי
    עניין המשחקים הוא פשוט כל קבוצה משחקת 52 משחקים בתוך הקונפרנס שלה ו 30 מול הקונפרנס היריב

    בעקרון לאחר פגרת האול סטאר 40% מקבוצות המערב מחוץ לתמונת הפלייאוף מול 20% מקבוצות המזרח . מעניין לבדוק את ההשפעה הזו על מאזן הקונפרנסים

  5. המודל מעניין אבל כמו שנאמר הוא לא יכול להביא למסקנות לגבי הבדל בין חוזק הקונפרנסים

    כמו כן אפשר היה קצת לשנות ולגרום לנגזרת חיוביות למי שמתחיל מעל 1/2 ושלילית מתחת ל-1/2.. כך שהחוכמה בעצם היא לקלוע למודל הנכון וזה כמובן הרבה יותר מסובך

    בכל מקרה תודה על הפוסטים המעניינים, אולי זה יגרום לאנשים להתעניין קצת יותר באנליטיקס

    1. הי אורן, כתבתי פוסט אחר על החוזק של הקונפרנסים, ראה קישור בטור הנוכחי למעלה. זה מחק די נחמד, בעיקר אם הוא עובד. אני די בטוח שהליגה מעסיקה אנשים שיודעים לכתוב מודלים כאלה או יותר ריאליסטיים.

  6. אשכרה פיתחת מערכת דינמית לחזות את מאזן הכוחות…
    המרצה שלי עכשיו היה מבסוט. בשבילי לעומת זאת כל המערכות האלה כבר יצאו מכל החורים…

    1. אולי המרצה של נתן הוא סומפולינסקי, אם כן זה משעשע מאוד מפני שלקחתי אצלו שני קורסים של מדעי המוח ברשתות נוירונים.

      1. סומפולינסקי הוא לא המרצה במקרה הזה אבל הוא מי שקבע את הסילבוס של הקורס ואני כנראה אעשה אצלו שנה הבאה את רשתות ב'. מצחיק שגם אתה למדת אצלו היה לי את הרושם שאתה בפיזיקה…

  7. תמיד שנאתי סטטיסטיקה מורכבת שכזו, אבל סחתיין על המאמץ!
    מסכים עם מה שרשמו פה באחת התגובות – ששווה לבדוק האם ריבוי הקבוצות במזרח בעלות סיכוי העפלה לפליאוף לקראת האולסטאר, בניגוד למערב, משפיע בצורה כזו או אחרת..

    1. ככל שאלפא גדול יותר כך כל קונפרנס משחק יותר עם עצמו ופחות עם הצד השני, ולכן החזק "מפסיד" והחלש "מרוויח", כלומרשני הקווים צריכים להתקרב יותר האחד אל השני.

כתיבת תגובה

סגירת תפריט