מאזן העוצמה בין מזרח ומערב – איך אחוז הנצחונות של המזרח והמערב משתנה ככל שהעונה מתקדמת
לפני כמה זמן כתבתי טור שמטרתו היתה להציג מודל מאוד פשוט שמתאר איך הבדלים קטנים בין העוצמות של שני קונפרנסים יכולים להתפתח להבדלים מאוד גדולים אחרי כמה שנים [http://www.hoops.co.il/?p=42492]. כאן אני רוצה לתאר איך אחוז הנצחונות של הקונפרנסים משתנה ככל שהליגה מתקדמת. כמו בטור הקודם אני מניח שניתן להתייחס אל המזרח כאל מכלול אחד ואל המערב כאל מכלול בלי להיכנס לפרטים שכל קונפרנס מורכב מקבוצות שלא שוות בכוחן.
בתחילת העונה כל קונפרנס, מזרח או מערב, מתחיל עם כוח יחסי מסוים, e ו-w. כאן e ו-w מייצגים את אחוז הנצחונות בנקודת זמן מסוימת. הערך שלהם בתחילת העונה הוא "התוצר" של המודל הקודם.
אני מניח שהמזרח משחק α אחוז מהמשחקים נגד המזרח ואת השאר נגד המערב. אם α=0.7 זה אומר שהמזרח משחק 70% מהמשחקים נגד עצמו ו-30% מהמשחקים נגד המערב.
נניח שבשבוע ישנם בממוצע שלושה משחקים. מה הוא השינוי של e בשבוע זה ? ובכן, אם קבוצה מהמזרח משחקת נגד קבוצה אחרת מהמזרח, סיכוי הנצחון הוא 50% כי אני מניח שכל הקבוצות במזרח שוות זו לזו, וישנם 3α משחקים כאלה. אם לעומת זאת המזרח משחק נגד המערב סיכוי הנצחון הוא
e/(e+w)
וישנם 3(1-α)- משחקים כאלה. כלומר סך השינוי בכמות הנצחונות של e הוא
3(α/2+(1-α)e/(e+w))
אם כך, ניתן לכתוב את השינוי ליחידת זמן של e ו-w בצורה:
את השורה השניה קיבלנו מהראשונה על ידי החילוף הסימטרי של e ב-w בכל מקום.
מה הן תוצאות המודל ? בגרף 1 למטה רואים את אחוז הנצחונות של המזרח והמערב עם הזמן (הזמן הוא שרירותי, ניתן לחשוב שהוא מס' השבועות). התחלתי עם 60% הצלחה למערב ורק 40% הצלחה למזרח. מכיוון שכל קונפרנס משחק יותר עם עצמו מאשר עם הצד השני אחוז ההצלחה שואף עם הזמן לכיוון ה-50%, כלומר אחוז ההצלחה המערבי יורד עם הזמן בעוד זה של המזרח עולה. בזמן ארוך יותר ממה שנראה בגרף שניהם מתייצבים על 50%.
איך זה מסתדר עם נתוני ההצלחה של המזרח והמערב בפועל ? בגרף מס' 2 רואים את אחוז הנצחונות של המזרח והמערב בנקודות זמן שההפרש בינהן הוא בערך 10 ימים. לכל קונפרנס לקחתי את אחוז הנצחונות הממוצע. הנקודות הן הנתונים והקווים השחורים הם מהמודל שלי. רימיתי קצת בשתי נקודות: ראשית, מכיוון שכל קונפרנס מתחיל ביומה הראשון של הליגה ב-50% סיכויי הצלחה ואז "צולל" (מזרח) או "נוסק" (מערב) אל כוחו האמיתי, נקודת ההתחלה היא ה-30 בנובמבר 2014. שנית, לא טרחתי לברר מה הוא האלפא האמיתי ובחרתי ערך של α=0.6, כלומר שכל קבוצה במזרח משחקת 60% ממשחקיה עם קבוצות אחרות במזרח. זה נראה כאילו המגמה היא בעיקרה נכונה אם כי העקמומיות של עקומת הנתונים האמיתיים שונה מזו של המודל.
ניתן להכליל את המודל הפשוט הזה לתיאור של ליגה קצת יותר ריאליסטית בה יש N קבוצות שמשחקות האחת נגד השנייה. כולן מתחילות עם "עוצמה" מסוימת, כלומר אחוז ניצחונות מסוים, ואחוז זה גדל אם קבוצה משחקת נגד קבוצה נחותה ממנה וקטן אם היא משחקת מול קבוצה טובה ממנה. גם כאן מסתבר שכל הקבוצות שואפות לאחוז נצחונות קבוע, כפי שמשתקף מגרף 3.
כאן הנחתי שכל קבוצה משחקת באותה תדירות עם כל קבוצה אחרת.
המסקנה העיקרית ממודל מפושט זה היא שאחוז הנצחונות של כל הקבוצות שואף ל-50%.
גיא
8 אפר 2015 20:07:56אלו הרבה חישובים מאוד מסובכים בשביל להגיע לנק' שאם אתה מסתכל על כל הקבוצות יחדיו אז אחוז הנצחונות הוא 50, איך זה יכול להיות אחרת כשבכל משחק יש קבוצה אחת שמנצחת וקבוצה שניה שמפסידה?
שגיא נאור
8 אפר 2015 20:26:09לא הבנתי למה אי אפשר להכניס את הנתונים רק של המפגשים בין הקונפרנסים? מה הערך של המפגשים בתוך הקונפרנס לטובת חיזוק הטענה כי הפערים מצטמצמים? לא יותר פשוט לקחת את כל המפגשים בין הקונפרנסים ולחלק אותם לפי תקופות זמן או לחילופין חלוקה אחרת, נגיד קפיצות של 20 מפגשים? כל קבוצה משחקת בערך 30-35 משחקים נגד קבוצות מהקונפרנס המקביל, כלומר סה״כ בסביבות 400 משחקים בין הקונפרנסים, הכי פשוט יהיה לחלק לקבוצות יותר קטנות ולראות אם יש שינוי עם הזמן.
עגל
8 אפר 2015 21:19:13לשגיא – אתה צודק, הנקודה היא שהמשחקים בין הקונפרנסים לא מקטינים את הפערים אלא מגדילים אותם. המשחקים בתוך הקונפרנסים גורמים לאחוז הנצחונות להתקרב ל-50%.
(מסתתרת פה נקודה עדינה שהעוצמה של כל קונפרנס נקבעת לפי אחוז הנצחונות בנקודת זמן מסוימת).
לגיא – סה"כ המאזן של כל הליגה הוא 50% כמו שציינת, כאן אנחנו מתחקים על ההתפלגות הלא טריוויאלית בין שני הקונפרנסים ובעיקר על ההשתנות שלה בזמן.
שגיא נאור
8 אפר 2015 21:55:26ברור שהמשחקים בכל קונפרנס מקרבים ל50% ובגלל זה נראה כאילו ההבדלים אינם כל כך גדולים כי עומדים על בערך 55% למערב אבל דווקא בגלל זה אני לא מבין למה מראש להכניס את אותם מפגשים לתוך המאזן והגרפים. בתכלס, המשחקים בתוך הקונפרנסים לא משנים את הכיוון אבל הם מטשטשים את ההבדל האמיתי, במיוחד בגלל שרוב המשחקים משוחקים בתוך הקונפרנס
מנחם לס
8 אפר 2015 20:32:36המוח עייף (וזקן) מדי מכדי להיכנס לזה, אבל כפי שציינתי, ב-ESPN היו משלחמים לך עבור הנסיון.
Berch
8 אפר 2015 22:35:43פתרת את הויכוח עתיק היומין בין פילוסוף לסטטיסטיקאי….
מה הסיכוי שתדרוס אותך משאית ?
חישוב הסתברותי מסובך
או 50% – או שכן או שלא…..
יפה לראות תוצאות אמת מסתדרות עם הגרף שלך…. ואל תדאג על הרמאויות הקטנות…. גדולי וטובים ממך (או כמוך) עשו את זה קודם 🙂
אורן
9 אפר 2015 01:53:25סתם לידע (אולי אתה יודע..)
בסטטיסטיקה מסתכלים על כל תוצאות העבר ועל כל או רוב המשתנים העיקריים ולפי זה בונים מודלים שמתארים את ההתנהגות של התוצאות לפי הזמן ושאר המשתנים
בהסתברות לוקחים את המודל המתאים וחוזים בעזרתו תוצאות עתידיות בקירוב
זה בגדול. מכאן שהחישובים ההסתברותיים מאוד פשוטים כל עוד יודעים את כל הפרמטרים 🙂
אורן
9 אפר 2015 02:07:52הדוגמה הכי טובה שיש לי זה שסטטיסטיקה מראה אחרי משחק כמה כל אחד קלע, באילו אחוזים, איך שומר מסוים השפיע על המשחק שלו..
כך זה מצטבר לעונה שלמה ואפשר להתקדם עם חישובי יעילות יותר מסובכים (השאלה כמה חשיבות נותנים לכל פעולה חיובית כמו נקודה, אסיסט ושלילית כמו איבוד, עבירה) ולראות מי ה-MVP לפי שקלול הדברים.
בעזרת זה בונים מודל הסתברותי ואפשר להשתמש בו לדוגמה במשחקי מחשב שמנתחים התפתחות של שחקן ומכניסים לזה גורמים שונים לכדי rating ושינוי בו, ויכולים גם לבצע סימולציה של משחקים בין קבוצות..
Berch
9 אפר 2015 09:14:13זה בדיוק מה שהחבר הסטטיסטיקאי שלי היה אומר…. 🙂
אורן
9 אפר 2015 12:58:06D:
Mbk
8 אפר 2015 22:48:47לא ירדתי לסוף דעתך
אולי כי מתפוצץ לי הראש או אולי כי על צד המומי שלי
עניין המשחקים הוא פשוט כל קבוצה משחקת 52 משחקים בתוך הקונפרנס שלה ו 30 מול הקונפרנס היריב
בעקרון לאחר פגרת האול סטאר 40% מקבוצות המערב מחוץ לתמונת הפלייאוף מול 20% מקבוצות המזרח . מעניין לבדוק את ההשפעה הזו על מאזן הקונפרנסים
אורן
9 אפר 2015 02:02:08המודל מעניין אבל כמו שנאמר הוא לא יכול להביא למסקנות לגבי הבדל בין חוזק הקונפרנסים
כמו כן אפשר היה קצת לשנות ולגרום לנגזרת חיוביות למי שמתחיל מעל 1/2 ושלילית מתחת ל-1/2.. כך שהחוכמה בעצם היא לקלוע למודל הנכון וזה כמובן הרבה יותר מסובך
בכל מקרה תודה על הפוסטים המעניינים, אולי זה יגרום לאנשים להתעניין קצת יותר באנליטיקס
עגל
9 אפר 2015 08:23:18הי אורן, כתבתי פוסט אחר על החוזק של הקונפרנסים, ראה קישור בטור הנוכחי למעלה. זה מחק די נחמד, בעיקר אם הוא עובד. אני די בטוח שהליגה מעסיקה אנשים שיודעים לכתוב מודלים כאלה או יותר ריאליסטיים.
אורן
9 אפר 2015 12:57:49כן ראיתי, אחלה פוסט. רק אמרתי שבפוסט הזה זה לא מה שאתה בודק.. תודה.
נתן גולד
9 אפר 2015 12:05:57אשכרה פיתחת מערכת דינמית לחזות את מאזן הכוחות…
המרצה שלי עכשיו היה מבסוט. בשבילי לעומת זאת כל המערכות האלה כבר יצאו מכל החורים…
אפלטון
9 אפר 2015 14:56:58לך תדע אולי הוא המרצה שלך 😉
עגל
9 אפר 2015 15:38:44אולי המרצה של נתן הוא סומפולינסקי, אם כן זה משעשע מאוד מפני שלקחתי אצלו שני קורסים של מדעי המוח ברשתות נוירונים.
נתן גולד
10 אפר 2015 15:10:37סומפולינסקי הוא לא המרצה במקרה הזה אבל הוא מי שקבע את הסילבוס של הקורס ואני כנראה אעשה אצלו שנה הבאה את רשתות ב'. מצחיק שגם אתה למדת אצלו היה לי את הרושם שאתה בפיזיקה…
עגל
10 אפר 2015 16:30:53אני פיסיקאי אבל בצעירותי התעניינתי גם במדעי המוח, עד שסומפולינסקי הצליח להרוג את זה 🙁
נתן גולד
10 אפר 2015 19:48:50שמעתי שיש לו השפעה כזאת לפעמים…
bobby
9 אפר 2015 15:53:10תמיד שנאתי סטטיסטיקה מורכבת שכזו, אבל סחתיין על המאמץ!
מסכים עם מה שרשמו פה באחת התגובות – ששווה לבדוק האם ריבוי הקבוצות במזרח בעלות סיכוי העפלה לפליאוף לקראת האולסטאר, בניגוד למערב, משפיע בצורה כזו או אחרת..
רועי ויינברג
9 אפר 2015 17:17:50אחלה כתבה של הולינגר הישראלי, יש לי שאלה אחת:
אם היית מקטין את אלפא ל-0.5 אז המרחק בין הקווים של המזרח והמערב היה קטן, נכון?
עגל
9 אפר 2015 22:05:39ככל שאלפא גדול יותר כך כל קונפרנס משחק יותר עם עצמו ופחות עם הצד השני, ולכן החזק "מפסיד" והחלש "מרוויח", כלומרשני הקווים צריכים להתקרב יותר האחד אל השני.