מדד השוויוניות של הליגה

מדד השוויוניות של הליגה

עוד רבות ידובר, יתואר, יסופר ויושר באתר הופס על המזפח ועל המעפח, ובכל זאת רצינו לעצור רגע ולהסתכל קצת על המאזן מזרח-מערב ועל נושא השוויון בליגה. אבל לפני כן בואו נסתכל אל מאזני הקבוצות עצמן.

משום שאף אחד מאנשי הצוות לא עזר לי (נו נו נו) נאלצתי להוריד את המאזנים באופן ידני וזו לא מעט עבודה ולכן הרזולוציה היא שבועית (אין פירוט יומי).

מאזני הקבוצות בנב"א בעונה 2015-2016 לפי חלוקה למזרח ומערב. ציר ה-X הוא מספר השבוע (שבוע 1, שבוע 2, וכ"ו). בולטות פילי (גרף עליון, מאזן מביש) וגולדן סטייט (גרף תחתון, עד השבוע ה-7 מאזנה היה מושלם). במערב בולט הפיזור, במזרח רק פילי מאוד חריגה.

לכל קבוצה ישנו "אחוז הצלחה" S, שהוא אחוז הניצחונות שלה. גודל זה מחושב בין 0 ל-1 כאשר 1 משמעותו 100% הצלחה (רק ניצחונות). הקווים הצבעוניים הם ה- S של כל הקבוצות.

מאזני הקבוצות בנב"א בעונה 2017-2018 לפי חלוקה למזרח ומערב.

החלוקה היא לפי מזרח ומערב. ישנם מאזנים של השנה הנוכחית, 2018, ושל שנת 2016 (היא שנת ה-73 ניצחונות של גולדן סטייט). בשבוע-שניים-שלושה הראשונים המאזנים של כל הקבוצות מאוד "משתוללים", זה נובע ממספר המשחקים הנמוך. לאחר זמן מה המאזנים מתייצבים וכל קבוצה מוצאת את המקום הטבעי שלה, בצמרת הליגה או במרתפיה. בעין זה נראה כאילו המאזנים במערב בשנת 2016 מאוד שונים זה מזה – כלומר ישנו אי שוויון גדול. לעומת זאת השנה המאזנים יותר מקובצים גם במזרח וגם במערב, כלומר יש יותר שוויון.

לפני שנכמת את זה, כדאי להסתכל על המאזן הכולל של המזרח לעומת המאזן הכולל של המערב:

מאזנים ממוצעים של המזרח והמערב בשנים 2015-2016 וב-2017-2018.קסןא

כל אחד מהם הוא פשוט ממוצע המאזנים של הקבוצות במזרח ובמערב, בהתאמה. בכל נקודת זמן המאזן הכולל של הליגה חייב להיות שווה ל 0.5 כי על ניצחון תמיד ישנו הפסד. רואים את מה שגיא הדגיש הרבה פעמים – כמה המזרח התחיל טוב את העונה. עם זאת רואים גם שהמערב השתווה למזרח לראשונה בשבוע ה-11 וביצע מעפח בשבוע ה-13. עם זאת, השוואה של השנה הנוכחית עם שנת 2016 ממחישה שבממוצע הפער בין המזרח למערב קטן יותר השנה מאשר לפני שנתיים (אין להתייחס ל-3-4 השבועות הראשונים).

מדד השוויוניות של הליגה (LEI – League Equality Index).

עכשיו ניתן נגדיר את מדד השוויוניות בצורה הבאה. אנו משתמשים באחוז ההצלחה S של הקבוצות

כך ש-  LEI ניתן על ידי הביטוי

במילים: בין כל שתי קבוצות i ו-j, אנחנו עושים הפרש של אחוזי ההצלחה, ומעלים בריבוע. ועכשיו  עושים סכום על כל הזוגות הקבוצות האפשריים. בליגה שוויונית לגמרי, מאזני כל הקבוצות שווים זה לזה והם S=0.5. במקרה כזה מדד LEI הוא אפס. ככל שאי-השוויון גדל כך מדד זה גדל.

מדד נמוך = יותר שוויון.

חישבנו את המדד למזרח ולמערב בנפרד.

מדד השוויון מחושב בנפרד למזרח ולמערב, לשנים 2016 (למעלה) ולשנה הנוכחית (למטה). ניתן לראות שגם למזרח וגם למערב מדד השוויון קטן השנה מלפני שנתיים, כלומר ישנה יותר שוויוניות. שימו לב ששבועות 1-4 לא מופיעים.

מה הן המסקנות?

  1. המדד הוא מאוד גבוה בהתחלה והוא הולך ויורד עד שהוא מגיע לערך פחות או יותר קבוע. הסיבה היא מה שאמרנו למעלה – בתחילת העונה מספר המשחקים הוא קטן, ולכן האקראיות הטבעית בתוצאות המשחקים (כל מי שמהמר על תוצאות הלילה יודע שישנן המון הפתעות) מובילה לפיזור רב של המאזנים, ואי שוויון גדול.
  2. המזרח יותר שוויוני מהמערב גם העונה וגם לפני שנתיים.
  3. המערב יותר שוויוני העונה מאשר לפני שנתיים.

כאן עגל המחזירכם חנוק מדמעות אושר שמחה וגיל, למחלבת צח"מ אשר באפיקים.

 

תוספת לבקשת הקהל: מדד השוויוניות לכל הליגה (ללא חלוקה מזרח/מערב)

לפוסט הזה יש 67 תגובות

  1. שכחתי: ומה יש ליהדות לומר על זה?!

  2. אחרי 400 שנות עבדות בשדות כותנה, האפרוZ בכו שלא נותנים להם לשבת באחורה של האוטובוס.

  3. טור מושקע ומענג

  4. מעולה פשוט מעולה
    הפער הקטן יחסית בין מזרח למערב הוא אחת מהפתעות העונה
    אם מחשיבים את אייזה תומאס ( ולא ) היה מעבר חד של אולסטארים מערבה ,החשש חילחל לקברנטי הליגה שאפילו שינו את הפורמט של המשחק .
    החשש שלי היה שהמערב יכתוש את המזרח ( במילניום הנוכחי קבוצות המזרח היו במאזן חיובי מול קבוצות המערב רק בעונה אחת ,עונה שבה 3 קבוצות מזרחיות היו עם 59 ניצחונות ומעלה אורלנדו ,בוסטון וקליבלנד )
    העונה הנוכחית מהנה מאוד
    אין קבוצה שעושה טנקינג מובהק ( לראייה פילדלפיה ו והלייקרס שהגנו על בחירות דראפט ) והפער קטן יחסית
    קבוצות מערביות כממפיס OKC ואפילו דנבר הספרס ופורטלנד נראות פחות טוב מהציפיות וגודלן סטייט נראית כמו מי שהעונה הרגילה לא מעניינת אותה

  5. אני לא סגור אם הבנתי את זה לגמרי או שלא הבנתי כלום….
    מה שבטוח הטבלה לא משקרת
    הכדור הוא עגול
    וכדורסל משחקים דקות גמיש 🙂

  6. מעניין. אהבתי את החצי, שכלל לא משפיע על התוצאה 🙂

    שימו לב שהוא בכלל לא השווה בין מזרח למערב, אני לא כ"כ בטוח איך משווים ביניהם בצורה אמינה חוץ מאשר המאזן הכולל ביניהם (מאזן של כל קבוצה משקר אם קבוצה במערב מפסידה יותר כי התחרות שם יותר קשה למשל). אם נעשה סקר ונשווה ראש בראש בין כל קבוצה המדורגת במיקום זהה בכל קונפרנס נראה לי שייצא משהו כמו 12-3 למערב.

    1. בדיוק מה שרציתי לומר.
      היה מעניין אותי לראות את המאזן במשחקים בין שמונה (או עשר) הקבוצות הטובות במערב למקבילותיהן במזרח. זה היה נותן אינדיקציה לא רעה לפערי הכוחות האמיתיים.

  7. יש לי שאלה לא קשורה, אבל יש לקבוצות נבא סוג של "אולטראס" כאלה? כמו באירופה לדוגמא

    1. מקסימום פורום אוהדים 🙂
      האמרקאים לא עושים ביג דיל לא ידוע לי על אולטראס או יציע של שרופים שם הכל ביזנס
      האוהדים האמיתים של גודלן סטייט אלו שהלכו עם הקבוצה שנים איבדו את מקומם לעובדי היי טק ( קראתי שהמחיר קפץ ב 800 אחוז )

  8. מעניין יואב. כמה שאלות:
    1. למה להפריד את השונות לזו של המערב לעומת המזרח? בסך הכל מדובר בליגה אחת שהקבוצות בה משחקות אחת נגד השנייה.
    2. למה מעניין אותנו המעקב אחר השונות הזו לאורך העונה?
    3. למה בחרת את שתי השנים האלו? לא כדאי לעקוב אחר השונות הנ"ל לאורך עשור או שניים בסוף העונה?
    4. בגדול (ובאופן לא מפתיע) מה שהתוצאות מראות הוא שאין הבדל מהותי בין השונות במזרח לבין זו במערב..

    1. ברור שיש הבדל מהותי בין המזרח למערב.

      1. מה כל כך ברור?

        1. סטט' של 20 שנה לא מספיק טוב ?

          ורגע, אני באמצע משחק..

          1. אני מדבר על השונות.

          2. יופי, הפסדתי..

            אמ:לק

            מה זה שונות ?

          3. מה שיואב חישב – עד כמה הערכים שונים זה מזה.

          4. חוץ מזה, מה ככה… היה משהו מעניין בשבוע האחרון..?

          5. איפה?

          6. בעולם ההופס.

            על הגרפים עם הזיגזגים והמשוואות עם האותיות והמספרים בלטינית אני מדלג.

            תכלס קראתי רק את הכותרת, והמסקנות.

            אין שום משמעות לכך ש*בתוך* המזרח יש יותר שיוויוניות כן או לא מ *בתוך* המערב.

          7. זה גם מה שאני חושב.

          8. אבל זו המסקנה שלו

          9. אם יש מסקנה עם משמעות היא שהשיוויוניות בתוך המערב גדלה בשנתיים האחרונות. מסכים שזה לא אומר הרבה חוץ מזה.

          10. לא הבנתי, מה המסקנה ?

            זה שיש נתון סטט' שהוא נתון, לא הופך אותו לחשוב או קריטי.

          11. אפשר לחשוב על כל מיני סיבות של אותו הקונפרנס, למשל שזה אקראי או שקבוצות העל נחלשו / פחות קבוצות עושות טנקינג (החישוב הזה רגיש ל"חריגים" – קבוצות מאוד טובות או מאוד גרועות).

            לדעתי זה הבדל שלא מקרה על מסקנה משמעותית, כי המדגם של שנתיים-שלוש קטן.

          12. לא אמרתי שזה משמעותי – זה בדיוק מה ששאלתי את יואב. מה זה נותן לנו להסתכל על שנתיים בלבד ואיך זה בכלל משמעותי השינוי במהלך העונה.

          13. שונות זה DEVIATION. כמו סטנדרד דיביאשיון

        2. עידו בטח שיש הבדל. מאזן קבוצות המערב ב20 שנה האחרונות תמיד היה טוב יותר מול קבוצות המזרח. אמנם לא בצורה כזו דרמטית אבל אין לאף אחד ספק שקבוצות המערב באופן קבוע טובות יותר.
          העובדה שדווקא העונה הפערים הצטמצמו למרות מעבר הכוכבים למערב בהחלט מפתיע.

          1. אהההה, שוב פעם?
            אני שואל על ההבדלים שעליהם יואב הסתכל – בשונות ולא במאזנים.

          2. ודרך אגב כמו שאתה רואה מהגרף אם תסתכל בזהירות, לפני שנתיים ההבדל היה קטן יותר (או אם לא להיות קטנוניים דומה להשנה).

          3. הפערים לא בטוח הצטמצמו, את זה צריך לראות על טווח של יותר מחצי עונה. לפי דעתי לטווח ארוך הפער יגדל.

            לשחקנים חלק חשוב, אבל השאלה היותר קריטית היא איפה יש יותר ארגונים אינפנטיליים.

    2. לעידו – ראיתי שיש שרשור ארוך לשאלה שלך אז התייחסתי ל-4 הנקודות בסוף

  9. לאן נעלם הפריוויו של שגב?

    1. הוחזר- משום מה הוא הושלך לפח.

  10. עידו, יש לך רעיון למדד "חוזק קונפרנס" חוץ ממאזן כולל מזרח-מערב?

    1. אם תגדיר למה אתה קורא חוזק נוכל לחשוב.

      1. חוזק זה "קבוצה יותר טובה", יותר נצחונות בהתחשב בקושי להשיג אותם.

        נניח משהו כמו מספר נצחונות ביחס למספר נצחונות היריב – הבעיה שלי עם זה שאחד משפיע על השני, משחק סכום אפס. נגיד שבמקרה הקיצוני יש רק 4 קבוצות, ג"ס ויוסטון משחקות אחת עם השנייה 4 פעמים ומנצחות פעמיים, ואילו אינדיאנה מנצחת את הניקס 4/4. ברור שזה לא אומר שאינדיאנה הכי חזקה.. בקיצור לא יודע איך אפשר להתחשב בזה בלי להניח משהו מראש וזה מה שאני לא רוצה לעשות.

        1. הסיבה ששאלתי היא בעצם האם אתה רוצה לדעת כמה קבוצות טובות יש בקונפרנס? בסופו של יום זה הכל יחסי.
          בל מקרה אתה יכול לקחת מאזן ממוצע של X קבוצות ראשונות. כשהבחירה ההגיונית תהיה 8 הראשונות לדעתי.

          1. חשבתי לחשב איזה מדד מנורמל פר קבוצה, ואז לבדוק את הטופ X בכל קונפרנס, מאזן ממוצע נשמע לי פשטני מדי מהסיבות שהזכרתי. מצד שני זה ביצה ותרנגולת, האם הקבוצות בטופ המזרח פחות טובות מהמאזן כי יש יותר קבוצות גרועות בתחתית או שהגרועות הן כאלה כי אלו שבטופ טובות? העייפות כבר מכריעה אז אחשוב על זה מחר (או כשיהיה לי יותר זמן)

          2. מנורמל לפי מה. אם יש מישהו חזק זה גורר שמישהו אחר צריך להיות חלש. קודם תחליט מה מטרת ההשוואה ואז יהיה אפשר לנסח מה משווים.
            בכל אופן. גיים-טיים. אז מחר.

          3. אפשר לנרמל בתוך קונפרנס לפי מאזן מול הקונפרנס השני. אבדוק מחר

  11. העובדה שקבוצות לא משחקות אותו מספר משחקים נגד אותן קבוצות עושה מכל נסיון כזה BIASED

  12. For the season, the Nets have a -26.2 net rating with Okafor on the court. It's -1.7 with him on the bench.
    8:15 PM – 12 Feb 2018

  13. המספרים בהחלט עוברים גם את "מבחן העין".
    תודה, עגל.

  14. תודה רבה. טור מעולה.
    לא מבין למה מחכים לאיזו מסקנה מפוצצת. יואב רצה לבדוק שוויון בקונפרנס, בדק והראה גרפית. האם זה ייתן לנו את השאלה שתשובתה היא 42? כנראה שלא. אז מה? לא כל בדיקה חביבה כזו חייבת להרעיד את אמות הסיפים.

  15. גם אני הכנתי גרף. הקו העליון מייצג קבוצות מערבית למיסיספי התחתון מייצג מדינות שהכתר שלח אליו פושעים

    __________________________________________________

    __________________________________________________

  16. מטרת הטור היא לא להתרכז בחוזק היחסי של המערב לעומת המזרח אלא להסתכל על כמה שוויון יש (או אין). על הדרך כבר היו לי את הנתונים אז הצגתי גם את הכוח של כל קונפרנס.

  17. מזל שאתה לא מעביר קורס בנושא. הייתי נכשל ונשאר כיתה בהופס עם המב"ר (רבין, סומסום, הייטר ושאר מקרי הראש)

  18. לעידו:
    1. ההפרדה בין מזרח למערב היא מלאכותית כמובן. אתה צודק שאני צריך להציג את מדד השוויון של כל הליגה כיחידה אחת. אולי אספיק להוסיף את זה בהמשך היום.
    2. המעקב אחר השונות הזו לאורך העונה מעניין כי הוא מראה אם ישנן על מגמות. לדוגמא, אם כמה קבוצות מתחילות טאנקינג זה יתבטא בהקטנת השוויוניות.
    3. למה בחרתי את שתי השנים האלו? – התחלתי עם השנה הנוכחית והוספתיאת 2016 כרפרנס. היה טוב לעשות מגמה על פני עשור שלם אבל זו המון עבודה. הדרך שבה אספתי את הנתונים היא הליכה לבסקטבול רפרנס, בחירה של תאריך מסוים, קבלת טבלה עם המאזנים של הקבוצות, העתקה ידנית שלה עם העבר לטבלת אקסל, סידור והורדה של טקסטים מיצרים שנכנסו, sort לפי שם הקבוצה כך שלא יהיה בלגאן. שמירה של הנתונים ויבואם לתוך סקריפט של מאטלב, ושם העיבוד של הנתונים. אם היתה לי דרך ישירה ליבוא המספרים לתוך מאטלב הייתי עושה את הכל ב 10% מהזמן. קיוויתי שאחד מאשפי הביג דאטה, מזיג או שפרן, יעזרו לי, אבל הם לא עזרו.
    4. אני חושב שכן יש הבדל בשוויוניות בין שני הקונפרנסים. אבל מה שחשוב הוא המגמה, של הגדלת השוויוניות.במערב..

    1. לטעמי אין הרבה במעקב אחרי השונות תוך כדי העונה. לכן אם היית משקיע את אותו מאמץ רק במצב בתום העונה היינו מקבלים תמונה הרבה יותר מעניינת.
      למה דווקא 2016 כרפרנס? זו עונה מאד לא מייצגת. היו לך שתי קבוצות מאד חזקות במערב וקבוצה מאד חלשה במזרח מה שמאד מגדיל את השונות (בשני הצדדים).
      זה נראה לי קצת לא רציני לדבר על מגמה כשיש לך רק שתי עונות והן אפילו לא עוקבות. אלא אם במגמה אתה מתכוון למה שקורא בעונה הנוכחית בלבד.

  19. עוד משהו קטן – הנוסחה למדד היא לא בדיוק נוסחה של שונות. בשונות רגילה לוקחים מספר פחות הממוצע של אותו מספר, מעלים בריבוע ועושים סכום. כאן אלו ההפרשים בין המאזנים של כל הקבוצות, הממוצע לא מופיע באופן ישיר, והסכום הוא סכום כפול (שתי סיגמות).
    ההשראה היא "רדיוס הגירציה" Rg כמדד לגודל של פולימרים (radius of gyration) – מודדים את המרחק בין כל שני מונומרים לאורכו של הפולימר, מעלים בריבוע ועושים סכום.

    1. אתה לא רציני…
      אתה יודע שאין הבדל, נכון ?

      1. הגדרה אחרת . . . בסכום הכפול ישנו פקטור של N (במקרה שלנו פי 30 יותר גדול)

  20. בסדר אבל במילא לא הגדרת יחידות. בהשוואה בין עונות שונות או קונפרנסים זה מייצג את השונות עד כדי קבוע.

  21. הגרף השני של המאזנים קצת "משקר", כי הוא משווה בין האזורים אבל עדיין לוקח בחשבון גם משחקים בתוך הקונפרנס (מעוגן בתוך מאזני הקבוצות).

  22. מה בעצם נותן הגרף האחרון? האם אתה בטוח שזו פונקציה שאין לה מקסימום מקומי? שונות נדמה לי שבודקים כמרחק מהממוצע, לא?

    1. עכשיו אני רואה שהתייחסת להגדרת השונות פה בתגובות… למה לא להשתמש בה באמת? נראה לי יותר "קל לבלוע"

    2. אני מנחש שאתה גם נמנע מכפילויות, כלומר אחרי ש- ij נספר אז ji לא נספר.

    3. כן, אין ספירה כפולה של זוגות. בהתחלה הרשיתי אח"כ הורדתי, זה גם עניין של הגדרה (פקטור 2)
      לעידו – בכוונה לא נירמלתי ב N (או ב N^2 בסכום הכפול) כי המספרים יוצאים קטנים. לאנשים יותר קל "לבלוע" 20 או 30, פחות אוהבים 0.027

      1. ברור. אבל דווקא כדי לתת משמעות שאנשים יוכלו לבלוע יותר נוח להסתכל על סטיית התקן כי אז זה באותן יחידות של אחוזי ניצחונות.

    4. הגרף האחרון – אתה מתכוון לזה שהוספתי עכשיו, עם מדד השוויוניות של כל הליגה בשנתיים המדוברות?
      יש מקסימום של העונה הנוכחית, אין לו משמעות רבה כי ישנו "רעש" הנובע ממספר משחקים לא גדול מספיק.

      1. הגרך הזה הוא המשמעותי כי באמת העונה יש הרבה פחות קבוצות גרועות ממש ופחות קבוצות חזקות. לכן גם אמרתי שהיה נותן לנו אינדקציה יותר טובה לראות את העונה לעומת העשור האחרון.
        תודה! (תחזור לעבוד על דברים חשובים באמת).

      2. לא. זה שלפניו שכתבתם פה שהוא שקול לגרף של שונות, אבל אני לא רואה כל כך את זה – לכן ביקשתי את הגרף של השונות עצמה.

        1. ינון זו השונות עד כדי קבוע. מה זה משנה?

          1. לא היה לי טריוויאלי לראות את הקשר, אבל זה כמובן נכון.

  23. מעניין מאוד יואב, תודה רבה.
    כשהיינו עוד ב-2017 הייתה עליונות קלה של המזרח, שכעת התהפכה, ככל הנראה לא מעט בזכות הנפילה של הניקס והדשדוש המתמשך של שארלוט ודטרויט, כשבמקביל במערב נהייתה תחרות יחסית צמודה של קבוצות ה״בטן״ על כניסה לפלייאוף (הרבה בזכו הקליפרס ופליקנס שבדד ליין לא הלכו על מהלכי מכירות חיסול למיניהם).

    מאמין שבסוף העונה שוב המאזן של המערב על המזרחיהיה עדיף, אבל בפער יחסית מינימאלי.

  24. פששש.. איזו עבודה. סחתיין עליך.

    היה כיף לקרוא.

כתיבת תגובה

סגירת תפריט