מגמות הסקרים של הבחירות לכנסת ה-20 (חלק 1)

הודעה חשובה לפני שהפוסט יתחיל: בסוף השבוע יתקיים מפגש דיון בחיזוי תוצאות הבחירות (להרשמה, חינם, למפגש – הקליקו כאן). המפגש מיועד לאנשים העוסקים בניתוח נתונים ומאורגן במטרה לדון בחיזוי תוצאות הבחירות, וגם כדי לעודד אתכם להשתתף בתחרות האיגוד לניבוי תוצאות הבחירות 2015 (תחרות עם פרס בגובה 1,250 ש"ח, ללא דמי השתתפות – לפרטים נוספים והשתתפות, קיראו עוד כאן). ונתחיל את הפוסט:

היום מתחיל השבוע האחרון שלפני הבחירות. אני בטוח שכולנו נרצה להסתכל על הסקרים האחרונים בתקווה לדעת מה יקרה בשבוע הבא. אבל דווקא עכשיו זה הזמן לקחת צעד אחורה, ולהסתכל על התמונה הגדולה. וכך היא נראית (הקליקו על התמונה לגירסה מוגדלת, והסברים מופיעים בהמשך):

2015-03-08 12_47_13-Clipboard

הגרף שמוצג נוצר בעזרת אתר האינטרנט שבנה יוני סידי (הוא בנה את האתר בעזרת שפת R לתכנות סטטיסטי), אשר מסתמך על נתוני הסקרים שאסף נחמיה גרשוני.

הגרף למעלה מאפשר לנו לראות את מגמת התמיכה במפלגות השונות על פני החודש וחצי האחרונים.

בגרף אנחנו רואים תרשים פיזור נפרד לכל מפלגה. בציר ה- X אנחנו רואים את תאריך ביצוע הסקר, ובציר ה- Y את מספר המנדטים שקיבלה המפלגה מהסקר. כל נקודה מציגה תחזית מנדטים למפלגה חברת סקרים שונה. הקו שמולבש על גבי הגרף הוא סוג של "קו מגמה" (לא נכנס לאיך שהוא מחושב, אבל אפשר לחשוב עליו כמו על ממוצע מקומי לטווח ערכים מסויים).

הגרף עוזר לנו לזהות את טווח הוודאות של הסוקרים השונים לגבי המפלגות השונות, והאם לאורך זמן אנחנו רואים התחזקות או היחלשות של "מרכז" תחזית המנדטים של המפלגות השונות. ברשותכם, אציע פרשנות למגמת מספר המנדטים שמקבלים המפלגות השונות, על סמך מה שהגרף מראה לנו:

  • הליכוד – הייתה מגמת היחלשות של המפלגה במהלך פברואר. אבל בשבועיים האחרנים המצב די יציב.
  • המחנה הציוני – המפלגה איבדה קצת מכוחה בסוף ינואר, אבל מאז היא שומרת באופן יחסית יציב על אותו מספר מנדטים.
  • יש עתיד – מצליחה באופן עיקבי (ודי מרשים, אני מוכרח להודות) להתחזק בסקרים. בשבועיים האחרונים נראה שיש התייצבות בעליה.
  • הבית היהודי – נראה שהם רק נחלשו בחודש וחצי האחרונים, ובשבועיים האחרונים נראה שהם התייצבו.
  • יחד – בהתחלה הם התנדנדו על אי-מעבר של אחוז החסימה, אבל בשבועות האחרונים הם הצליחו לשמור על ה-4 מנדטים שלהם בסקרים באופן יחסית עיקבי.
  • שאר המפלגות נראות ללא מגמה – כולנו, ישראל ביתנו, שס, יהדות התורה, מרצ, רשימה משותפת ערבית – כולם שומרים על יחסית יציבות בתחזיות המנדטים.

הדבר שלא מופיע בסקרים, והוא בעל חשיבות עצומה, היא השאלה של אחוז ההצבעה במגזרים השונים. ייתכן והסקרים שיש לנו לא מצליחים לתפוס את ההשפעה של איחוד המפלגות הערביות, ושביום הבחירות נגלה שהמפלגה שלהם תקבל הרבה יותר קולות ממה שהופיע בכל הסקרים. באופן דומה, מפלגת יחד נמצאת על 4 מנדטים באופן די עיקבי, מה שאומר שעליה אפילו קטנה של אחוז ההצבעה, ומעט היסוס מצד המצביעים שלה – עשוי להותיר אותם מחוץ לכנסת.

וכמובן, יכול להיות שכל הסוקרים מפספסים תתי אוכלוסיות או תופעות, אשר יפתיעו אותנו ביום הבחירות עצמו (כמו שהיה עם ההצלחה המדהימה של יש עתיד בבחירות הקודמות) – מה שהסברתי בעבר במאמר על שגיאות שאפשר ושאי אפשר להציג.

הבחירות האלה חשובות ומעניינות – צאו עם המשפחה והחברים ולכו להצביע!

(חלק 2 של הפוסט יגיעו בעוד שבוע אחרי שתוצאות התחזיות של משתתפים בתחרות החיזוי יגיעו)

מפלגת עלה ירוק עותרת כנגד מכוני הסקרים וערוצי החדשות – זה מעניין

הפוסט הבא הוא פחות מהסוג של "אי תראו, שגיאה!", ועוסק בנושא עמוק. תביאו כוס קפה, ותקראו בהנאה.

בסוף פברואר, מפלגת עלה ירוק (עם עורכי הדין חגי קלעי ואוהד רוזן) הגישו עתירה כנגד עיתון "הארץ", ידיעות אחרונות, ישראל היום, NRG, וואלה!, רשות השידור, חברת החדשות, ערוץ הכנסת, ערוץ 10, ומכוני הסקרים. בעתירה ביקשו שערוצי החדשות יפסיקו לפרסם תוצאות סקרים מעובדות למנדטים, ויעברו לפרסום תוצאות הסקרים הגולמיות באחוזים.

לצערי לא הצלחתי למצוא את קובץ העתירה המקורית (למישהו יש קישור?), ולכן אני מסתמך על

עידכון: שלחו אלי את העתירה המקורית, אתם מוזמנים להוריד אותה מכאן: Document (158)

ואף הופיעו דיווחים שלה באתרי החדשות. לדוגמא כאן (וגם כאן וכאן).

בעתירה הועלו שלל טענות, בין השאר נכתב כי:

"המצג שיוצרים המשיבים אינו משקף את המציאות אלא מתערב בה, ומעודד את הבוחרים שלא להצביע למפלגות העומדות על סף אחוז החסימה. העדר הדיווח על העליה המתמדת במצביעים הפוטנציאליים של אותן מפלגות, והצגתן כמי שזוכות ל חמישה אחוזים מהקולות, מעביר מסר שגוי לציבור כי אין כל סיכוי לכניסת מפלגות אלו לכנסת. התנהלות זו, בין אם במחדל ובין אם בכוונת מכוון עומדת בניגוד לדין, פוגעת פגיעה קשה בעיקרון החוקתי של שיוויון הבחירות, ומשפיעה השפעה לא ראויה ומוטה על ציבור הבוחרים והבוחרות".

ובכן מסתבר שיו"ר ועדת הבחירות המרכזית, השופט סלימן ג'ובראן, השיב אתמול (04/03/2015) לעתירה. הנה מה שנכתב:

החלטת ביניים -סלים ג'ובראן

הסיכום שלי של תגובת השופט:

  1. השופט דחה את הטענה שאי הכללה של "עלה ירוק" בסקרים שמעבירים הופכים אותם לפסולים. זאת משום שהעותרים לא הביאו חוות דעת סטטיסטית מקצועית בנושא, ואי לכך אין השופט יכול לקבל את דעת העותרים בנושא, והוא דוחה את טענתם.
  2. העתירה חשובה, אך לא תספיק להשפיע על הבחירות הקרובות. המשך הדיון יהיה ב- 11/03/2015
  3. השופט חושב (אך "מבלי להכריע בדבר"!) שיש מקום להתייחס למידת קירבתן של מפלגות שלא עברו את אחוז החסימה בסקר בתוצאות שמוצגות.

הסיקור של הכלכלה האמיתית – ודעתי

בדיווח שהופיע היום באתר "הכלכלה האמיתית" נכתבו כמה דברים בנושא. אפשר להגיב להרבה דברים שנאמרו שם, אני אתמקד ואתייחס למשפט המסכם שאיני מסכים איתו. הם כתבו:

אתמול החליט יו"ר ועדת הבחירות המרכזית,סלימן ג'ובראן, לקבל את עיקרי הטענות בעתירה.ערוצי התקשורת יחויבו לפיכך לפרסם את תוצאות הסקרים האמיתיות באחוזים במקום בעיבוד למנדטים.

זו לחלוטין לא הפרשנות שלי למה שכבוד השופט כתב. לפי הבנתי, השופט דחה כמה טענות בעתירה, ולגביהטענה המרכזית על החשיבות של הצגת קירבת המפלגות לאחוז החסימה – הוא חושב שראוי לקבל חוות דעת מומחית (ולכך הוא מזמין את מכוני הסקרים להגיב).

כך או אחרת, אני מסופק שהתוצאה של העתירה הזו תהיה הצגה של תוצאות הסקרים באחוזים ולא במנדטים. היות ותוצאות הבחירות ימדדו במנדטים, סביר מאד להציג לציבור את תוצאות הסקרים במנדטים ולא באחוזים.

עם זאת, לגבי הביטוי "עיבוד למנדטים", כוונת הכותבים בכלכלה האמיתית (אני משער) היא לא רק להמרה של אחוזים ל- 120 מנדטים, אלא השינויים הדרושים בתוצאות הסקר כדי לתת משקל שונה לנתונים על מנת שאלו ישקפו נאמנה יותר את אוכלוסיית ישראל ואת תוצאות הבחירות (הסברתי על הנושא של הטייה יותר בהרחבה כאן). לדעתי – אני חושב שזה יהיה פסול מאד להציג בתקשורת את תוצאות הנתונים הגולמיים ללא עיבוד מתאים. אני מסכים שהתהליך הזה כולל שיקול דעת אישי, ולכן עלול לכלול טעויות והטיות. עם זאת, לצערי, אני לא יודע על דרך טובה יותר לקבל תחזית "סבירה" לתוצאות הבחירות (היות והתוצאות הגולמיות צפויות להיות מאד מאד לא מייצגות לתוצאות האמת).

מצד שני, יכול להיות מעניין לראות האם השופט יחייב את מכוני הסקרים להציג את הנתונים הגולמיים ואת שיטות הסקירה. מצד אחד, אני משוכנע שמכוני הסקרים ילחמו לגבי זה היות ודרכי העיבוד מהווים סודות מקצועיים עבורם. אני לא יודע איזה שיקול ינצח "זכות הציבור לדעת" או "חופש העיסוק" הכולל שמירה על סודות מסחריים.

אני לא יודע איך העתירה הזו תסתיים – אבל כבר עכשיו היא מעלה סוגיות מעניינות מאד לבחינה משפטית – שכשלעצמו זה דבר טוב.

129% מהציבור רוצים שר אוצר…

הפוסט הזה הגיע מהגולש שובל צורן אשר דיווח במסגרת תחרות הסקר המוזר (אתם גם מוזמנים להגיש דיווח כאן, והמדווח על הסקר ה"מוזר" ביותר יזכה ב- 500 ש"ח. אין עלות להשתתפות).

 

הגרף הבא פורסם בדף הפייסבוק של המחנה הציוני, ומגלה שסך הכל 127% מהציבור רוצים בשר אוצר:

2015-03-04 12_11_24-Clipboard

 

"הצעירים בישראל בחרו – מהפך" – אך ללא קשר בין מספרים לעמודות

הפוסט הזה הגיע מהגולש שובל צורן אשר דיווח במסגרת תחרות הסקר המוזר (אתם גם מוזמנים להגיש דיווח כאן, והמדווח על הסקר ה"מוזר" ביותר יזכה ב- 500 ש"ח. אין עלות להשתתפות).

הגרף הבא פורסם בדף הפייסבוק של יצחק הרצוג:

2015-03-04 08_57_12-Clipboard

על הסקר כתב שובל (בצדק):

אין כל פרופורציה בין המספרים והעמודות; למרות שההפרשים בין המפלגות למטה קבועים(1) המרחקים בין עמודותיהן שונים, וההפרש בין 9% ל-20% לחלוטין לא פרופורציונלי. בנוסף, כמובן שההצגה המגמתית ממשיכה כשהם מציגים את עצמם – כש30% הרבה יותר גדול ממה שאמור להיות. אפשר גם לשים לב שעמודת ה30% *רחבה* יותר.

ואני אוסיף שהעמודה של המחנה הציוני מופיעה בצבע אחר (ניחא), אבל יותר חשוב מזה, שהיו כמה סקרי תיכונים שונים, וכל אחד החליט לשקלל אותם אחרת (לדוגמא, יש תוצאות אחרות שבהם יש עתיד זוכה כמנצחת המועדפת).

 

סקר ב- nrg. בסקר הקודם היו 117 מנדטים והשבוע 121 מנדטים

הפוסט הבא הגיע מהגולש מני נהון אשר דיווח במסגרת תחרות הסקר המוזר (אתם גם מוזמנים להגיש דיווח כאן, והמדווח על הסקר ה"מוזר" ביותר יזכה ב- 500 ש"ח. אין עלות להשתתפות).

על הסקר שפורסם ב- nrg ב 17/02/2015. מני כתב:

איך אפשר שבסקר של שבוע שעבר ישנם סה"כ 117 מנדטים לכנסת והשבוע 121 כשבפועל ישנם רק 120 מנדטים??

הנה הגרף שהופיע בעמוד האינטרנט:

591

תחרות לחיזוי תוצאות הבחירות – ההשתתפות בחינם – הפרס הוא 1250 ש"ח

האיגוד הישראלי לסטטיסטיקה, בחסות חברת איסתרא מחקר, הכריז על תחרות לניבוי תוצאות הבחירות לכנסת ה-20, כאשר הזוכה בתחזית הטובה ביותר יקבל 1,250 ש"ח. אם אתם מעוניינים להצטרף כנתוני חסות לתחרות הזו (אשר צפויה לזכות להד תקשורתי רב כאשר נפרסם את תוצאות התחזיות לפני הבחירות), אנא שילחו לי אימייל ([email protected]).

אני מעודד אתכם להפיץ את המידע על התחרות במוסדותיכם ובמקומות העבודה שלכם.

כדי להשתתף, כל שעליכם לעשות הוא לרשום כמה מנדטים תקבל כל מפלגה, לתת את פרטיכם האישיים (שם/אימייל/וכו'), ולהסביר כיצד להגיע לתחזיות המנדטים הללו (כולל פירוט ברור של המודלים הסטטיסטיים וההנחות לבחירתם). התאריך האחרון להגשה הוא 14 במרס, שלושה ימים לפני הבחירות (ומן הסתם, זה יהיה הזמן עם הכי הרבה מידע עדכני בשביל ביצוע התחזיות). את הפרטים עליכם למלא בטופס שכאן:

http://www.statistics.org.il/elections2015

בשביל נתוני סקרים עדכניים, אני מציע לכם להסתכל על הרשימה שמנהל נחמיה גרשוני, בכתובת:
https://docs.google.com/spreadsheets/d/13XIAgbVk_c2Zxxa5xsR0EJFb6W9HMQpAjBImtFxZdxo/edit#gid=0

מטרת התחרות היא לעודד חשיבה כמותית ושימוש בכלים סטטיסטים בבעיה אקטואלית, וכמובן להפיץ את החשיבות של סטטיסטיקה בקרב הציבור בישראל.

כתבה על התחרות גם פורסמה ב-ynet.

(גילוי נאות: אני חבר וועד באיגוד הסטטיסטיקאים הישראלי)

 

התרשים התלת מימדי של ״ישראל בוחרת״ בערוץ הראשון

(גם אתם מוזמנים לשלוח דיווח על "סקר מוזר", בחינם, ומי ששולח את הדיווח הכי "מוצלח" יקבל פרס של 500 ש"ח)

בסגרת הפרס על "הסקר המוזר", ליאון אברבוך שלח לנו את הביקורת הבאה:

הסקר פורסם במסגרת אירוח "פרוייקט 61" בערוץ הראשון, והסקר המוצג הוא שיקלול סקרים שהם ביצעו. (תצלומי מסך מהעמוד שלהם). הנה צילום של הגרפים:

Untitled

-בעיות-

  • הגרפים אלכסוניים: גורם לשתי עמודות באותו הגובה להראות בגובה שונה
  • הגרפים לא פרופורציונליים:
    • עמודה בגובה 5 מגיע לגובה של כשלושה רבעים מתוך עמודה בגובה 13
    • לעמודה בגובה 0 יש גובה של כמחצית מ-5 (!)
    • עמודה בגובה 23 קטנה בהרבה מעמודה בגובה 24
    • בתוכנית בחרו להציג את הגרף בשקפים נפרדים, אבל גם בין השקפים אין התאמה, עמודה בגובה 13 משקף אחד בעלת גובה זהה לעמודה בעלת גובה 8 ואף גבוהה יותר מעמודה בגובה 16 מהשקף השלישי
  • ובנוסף להכל – העמודות לא לפי גובה יורד

מפרויקט 61 נמסר: זוהי התבנית הקבועה של הצגת הסקרים בערוץ הראשון, ולפרויקט 61 אין על כך שליטה.

 

מצאתם דיווח מצחיק/מוזר/שגוי של סקר בחירות? שלחו אותו (ללא עלות) בשביל סיכוי לפרס בגובה 500 ₪

(קובץ PDF עם ההודעה)

האיגוד הישראלי לסטטיסטיקה מזמין את הציבור לדווח על סקרים "מוזרים" (משלוח הדיווח אינו עולה כסף).

הפרס מיועד לעודד קריאה ביקורתית של מידע מסקרים. סקרים מתאימים יפורסמו כאן, והדיווח המוזר מכולם יזכה בפרס בסך 500 ₪ (אם כמה אנשים ידווחו על אותו הסקר, אז הראשון שדיווח הוא הזוכה. אי לכך, שווה להכנס לאתר ולוודא שהסקר עדיין לא דווח כאן).

וועדת הפרס מורכבת מ: פרופסור רון קנת, פרופסור רונית ניראל, ודוקטור יאיר גולברג. הזוכה יקבל תעודה ופרס כספי בסך 500 ₪. התעודה תוענק על ידי נשיא האיגוד בכנס האיגוד שיערך לקראת סוף חודש מאי בלשכה המרכזית לסטטיסטיקה בירושלים.

את הדוגמאות (ביחד עם תיאור קצר למה לדעתך היא ראויה לפרס) יש לשלוח בטופס המופיע ב:

http://www.statistics.org.il/sekermuzar2015

המועד האחרון למשלוח דיווח על הסקרים הם עד ה- 14 למרץ, יום שבת, בחצות.

דוגמא טובה  לסקר "מוזר" הוא כמובן זה שפורסם ב  19/12/2014 במעריב :

seker_maariv

התרשים הזה שופע עיוותים נוספים של קשר בין מספרים לעמודות:

  • סכום המנדטים שבגרף הוא 122 (במקום 120)
  • יש עתיד (10) בגובה של העבודה (23), וגבוהה מהליכוד (21) והבית היהודי (16(
  • כולנו (10) נמוכה מיש עתיד (10), אבל בגובה של הבית היהודי (16(
  • רעם תעל (7) בגובה של חד"ש (5), אבל נמוכים ממרצ (7), וכולם נמוכים מיהדות התורה (7) ונמוכים בסידרי גודל מישראל ביתנו (8).
  • הגובה של הסיפרה של מספר המנדטים של אלי ישי גבוה מהמספר של ש"ס (למרות שהעמודות באותו הגובה)

החלטתי לוותר על פירסום טווחי מנדטים בתוצאות של סקר בודד

בשבועיים האחרונים לא פירסמתי פוסטים חדשים. בעקבות דיונים שקיימתי עם סוקרים מקצועיים (אני משמיט את שמם מתוך כבוד) השתכנעתי שעדיף להימנע מפירסום (מה שכיניתי בפוסטים קודמים) טווח מנדטים סביר.

מבלי להכנס לפרטים, נתברר לי שבשל המורכבות של בניית תחזיות הסקרים, אינני יכול להסתמך על ההנחות הפשטניות שהצגתי בפוסטים הקודמים בשביל בניית טווחי המנדטים הסבירים. אי לכך, אני מעדיף מעכשיו והילך שלא להוסיף טווחי טעות, ולהשאיר את ההצגה הנוכחית של סקרים כפי שהיא.

אז מה אפשר לעשות עם סקר בודד?
כנראה משהו דומה למה שעשינו עד היום. להסתכל על התוצאות של סקר, להתייחס אליו כאילו הוא נכון ולנסות לתת לו פרשנות (מתוך ידיעה שעלולות להיות בו טעויות, שאיננו יודעים מראש כיצד לכמת אותן).

האם במצב כזה עדיף להסתכל על יותר מסקר אחד? כנראה שכן, נדון בזה עוד בפוסטים עתידיים.
ובכל מקרה, ראוי להציג את מה שיש באופן ראוי ומדוייק, ועל שני אלו ניתן דגש בחודשים הקרובים שעד לבחירות.