'עיסוי נתונים' הוא כשל לוגי, טעות בהסקת מסקנות. זהו סוג של שגיאות דגימה, כלומר כשמדגם לא מייצג את כל האוכלוסייה.
הכשל מתרחש כשמנסים להציג סטטיסטיקה בדרכים שמדגישות רק חלק מהתוצאות. עושים סיווג או כימות מחדש לחלק קטן של התוצאות, ולא מבצעים את אותה בדיקה בקטגוריות אחרות.
• מחקר בין מכורים להרואין הראה ש‑90% מהם החלו לעשן חשיש ולשתות צעירים. זה גבוה מהאחוז באוכלוסייה הכללית לאותו גיל. קשה להסיק מכך שחשיש ושתייה גורמים להתמכרות להרואין. (הנתון המוסתר הוא כמה מהמעשנים והשותים בכלל האוכלוסייה הופכים למכורים להרואין.)
• מחקרים מצביעים שסרטן השד פוגע בכ־8% מהנשים. בקבוצת נשים מתחת לגיל 20 שטופלה במטאמיזול ו'גלולות שום' השכיחות היתה 0.5%. זה לא מוכיח שהטיפול מגן על כל הנשים. (הנתון המוסתר הוא שיעור החולות בקרב כל הנשים שטופלו בכל הגילים.)
'עיסוי נתונים' זה טעות בהסקת מסקנות. זאת שגיאת דגימה. שגיאת דגימה היא כשמדגם לא מייצג את כולם.
הרעיון: בוחרים רק חלק מהנתונים ומראים רק אותם. כך הנתון נראה שונה ממה שהוא באמת.
• במחקר על מכורים להרואין נאמר ש‑90% מהם עישנו חשיש ושתו צעירים. זה גבוה לעומת כולם. זה לא אומר שחשיש ושתייה גרמו להתמכרות. (הנתון המוסתר הוא כמה מהמעשנים הופכים למכורים.)
• יש נתון שאומר שסרטן השד פוגע בכ‑8% מהנשים. בקבוצה קטנה של נשים מתחת לגיל 20 שטופלו בתרופות הייתה רק 0.5% חולה. לא נכון לומר שהתרופות מונעות את המחלה. (הנתון המוסתר הוא שיעור החולות בקרב כל הנשים שקיבלו את הטיפול.)
תגובות גולשים