מִתְאָם פירסון, או מקדם המתאם של פירסון, הוא מדד לקשר ליניארי בין שני משתנים כמותיים. הוא נקרא על שם קרל פירסון.
הרעיון התחיל אצל פרנסיס גאלטון במאה ה-19, שהתמצא ברישום גרפי של נתונים. פירסון עיבד את הרעיון והציג נוסחה מקובלת לחישוב המדד. רונלד פישר חישב את התפלגות המדד בתנאי התפלגות נורמלית, מה שאיפשר הסקה סטטיסטית על ערכו.
במדגם של זוגות ערכים (x_i, y_i) מקדם המתאם r מודד עד כמה שינויים ב-X תואמים לשינויים ב-Y. באופן פורמלי, r הוא יחס בין סכום המכפלות של חריגות מהממוצע לבין מכפלת השורשים של סכומי ריבועי החריגות. הממוצע הוא הערך הממוצע של כל משתנה, וסטיית תקן היא מדד לפיזור הערכים סביב הממוצע.
המקדם סימטרי: המתאם בין X ל-Y שווה בערכו למתאם בין Y ל-X. אם המשתנים אינם כמותיים (כלומר אינם נמדדים במספרים ראויים), לפרשנות של r אין משמעות.
ערכי r נעים בין -1 ל+1. ערך קרוב ל+1 מצביע על קשר ליניארי חיובי חזק. ערך קרוב ל-1- מצביע על קשר ליניארי שלילי חזק. ערכים קרובים לאפס מעידים על קשר ליניארי חלש.
עם זאת, r=0 אינו אומר שאין קשר כלל. קיים מקרה שבו X מקבל ערכים מ-10- עד 10 ו-Y שווה ל־X בריבוע; אז r יכול להיות אפס אף על פי שיש קשר חד-משמעי שאינו קווי. כמו כן, ערך קרוב ל־1 אינו מוכיח קשר סיבתי בין המשתנים.
ברמה הסתברותית מקדם המתאם ההסתברותי ρ מוגדר כיחס בין השונות המשותפת (covariance) של X ו-Y לבין מכפלת סטיות התקן שלהם. כאן E מייצג תוחלת, ו-cov את השונות המשותפת. אם המשתנים בלתי תלויים הם גם בלתי מתואמים, אך ההפוך אינו נכון (קיימים משתנים בלתי מתואמים שאינם בלתי תלויים).
יש הרחבות רבות למקדם פירסון. מקדם ספירמן מחשב מתאם לפי דרגות (הערכים ממוקמים לפי סדרם). פרשנות ערכי ספירמן דומה לשימוש בפירסון, אך ערך 1 מצביע על קשר מונוטוני חזק, לא בהכרח ליניארי. פירסון גם ניסה להחיל את המדד על משתנים קטגוריים לפי סולם סדר, ופיתח מדדים כגון מקדם טטרכרי ומקדם פוליכורי. קיימים עוד סוגי מתאמים מותאמים או ממושקלים למצבים שונים.
מִתְאָם פירסון הוא מספר שמראה כמה שני דברים נכנסים ביחד.
הוא מתאים לשני דברים שמודדים במספרים.
המדד נקרא על שם קרל פירסון.
המספר בין -1 ל+1. +1 אומר שיש קשר חזק ואחיד באותו כיוון. -1 אומר שיש קשר חזק אבל בכיוון הפוך. 0 אומר שאין קשר קווי (קשר בקו ישר).
אפילו אם המספר קרוב ל-0, יכול להיות קשר אחר שאינו קווי. לדוגמה: אם X הם המספרים מ-10- עד 10, ו-Y הוא X בריבוע (כלומר X*X), יש קשר ברור. אבל המדד יכול להראות 0, כי הקשר לא קו ישר.
קיים גם מקדם שנקרא ספירמן. הוא מסתכל על מיקום הערכים בסדר, במקום על המספרים עצמם.
פירסון גם ניסח דרכים למדוד קשרים בין סוגים אחרים של נתונים, כמו מדדים מיוחדים למשתנים עם קטגוריות.
תגובות גולשים