00
עדכונים

מנוי במייל

קבלת עדכונים על רשומות חדשות ישירות לתיבת האמייל
יש להזין אימייל תקין על מנת להרשם לעדכונים
ברגעים אלו נשלח אליך אימייל לאישור/ביטול ההרשמה
*שים/י לב, מרגע עשית מנוי, כותב/ת הבלוג יוכל לראות את כתובת האמייל שלך ברשימת העוקבים.
X

{ [ ( בניית עזר ) ] } - מתמטיקה, תכנות, סיכומים לבחינות הבגרות ואקסל

<<<<
 
   מתמטיקה 
   ונושאים 
   נוספים 
 
משפטים, נוסחאות ומתמטיקאים על ציר הזמן  תורת המספרים  תכנות C++/C  קומבינטוריקה  מתמטיקה/EXCEL  אסטרונומיה

משפטים בגאומטריה לבחינת הבגרות במתמטיקה - הדגמה ויזואלית ופתרונות לשאלות מהבגרות ומספרי הלימוד 
 
  אהרן מוריאלי  תורת המספריםסקירות מתמטיות-היסטוריות ספרים ריבועי קסם  הקסם שבמספרים מיהו מי-חידות היגיון רשימה
   המשפט האחרון של פרמה מספרי קרמייקל מספרים משוכללים מספרים ראשוניים פרפראות מתמטיות המספר ומחלקיו
   
מספרי מרסן   פעילויות בלוח הכפל  
  ערבית   לוחות פעלים במערכת הפעל הערבי, תחביר ודקדוק       -     טבלת אותיות וניקוד בערבית 
  סרגלי הפועל והתחביר הערבי - רות בן-אבי   -     חלוקה לוגית של האותיות בערבית - ניצה בינדר
  מאגר מת"ל-
  חומרי למידה
  אסטרטגיות למידה/הוראה/חשיבה/קריאה/אוריינות ---מדע וטכנולוגיה מתמטיקה פיזיקה כימיה גנטיקה     
  היסטוריה וציונות  יהדות  תנ"ך גאוגרפיה ---אזרחות ספרות---לשון   ערבית   אנגלית      
שכיחות אותיות בשפה העבריתפרדוקסים סמנטיים ולוגיים

סטטיסטיקה - מדדי מרכז, מדדי פיזור, מדדי קשר ובדיקת השערות (הסקה סטטיסטית)

תודה למאי.

סיכום וחזרה בנושאי סטטיסטיקה. ראשי פרקים:
סולמות מדידה, שכיחויות, מדדי מרכז, מדדי פיזור, התפלגות נורמלית,
מדדי קשר, שלבים בבדיקת השערות ומבחני ניתוח שונות (הסקה סטטיסטית).
 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

כקובץ טקסט:

חזרה על הסתברות:

 

סטטיסטיקה:

סטטיסטיקה היא המדע להסבר השונות, בדיקה של הבדלים שונים באוכלוסיה ובמדגם מהאוכלוסיה.

מושגים ראשוניים:

אוכלוסייה ומדגם: יכולה להיות סופית ואינסופית. כאשר נרצה לדבר על אוכלוסיה כולה נשתמש בהגדרה זו וכאשר נרצה לבחון קבוצה מסוימת מתוך האוכלוסייה נאמר מדגם. ישנו מדגם עם שכבות ובו בודקים בכל קבוצה נבחרת משהו מסוין בכל שכבה הבחירה תהיה רנדומלית.

משתנה: יכול לקבל כל מספר מתוך תחום ההגדרה של המשתנה. משתנה יכול להיות בדיד או רציף.

משתנה איכותי: משתנה שאין לו מספריות מתמטית, כלומר שם, תעודת זהות וכדומה, סולם שמי למשל.

משתנה כמותי: מתחלק לשניים:

משתנה רציף: כאשר יש אפשרות לחלקו לשברים למשל אחוז הילדים המעשנים בכיתה יכול להיות 73.6 אחוז או למשל משקל של הילד הוא 36.57 ק"ג גם כאן מוצג משתנה רציף.

משתנה בדיד: כאשר אין אפשרות לחלקו לשברים למשל מספר המחשבים בכיתה יכול להיות רק מספר עגול.

משתנים יהיו תלויים זה בזה ונוכל לבדוק את היחסים בניהם, כיצד הם משפיעים או לא משפיעים אחד על השני ומה הקשר בניהם. קורלציה למשל מתרחשת כאשר הקשר לא ברור אבל ידוע שיש קשר מסוים.

סולמות מדידה:

o          סולם שמי, סולם נומינלי:

-           מייצג קטגוריות מובחנות של המשתנה ולערך המספרי אם קיים אין משמעות.

-           המידע מאפשר זהות.

-           דוגמאות-צבע שיעור, אדם 1 אדם 2

-           סולם זה מיוצג על ידי פונקציה חד חד ערכית

-           מותר להוסיף קבוע, להפכיל במספר חיובי ושלילי

-           אסור להעלות בריבוע

-           יש לשמור על הבחנה בין נתונים בעלי זהות שונה כלומרB≠A

o          סולם סדר, סולם אורדינאלי:

-           מייצג זהות לערכים והיררכיה בניהם אבל אין משמעות לגודל המרווחים בין המספרים

-           המידע מאפשר זהות וסדר

-           דוגמאות-מיקום בתחרות,דרגות בצבא

-           סולם זה מיוצג על ידי פונקציה מונוטונית עולה ממש

-           מותר להוסיף קבוע ולהכפיל במספר חיובי

-           אסור להכפיל במספר שלילי ולהעלות בריבוע

-           יש לשמור על סדר הנתונים כלומרA>B

-           בתוך סולם סדר ישנו סולם סדר-רווח משופר-כמו סולם סדר אך בעל חמש רמות ומעלה של ערכים בשאלון דירוגי, כמו מידת שביעות הרצון מ-1 עד-7.

o          סולם רווח, סולם אינטרוואלי:

-           מייצג את מידת הרווחים בין ערכי המשתנה הנמדד ויש משמעות לרווח. האפס בסולם זה הוא שרירותי ואין אפס קבוע

-           המידע מאפשר זהות, סדר והפרש

-           דוגמאות-טמפרטורה בצלזיוס, גובה פני המים

-           סולם זה מיוצג על ידי פונקציה לינאריתT(X)=BX+A B>0

-           מותר להוסיף קבוע והכפיל במספר חיובי

-           אסור להכפיל במספר שלילי ולהעלות בריבוע

-           יש לשמור על היחס בין הרווחיםD-C=B-A

o          סולם מנה, סולם יחס, סולם רציונאלי:

-           מייצג תכונות פיזיקאליות, יש אפס אמיתי קבוע.

-           המידע מאפשר זהות,סדר,הפרש ויחס

-           דוגמאות-משקל, נפח, מרחק,משכורת בשקלים

-           סולם זה מיוצג על ידי פונקציה לינארית שעוברת בנקודה (0,0) T(X)=BX.

-           מותר להכפיל במספר חיובי

-           אסור להוסיף קבוע, להכפיל במספר שלילי ולהעלות בריבוע.

-           יש לשמור על היחס בין הנתונים כלומרB/A=D/C.

שכיחויות:

טבלת שכיחות מתאימה למשתנה איכותי או כמותי בדיד. F(x) מייצגת שכיחות. שכיחות היא בעצם כמה מאותו משתנה יש לנו במדגם או באוכלוסיה תלוי על מה מסתכלים. CF(X) ו-F(x) מייצגים שכיחות מצטברת. ואם רוצים באחוזים שכיחות יחסית זה מסומן על ידיP כאשרP=[F(X)/N]*100.  ושכיחות יחסית מצטברת באחוזים נסמן ב-CP כאשר נשמתש באותה הנוסחא כמוP רק שf(x)=CF(X). MP תסמל את נקודת האמצע של גבול תחתון+גבול תחתון לחלק לשתיים.

גבולות מדומים- הגבול העליון של מחלקה אחת אינו מתלכד עם הגבול התחתון של מחלקה שמתחת. למשל 39-40 ואז 41-42.

גבולות אמיתיים- הגבול העליון של כל מחלקה מתלכד עם הגבול התחתון של המחלקה שמתחתיה.

סוגי עקומות התפלגות:

התפלגות א-סימטרית חיובית: ציון מבחן קשה                        התפלגות א-סימטרית שלילית: ציון מבחן קל

 

   התפלגות עקומתU:                                                           עקומה אחידה:

 

התפלגות סימטרית- התפלגות נורמלית:

 

 

 

מדדי מרכז:

o          שכיח:

-           נסמן ב-MO

-           אפשר להשתמש בו מסולם שמי ומעלה

-           הוא מסמל את הנתון המופיע בשכיחות הכי גבוהה, קורה הכי הרבה ויכולים להיות שניים ויותר

-           הוא לא מושפע מערכים קיצוניים

-           אי אפשר לעשות עליו חישובים

-           יעיל בהתפלגות א-סימטרית

-           בהוספה או הכפלה בקבוע של כל האיברים נוסיף אותו הדבר לשכיח

o          חציון:

-           נסמן ב-MD

-           אפשר להשתמש בו מסולם סדר ומעלה

-           הוא מסמל את הנקודה בה חצי מערכי ההתפלגות קטנים ממנה וחצי גדולים ממנה

-           הוא לא מושפע מערכים קיצוניים

-           לא ניתן לעשות עליו חישובים

-           ערך יחיד

-           בהוספה והכפלה של קבוע בכל האיברים נוסיף אותו הדבר לחציון

o          ממוצע:

-           נסמן ב-

-           אפשר להשתמש בו מסולם רווח ומעלה

-           הוא מסמל את סכום אברי ההתפלגות חלקי מספר האיברים

-           הנוסחא שבה נשתמש היא

-           נוסחאות נוספות: ממוצע משוכלל

                        ממוצע משוכלל בשימוש נקודת האמצע

-           הוא מושפע מאוד מערכים קיצוניים

-           סכום הסטיות מהממוצע שלא בערך מוחלט הוא-0

-           ניתן לעשות עליו חישובים

-           ערך יחיד

-           בהוספה והכפלה של קבוע לכל האבירים נוסיף אותו הדבר לממוצע

o          אמצע טווח:

-           נסמן ב-MR

-           אפשר להשתמש בו מסולם רווח ומעלה

-           הוא מסמל ממוצע שני הערכים הקיצוניים בהתפלגות

-           הנוסחא שבה נשתמש היא

-           הוא מושפע רק מערכים קיצוניים

-           לא ניתן לעשות עליו חישובים

-           ערך יחיד

-           בהוספה והכפלה של קבוע לכל האברים נוסיף אותו הדבר לאמצע הטווח

פונקציית הפסד:

-           מספר השגיאות: בודקים לכל תצפית האם קיימת שגיאה ביחס למדד, השכיח הוא הטוב ביותר משום שיש בו הכי פחות שגיאות.

-           סכום הסטיות מוחלטות: מינימום הפסד בחציון מחשבים כך 

-           גודל הסטייה המקסימלית: מחשבים כך  ואמצע טווח הוא ההפסד המינימלי

-           סכום ריבועי הסטיות: מינימום הפסד בממוצע ונחשב כך 

מדדי פיזור:

o          טווח:

-           מסמל את המרחק בין הערך הגבוה ביותר בהתפלגות לערך הנמוך ביותר בתפלגות

-           אפשר להשתמש בו מסולם סדר ומעלה

-           הוא רגיש רק לערכים קיצוניים

-           נחשב אותו כך

-           בהוספה או החסרה של קבוע הטווח לא ישתנה

-           בהכפלה או חלוקה בקבוע הטווח ישתנה בהתאם פי הקבוע

o          טווח בין רבעוני:

-           מייצג את המרחק בין הגבול העלון של הרבעון שהשלישי כלומר הנקודה ש-25% מהמקרים מעליה ו-75% מהמקרים מתחתיה.

-           אפשר להשתמש בו מסולם סדר ומעלה

-           נחשב אותו כך

-           הוא אינו רגיש לערכים קיצוניים כלל

-           בהוספה או הפחתה של קבוע טווח בין רבעוני לא ישתנה

-           בהכפלה או חלוקה בקבוע טווח בין רבעוני השתנה בהתאם פי הקבוע

o          שונות:

-           מסמלת את ממוצע ריבועי הסטיות של ערכי ההתפלגות מן הממוצע

-           ניתן לחישוב מסולם רווח ומעלה

-           רגישה מאוד לערכים קיצוניים

-           נחשב אותה כך: לאוכלוסיה-    למדגם

-           בהוספה או הפחתה של קבוע השונות לא תשתנה

-           בהכפלה או חלוקה בקבוע השונות תשתנה פי הקבוע בריבוע

o          סטיית תקן:

-           מסמלת את שורש הריבועי של השונות

-           ניתן לחישוב מסדר רווח ומעלה

-           רגישה מאוד לערכים קיצוניים

-           נחשב אותה כך: לאוכלוסיה-   למדגם

-           בהוספה או הפחתה של קבוע סטיית התקן לא תשתנה

-           בהכפלה או חלוקה בקבוע סטיית התקן תשתנה פי הקבוע בערך מוחלט

התפלגות נורמלית:

לכל התפלגות נורמלית יכולים להיות ממוצע, סטיית תקן ושונות. כדי לייצג התפלגות נורמלית נרשום-

השטח שמתחת לעקומה מייצג את השכיחות היחסית באוכלוסיה או את ההסתברות לדגום ערך כלשהו מתוך האוכלוסיה ולכן היא מחולקת לאחוזים.

 

 

 

ציוני תקן:

o          Z מוגר כמרחק שלX מהממוצע של ההתפלגות, המרחק נמדד ביחידות של סטיית תקן

o          נחשב על ידי הנוסחא הבאה:  .

o          בממוצעZ=0. ממוצע התפלגות ציוני התקן תמיד שווה ל-0 על פי הנוסחא

o          בהוספה של קבוע חיובי או שלילי בממוצע עולה בקבוע, כל ערך עולה בקבוע וסטיית התקן לא משתנה לכןZ לא משתנה גם הוא.

o          בהכפלה של קבוע חיובי אותו הדברZ לא משתנה

o          בכפלה של קבוע שליליZ משנה סימן.

o          שונות התפלגות ציוני התקן תמיד שווה ל-1 וכך גם סטיית התקן על פי הנוסחא

מדדי קשר:

 

 

 

 

                       

 

 

o          מדד מתאם קרמר:

-           אחד מהמשתנים לפחות הוא בסולם שמי

-           המשתנה השני חייב להיום מסולם שמי או סדר

-           בודקים האם יש קשר בין המשתנים, כלומר האם השכיחות של מקרים בקטגוריות של משתנה אחד קשורה לזו של המשתנה השני על ידי טבלת שכיחויות והשוואה בין המצופה לנראה

-           אם אין קשר בין המשתנים נוכל לחשב את הערכים המצופים כך- E= 

-           מייצרים שתי טבלאות אחת של תצפית צפויה ואחת של תצפית נצפית ובודקים את ההבדל בין הטבלאות על ידי חי בריבוע כך-   ונסמן- Oi היא השכיחות הנצפית בתא ה-i ו-Ei  היא השכיחות הצפויה בתא ה-i. נשים לב כי חי בריבוע לא יכול לשמש כמדד קשר אז נהפוך אותו למדד קרמר

-           מדד קרמר מסומן כ- rc

-           ונחשבו על ידי הנוסחא הבאה:   כאשר נסמן- n מספר התצפיות ו-L המספר הנמוך בין השורות והעמודות.

-           זהו קשר חלקי שנע בין 0-אין קשר ל-1 קשר מלא

-           אםE=0 לכל התאים אז חי בריבוע=0  וגם מקדם קרמר שווה ל-0.

-           אן מספר הטורים שווה למספר השורות וההתפלגויות השוליות שוות אז מקדם קרמר יהיה 1

o          מדד מתאם ספירמן:

-           מתאים לחישוב קשר ליניארי בין דרגות של שני משתנים מסולם סדר או שהמשתנה הנמוך הוא מסולם סדר.

-           נחשב מקדם מתאם של ספירמן על ידי הנוסחא הבאה:   כאשרn מסמל את מספר הזוגות הנתונים ו-d את ההפרשים ביןו-Y כאשרו-Y הם דרגות המשתנה לפי סדר.

-           הערכים שלו נעים מ-1 ל-מינוס 1.

-           העוצמה נקבעת על פי הערך המוחלט

-           אם הדירוגים שלX ו-Y יהיו זהים אז מקדם מתאם ספירמן יהיה 1 ואם הם הפוכים אז -1.

-           סימן שלילי אומר שככל שX גדלY קטן וסימן חיובי אומר ששניהם גדלים או קטנים יחד

-           כל טרנספורמציה של משתנה שתשמור על הסדר של הערכים שלו לא תשנה את מקדם המתאם כמו למשל הוספה/הכפלה בקבוע חיובי והוספה של קבוע שלילי.

o          מדד מתאם פירסון:

-           מודד קשר ליניארי בין שני משתנים בסולם רווח ומעלה שמתפלגים נורמלית

-           הוא בודק קשר סטטיסטי בין משתנים

-           בודק קשר ליניארי בלבד

-           הוא נע בין 1 ל-מינוס 1

-           העוצמה נקבעת על ידי הערך המוחלט

-           אם יש קשר אבל הוא לא ליניארי או שאין קשר כללr יהיה שווה ל-0

-           כיוון הקשר נקבע לפי הסימן + או

-           סימן שלילי אומר שככל שX גדלY קטן וסימן חיובי אומר ששניהם גדלים או קטנים יחד

-           נחשב מקדם מתאם פירסון על ידי הנוסחא הבאה

-           אם נתונים לנוי ציוני התקן נוכל להשתמש בנוסחא הבאה

-           הכפלה בקבוע שלילי של כל הערכים בשני המשתנים לא משנה אתr

-           הכפלה בקבוע שלילי בכל הערכים באחד המשתנים משנה את סימנו שלr כלומר כיוון הקשר משתנה אבל עוצמת הקשר נשמרת

-           הכפלה/הוספה בקבוע חיובי של כל הערכים במשתנה אחד/בשני המשתנים לא משנה אתr.

רגרסיה:

רגרסיה מתארת איך נדע על פי ערכי משתנה אחד את ערכי המשתנה השני, ישנו משתנה מנבא וממנו נרצה להגיע למשתנה המנובא. המודל שלנו בדרך כלל לא ינבא בצורה מדויקת ולכן נצפה לראות טעות.

ברגרסיה נדבר על משוואות ליניאריות בלבד. ונשתמש ב- y=bx+a כאשר ניתן לומרy-model+error

או בצורה סטטיסטית:    

מציאתa ו-b:

   ו-  

-           Ssr- המרחק בין מה שציפינו לבין קו הרגרסיה שלנו

-           Sst- כמה אנחנו רחוקים מהממוצע:  

-           Ssm- מה השוני בין מה שראינו לבין הממוצע

-           Ssm/sst=R2 כאשרR2  מסמל כמה הניבוי נכון

-           נשים לב כיssm=sst+ssr

התפלגות דגימה:

משום איננו יכולים לבדוק את כלל האוכלוסיה אנחנו דוגמים אותה ומנסים לקחת כמה שיותר מדגם מייצג.

כאשר אני יודעים את ממוצע האוכלוסיה בקטגוריה מסוימת ודוגמים מהאוכלוסיה קבוצה ולה יש ממוצע אחר נשאלת השאלה מדוע קיים הפרש בין הממוצעים? זה יכול לנבוע משתי סיבות:

-           קיים קשר, כלומר ההפרש משמעותי שמסמל שונות בין שתי קבוצות

-           ההפרש נבע מתוך טעות הדגימה כלומר לא קיים קשר אמיתי וההפרש הוא מקרי

נכריע בין שתי האפשרויות לפי ההסתברות שהתוצאה שקיבלנו היא מקרית לבין משמעותית, לשם כך נשתמש בהתפלגות הדגימה של הממוצע שזו התפלגות תיאורטית של ממוצעי כל המדגמים האפשריים בגודל מסוים מתוך האוכלוסיה, נבדוק איפה נופל הממוצע שלנו בתוך התפלגות הממוצעים, נקבל החלטה האם הוא שייך או לא שייך לאוכלוסיה שלנו ונקבע מסקנה. את טעות התקן נחשב על ידי

ומבחןZ ישמש אותנו פה-  

שלב ראשון- בדיקת השערות:

1.         השערת המחקרH1- מניחה שיש הבדל בין שתי האוכלוסיות, היא לא נבדקת ישירות אלא מתקבלת אםHo נדחית. בהשערה זו משערים כיµ-ממוצע האוכלוסיה ממנה הגיע המדגם שונה מהממוצע של האוכלוסיה המקורית- µ0.

2.         השערת המחקרH0- מניחה שאין הבדל בין שתי האוכלוסיות, היא מתארת את המצב הקיים כל עוד לא הוכח אחרת. משערים כיµ- ממוצע האוכלוסיה ממנה הגיע המדגם =/≤/≥ ל0µ- ממוצע האוכלוסיה המקורית.

השערה דו זנבית אל מול חד זנבית:

1.         מבחן חד זנבי- החוקר משער על כיוון התוצאות, השערת ה-H1 תטען שהפרמטר באולוסיה הנחקרת גדול/קטן מהפרמטר באוכלוסיה הכללית. כאשר השערת ה-H0 תמיד תשלים את ההשערה המחקרית ויחד הן מכסות את כל טווח האפשרויות.

2.         מבחן דו זנבי-  החוקר לא משער על כיוון התוצאות, השערתH1 דו זנבית תטען שהפרמטר באוכלוסיה הנחקרת שונה לפרמטר באוכלוסיה הכללית.

שלב שני- בדיקת נתונים אמפיריים:

מוצאים נתונים סטטיסטים למשל חישוב ציוניZ.

שלב שלישי- מציאת הסתברות:

נשאלת השאלה מה ההסתברות שהתוצאות שקיבלנו בשלב 2 מייצגת טעות דגימה או תופעה אמיתית. אם ההסתברות לקבל ציון תקן כזה באוכלוסיה המקורית נמוכה נסיק שהממוצע שקיבלנו כנראה לא שייך לאוכלוסיה המקורית אלא לאוכלוסיה אחרת.

בבדיקת הסתברות בחד זנבית חיובית ימנית נבדוק את ההסתברות לקבלת ציוני תקן כמו של ממוצע המדגם או ציון גבוה ממנו, ובבדיקה חד זנבית שלילית-שמאלית נבדוק את ההסתברות לקבלת ציון תקן כמו של ממוצע המדגם או ציון נמוך ממנו. בבדיקת הסתברות בדו זנבית נבדוק את ההסתברות לקבל ערך קיצוני יותר מציון התקן החיובי והשלילי של ממוצע המדגם. לצורך כל החישובים נשתמש בטבלתZ.

שלב רביעי- ההכרעה:

-           אם ההסתברות שקיבלנו נמוכה מאוד כלומר נמוכה מ- α=0.05 נדחה את השערת האפס ונסיק שהתוצאה משמעותית

-           אם ההסתברות לתוצאה שקיבלנו גבוהה מ-α=0.05 לא נדחה את השערת האפס ונסיק שהתוצאה מייצגת טעות דגימה

אזורי דחייה ואי דחייה שלHO בהשערה דו זנבית:

-           אזור דחייה הוא שטח בהתפלגות הדגימה שמייצג את ממוצעי המדגמים שאינם סבירים תחתH0.

-           אזור אי דחייה הוא שטח בהתפלגות הדגימה שמייצג את ממוצעי המדגמים שסביר שנקבל אותם תחתH0.

-          

אזורי דחייה ואי דחייה שלHO בהשערה חד זנבית:

הערך הקריטי ממנו דוחים אתH0 לא כולל נקבע בהתאם לציון התקן באותה הנקודה.

הערך הקריטי הוא בדרך כלל 1.96

 

טעות הוטעות ה-β:

o          טעות ה- α: דחיית ה-HO כאשר בפועל היא נכונה: זה קורה כאשר דוגמים מדגם של אנשים שבאופן מקרי הערכים שלהם היו קיצוניים ולכן קיבלנו נתון סטטיסטי שנפל ב0.05 הקיצוני של ההתפלגות. כלומר דחינו אתHO אבל ה0.05 האלו היו שייכים לאוכלוסיה.

o          טעות ה-β: אי דחיי שלHO כאשרH1 היא נכונה. הנתון הסטטיסטי נפל במקום שמתאים לאוכלוסיה-ששייך להתפלגות הדגימה של אוכלוסייתHO אבל הוא בכלל מייצג אוכלוסיה אחרת.

המציאות           

H1 נכונה           H0 נכונה                       החלטת החוקר

טעות מסוגβ      1-α       Ho  נכונה         

1-β       טעות מסוגα      H1 נכונה          

 

 

 

עוצמת המבחן: ההסתברות לדחות אתHO כאשרH1 נכונה וערכה 1-β. ככל שנקטין אתβ נעלה את עוצמת המבחן. ככל שגדולה יותר הקטנה יותר ועוצמת המבחן גדולה יותר.

ככל שהממוצעµ0 רחוק יותר מהממוצעµ1 כך היותר קטנה ועוצמת המבחן גדולה יותר. המרחק בין הממוצעים נקרא גודל האפקט. ככל שטעות התקן של התפלגויות הדגימה קטנה יותר כך הקטנה יותר. יש שתי אפשרויות שמקטינות את טעות התקן והן- 1. אם שונויות האוכלוסיות מהן נלקחו המדגמים קטנות יותר, 2. אם מגדילים את גודל המדגם.

דוגמא לכל התהליכים של בחירת היפותזה במבחן חד זנבי:

µ=100 (ממוצע המילים שיודעים תינוקות בגיל שנתיים)

σ= 18  (סטיית תקן)

הטענה- עישון של אמהות בזמן ההריון מקטין את אוצר המילים של הילד לאחר הלידה.

מדגם של -81 תינוקות לאימהות מעשנות

ממוצע המדגם של מילים שידעו הילדים של האמהות המעשנות היה -95

האם החוקר צודק בטענה?

תהליך בדיקת ההשערות:

1.         HO- אין הבדל: כלומר או שממוצע התינוקות של האמהות המעשנות גדול או שווה לממוצע של הלא מעשנות או שממוצע התינוקות של האמהות המעשנות אינו קטן מכלל האוכלוסייה.

2.         H1- ממוצע התינוקות של האמהות המעשנות קטן הממוצע של כלל האמהות.

מניחים ש-

1.         המדגם מייצג

2.         התפלגות הדגימה נורמלית

3.         השונות באוכלוסיה ידועה (במבחןZ ניתן להשתמש כאשר השונות באוכלוסיה ידועה)

נקבע שα=0.05-

במבחן חד זנבי שלילי אזור הדחייה ימוקם בצד שמאל של התפלגות הדגימה ובחיובי להפך.

נחשב את הערך הקריטיCV-

זהו הערך המחלק את התפלגותHO לאזורי דחייה ואי דחייה, התפלגות הדגימה של הממוצע שואפת לנורמלית אז נחשב ציון תקן של הערך הקריטי לפי טבלתZ. ציון התקן שמעבר לו נמצאים 0.05 מהמקרים הואZ=-1.65 וכל ממוצע שייפול מימין לו הוא באזור בו לא דוחיםHO.

חישובים:

נמיר את ערך הממוצע ל-Z לפי   ונקבלZ=-2.5 שזה מעבר לערך הקריטי ולכן נדחה אתHO.

במקום לחשבZ=1.65 כמו למעלה ניתן למצואPvalue איך?

-           אם ההשערה היא חד זנבית ימנית-חיובית אז ה- Pvalue הוא ההסתברות לקבל ציון תקן כמו של ממוצע המדגם או גבוה ממנו

-           אם ההשערה היא חד זנבית שמאלית- שלילית אז ה- Pvalue הוא ההסתברות לקבל ציון תקן כמו של ממוצע המדגם או נמוך ממנו

-           אם ההשערה היא דו זנבית אז הPvalue שווה להסתברות לקבל ערך קיצוני יותר מציון התקן החיובי והשלילי של ממוצע המדגם

בדוגמא שלנו משום שz=-2.5 נבדוק בטבלהZ מה הסיכוי לקבל מדגם כזה ומטה ונקבל 0.0062 שזו הסתברות קטנה מרמת המובהקות 0.05 ולכן נדחהHO.

דוגמא לכל התהליכים של בחירת היפותזה במבחן דו זנבי:

µ=100 (ממוצע המילים שיודעים תינוקות בגיל שנתיים)

σ= 18  (סטיית תקן)

הטענה- עישון של אמהות בזמן ההריון משנה את אוצר המילים של הילד לאחר הלידה.

מדגם של -81 תינוקות לאימהות מעשנות

ממוצע המדגם של מילים שידעו הילדים של האמהות המעשנות היה -95

האם החוקר צודק בטענה?

תהליך בדיקת ההשערות:

3.         HO- אין הבדל: ממוצע התינוקות של אמהות מעשנות שווה לממוצע כלל התינוקות

4.         H1- ממוצע ממוצע התינוקות של האמהות המעשנות שונה מהממוצע של כל התינוקות- טענת החוקר

מניחים ש-

4.         המדגם מייצג

5.         התפלגות הדגימה נורמלית

6.         השונות באוכלוסיה ידועה (במבחןZ ניתן להשתמש כאשר השונות באוכלוסיה ידועה)

נקבע שα=0.05-

במבחן דו זנבי יש שני אזורי דחייה שנמצאים משני צידי ההתפלגותH1: µ≠µ0   

נחשב את הערך הקריטיCV-

זהו הערך המחלק את התפלגותHO לאזורי דחייה ואי דחייה, התפלגות הדגימה של הממוצע שואפת לנורמלית אז נחשב ציון תקן של הערך הקריטי לפי טבלתZ. ציון התקן שמעבר לו נמצאים 0.05 מהמקרים הואZ=+/- 1.96 וכל ממוצע שייפול מימין ל+ או משמאל ל(מינוס) מערך הקריטי הזה הוא באזור בו דוחיםHO.

חישובים:

נמיר את ערך הממוצע ל-Z לפי   ונקבלZ=-2.5 שזה מעבר לערך הקריטי ולכן נדחה אתHO.

במקום לחשב  Z=+/- 1.96 כמו למעלה ניתן למצואPvalue ולהשוות אותו לα שקבענו.

-           אם ההשערה היא דו זנבית את ה- Pvalue שווה להסתברות לקבל ערך קיצוניי יותר מציון התקן החיובי והשלילי של ממוצע המדגם.

בדוגמא שלנו משום שz=-2.5 נבדוק בטבלהZ מה הסיכוי לקבל מדגם כזה ומטה ונקבל 0.0062 והדו זנבי יהיה פי שתיים ויצא- 0.0124 שזו הסתברות קטנה מרמת המובהקות 0.05 ולכן נדחהHO.

סיכום מהדוגמאות:

מבחןZ- בדיקת השערות על פרמטרµ כאשר השונות ידועה-

מבחן חד זנבי ודו זנבי-

הנחות-

1.         מדגם מייצג

2.         התפלגות הדגימה נורמאלית (או האוכלוסייה נורמאלית או גודל המדגם גדול או שווה ל-30)

3.         השונות ידועה

במדגם חד זנבי הערך הקריטי הואZ=-/+1.65, ובמבחן דו זנבי הערך הקריטי הוא 1.96

•           ניתן לחשב גם את הערךP שזאת ההסתברות המדויקת לקבל את הערך ולבדוק האם הוא מעל או מתחת לרמת המובהקות שקבענו.

•           או לפי ה-Z שיוצא לנו לראות האם הוא קטן או גדול מהערך הקריטי.

רווח סמך לתוחלת (במקרים בהם השונות באוכלוסיה ידועה)-

אנו מנסים להסיק על גודלו של ממוצע האוכלוסייה ע"פ ממוצע המדגם. עבור משתנה רציףעם שונות ידועה.

דרך א'- אומדן נקודתי-

אמידת פרמטר על ידי ערך מספרי יחיד ונקודתי במדגם. אומדן נקודתי טוב הוא אומד חסר הטיה, ממוצע המדגם הוא אומד חסר הטיה, כלומר ממוצע הממוצעים של כל המדגמים בגודלN שווה לממוצע האוכלוסייה (תוחלת).

דרך ב'- אמידה באמצעות תחום- רווח בר סמך-

איננו מצפים שממוצע מדגם ספציפי יהיה שווה בדיוק לפרמטר, בשל טעות הדגימה. לכן, אם ברצוננו לאמוד את פרמטר האוכלוסייה נשתמש ברווח בר סמך.

 

הערות:

1.         משמעות הערך יהא בטווח הארוך הרבה מאוד מדגמים 95% מהם יכללו את הפרמטר הרצוי.

2.         רווח בר סמך תלוי ב- * רמת הביטחון (אם נעלה אותה נגדיל אתCI)

                              *שונות האוכלוסייה כלל שהיא גדלה גם ה-CI גדל

                                          *אם נגדיל את גודל המדגם הרווח בר סמך יקטן

 

מבחןT- כאשר השונות אינה ידועה-

הנחות-

1.         ממוצע האוכלוסייה ידוע

2.         שונות לא ידועה

3.         התפלגות האוכלוסייה נורמאלית

4.         מדגם מייצג

מבחןT למשתנה יחיד-   (ראה נוסחה במחברת)  דרגות החופשn-1

מבחןT למדגמים בלתי תלויים- (ראה נוסחה במחברת) דרגות החופשn1+n2-2

מבחןT למדגמים תלויים- תלויים דומים בכל התכונות חוץ מהתכונה הנמדדת- (ראה נוסחה במחברת ) דרגות החופשn-1

ניתוח שונות חד:

המבחן בודק האם קיים הבדל מובהק בין השונות בין קבוצותMSB לשונות בקבוצותMSW. כאשרH1 טוען שיש הבדל בשונות בין הקבוצות באופן מובהק מההבדל בשונות בתוך הקבוצות. ומכאן נסיק כי לפחות אחת ממוצעי הקבוצות שונה מהשאר באופן מובהק.

נוסחאות מתאימות:

 

 

 

           

 

 

 

 

 

הנחות:

1.         התפלגות נורמלית שלXij

2.         דגימה מקרית

3.         שוויון שונויות באוכלוסיה

4.         אי תלות של הקבוצות

5.         הבדיקה היא תמיד חד זנבית ימנית והמסקנה דו זנבית

P          F          MS      DF       SS       

קטן או גדול מ-0.05                                K-1      SSb      BETWEEN

                                    N-K     SSw     WITHIN

                                    N-1      SSt       TOTAL

ניתוחי פוסט הוק- ברגע שנמצא הבדל מובהק בניתוח שונות חד כיווני בין ממוצעי הקבוצות, אם לא היו לנו השערות מראש איזה ממוצע ספציפי נבדל ממשנהו, עלינו לבצע ניתוח פוסט הוק שמשווה בין כל הזוגות של הממוצעים האפשריים וקובעים אילו ממוצעים נבדלים באופן מובהק.

ניתוח שונות דו כיוונית:

כאשר יש שני משתנים בלתי תלויים ואחד תלוי. בודקים שני אפקטים:

אפקט עיקרי: השפעה של משתנה בלתי תלוי על המשתנה התלוי, יכולים להיות שני אפקטים עיקריים- עבור המשתנה בשורות או עבור המשתנה בטורים.

אפקט האינטראקציה: משתנה בלתי תלוי אחד משפיע על המשתנה התלוי אחרת ברמות שונות של המשתנה הבלתי תלוי השני. לדוגמא סוג הכאב משפיע על רמת הכאב בצורה שונה בקרב אנשים שקבלו טיפול תרופתי ישן לעומת טיפול תרופתי חדש.

נוסחאות:

 

או בהרחבה לפי פיתוח נוסחאות:

 

 

או בהרחבה לפי פיתוח נוסחאות:

 

P דחה אתHO אם:          Fc ערך קריטיF חתך דרגת חופש   יחסF    ms        df         ss         Source

Fobserved-rows>Fc

Or

Pvalue<0.05    Fα (r-1, r•c•(n-1))                              r-1       Ssr       Between(rows)

Fobserved-coloms>Fc

Or

Pvalue<0.05    Fα(c-1, r•c•(n-1))                                c-1       Ssc      Between(columns)

Fobserved-int>Fc

Or

Pvalue<0.05    Fα((c-1)(r-1), r•c•(n-1))                                (r-1)(c-1)        Ssint            Between(interaction)

                                                            Ssw     EROR(within)

                                                N-1      sst        total

בדיקת השערות:

 

 

הוספת תגובה

נשארו 150 תוים
נשארו 1500 תוים

תגובה אחת

© כל הזכויות לתוכן המופיע בדף זה שייכות ל ExcelMath91 אלא אם צויין אחרת