משמעות סטיית התקן

king iverson

New member
משמעות סטיית התקן

ההגדרה של שונות היא ממוצע הסטיות מן הממוצע.
וסטיית תקן היא שורש השונות.
מה הסיפור שמסופר מאחורי סטיית התקן? פרט לעובדה שאני יכול להגיע אליה מן השונות.
 
למעשה הכיוון הוא הפוךו

מה בעצם הבעיה? יש לנו מספר ערכים שנדגמו. לערכים האלה יש ממוצע שאפשר לחשב אותו. אנחנו מחפשים פרמטר שיעריך לנו את מידת הפיזור של הנתונים שנדגמו כלומר את מידת ההתרחקות שלהם מן הערך הממוצע. אז תיאורטית, היינו צריכים לחשב את הסטייה של כל ערך ביחס לממוצע ולחשב את הממוצע של הסטיןות האלה. אבל יש בעיה: אם סתם נחסיר ערכים, אזי הסטיות שמעל לממוצע יקזזו את הסטיות שמתחת לממוצע ולא נקבל תחושה אמיתית של מידת הפיזור של התוצאות.

לכן המציאו את השונות: השונות מחשבת את הסטיות של דגימה, אבל מעלה את הסטיות בריבוע. בצורה כזאת מנטרלים את הקיזוז ההדדי שתיארתי בפסקה הקודמת. עכשיו עושים ממוצע של הסטיות בריבוע וכך מקבלים את השונות.

כעת ניתן להוציא שורש ולקבל את סטיית התקן כאשר היא נותנת מדד של מידת הפיזור של התוצאות תוך ניטרול סכנת הקיזוז ההדדי.
 

king iverson

New member
זה די אינטואיטיבי

מכיוון שהסטיות שמעל הממוצע מאזנות את הסטיות שמתחת לממוצע?
 

king iverson

New member
תודה, הסבר מצוין + שאלה

משתמע מדבריך שהשונות נובעת מכורח טכני, כלומר, אם יכולנו להגיע לסטיית תקן ללא שונות, היינו עושים זאת ונשארים רק עם סטיית תקן?
 

Blue Beetle

New member
סטיית התקן היא מדד פיזור

לכאורה המדד הטבעי יותר היה תוחלת הסטייה המוחלטת מהתוחלת zz E |x-Ex| zz ויש הרבה משפטים על המדד הזה.
הבעיה העיקרית עם המדד הזה, הוא שקשה לעבוד אתו מתמטית לעומת השונות.

השונות גם מהווה תבנית ריבועית (המתאימה לתבנית הביליניארית החשובה בפני עצמה - שונות משותפת) שיש לה שימושים רבים במתמטיקה. יש לה משמעות גם כאשר מתעסקים במודלים של רגרסיה (בייחוד בדוקטרינה של הכנסייה הסוגדת לעקומת גאוס).

הבעיה עם השונות, היא שהיא לא מודד את הפיזור בקנה המידה של המשתנה המקרי. אם יש לך משתנה מקרי הנמדד במטרים עם שונות 1, כאשר תעבור למילימטרים השונות לא תגדל ל-1000, אלא ל- 1,000,000. כדי למדוד פיזור בקנה המידה הטבעי של המשתנה, משתמשים בסטיית התקן.
 
אגב, הממוצע הוא זה שעבורו סטיית התקן מינימלית

בעוד החציון הוא זה שעבורו תוחלת הסטייה המוחלטת מינימלית.
 

king iverson

New member
שאלה נוספת בנושא

מה הלוגיקה מאחורי כך שבסטיית תקן של מדגם מחלקים בn-1?
 

Blue Beetle

New member
אתה שואל הרבה שאלות שכדאי ללמוד בקורס מסודר

בסטטיסטיקה מתמטית.

בכל מקרה, הרעיון הוא שאם V היא השונות האמתית של האוכלוסייה ו- ^V האומד שלנו לשונות, אנחנו רוצים ש- zz EV^=Vzz כלומר שהאומד שלנו יהיה *בלתי מוטה*. לשם כך צריך לחלק ב- n-1 ולא n.
 

Marko Matika

New member
סטיית תקן

אם תשים לב בנוסחה מופיעות Fi שהן השכיחויות
סטיית התקן\השונות מבטאות את הפיזור שלהן מהמרכז(מהממוצע)
כלומר עד כמה קרוב או רחוק כל אחד מהשכיחויות מהממוצע
 
למעלה