בגרף עמודות עדיף לציין סטיית תקן או טעות תקן?

אמיתית9

New member
בגרף עמודות עדיף לציין סטיית תקן או טעות תקן?

שלום,

אני עושה תזה על חרדה. יש לי 2 קב עכברים שבדקתי מה ההבדלים בחרדה בינהם לאחר מניפולציה מסויימת. המנחה שלי ביקש ממני לציין בגרפים את טעות התקן ולא את סטיית התקן כפי שלדעתי נהוג לציין. הבעיה שלי עם זה היא שבכל קבוצה היה מספר עכברים שונה ומאחר שטעות התקן תלויה במס הנבדקים אני לא מבינה מה הטעם בלהסתכל על טעות התקן של כל אחת מהקבוצות כי מה אפשר להבין מזה?

לדעתי לציין סטיית תקן זה יותר מתאים, כי אז אפשר לראות את הפיזור שבכל קבוצה ולראות אם הוא קטן או גדול וכו..

האם הטענה שלי שזה שבכל קבוצה מס נבדקים שונה יוצרת בעיה להציג את ה SEM היא נכונה?

תודה
נועה
 

Mickey מאוס

New member
אני חושבת שנהוג דווקא להציג את טעות התקן

אבל בכל מקרה כדאי שתעלי בפני המנחה את מה שכתבת כאן ותדברו על זה.
אם המנחה שלי הייתה מנחה אותי לעשות משהו, לא הייתי באה ואומרת לה "אבל שאלתי גם בפורום ואמרו לי לעשות את ההפך...".
 

tulkin

New member
סטיית התקן היא מדד מאפיין של המדגם

טעות התקן היא מדד שמתאר את מידת אי הוודאות בהסקה הסטטיסטית (מהמדגם לשאר האוכלוסיה).
&nbsp
כשמבינים את ההבדל הזה בין שני המדדים, נראה לי די ברור וחד משמעי מה צריך להראות (טעות התקן. אף אחד לא מתעניין במדגם שלך. המחקר צריך להגיד משהו על האוכלוסיה ולכן מעניין כמה בטחון יכול להיות לך במסקנות שלך כשמנסים להחיל אותן על האוכלוסיה)
 

C H 4

New member
הרבה מנחים מפחדים מארטיפקטים ופרסומים שקריים

שהם הופכים את הסטטיסטיקה לקדושה אפילו שלא משתמשים בה נכון.
אותי למדו תמיד להראות se כי הוא קטן יותר ולכן משכנע ויזואלית (זה השלב שמותר לך להתעלף)
גם לימדו אותי ש״מותר״ להוציא נדגם אחד מהקבוצה וזה לא נקרא רמאות, ואף אחד לא הראה לי מבחני אאוטליירים...
אני קצת משתגעת מהמנחה שלי שלא מאמין בתוצאות בלי סטטיסטיקה, לצערי עוד קוראים ביקשו את אותן סטטיסטיקות
וכך במאמר שלי יופיעו מבחנים סטטיסטיים שברור לי שהם לא נכונים, אבל זה מה שיבקש הריוויואר
 

tulkin

New member
אני כבר לא מתעלף מכלום כשזה מגיע לענייני סטטיסטיקה

פגשתי כל כך הרבה חוקרים מעולים ובעלי שם שעושים טעויות בסיסיות בסטטיסטיקה, ורמת ההבנה שלהם... נו טוב. הם יודעים דברים אחרים ממש ממש טוב.
&nbsp
אז כאמור, מראים SE ולא SD כי זה מה שחשוב. לא כי זה נראה טוב.
ואגב, אני מאמין גדול ב"משכנע ויזואלית". אבל זה כבר סיפור אחר.
&nbsp
ולגבי מה מותר ומה אסור - המון דברים שקורים, קורים כי זו הפרקטיקה שמתפתחת, ולא כי זה הדבר הנכון לעשות. גם הפרופסורים הכי מפורסמים היו סטודנטים פעם, וסביר שחלק לא קטן מהם שנא סטטיסטיקה או הסתדר עם סטטיסטיקה איכשהו, גם אם לא הבין אותה לעומקה. כלומר הם מצאו ופיתחו פרקטיקות ודרכי עבודה שהצליחו להתקבל ולהיראות חוקיים וטובים ומוצלחים, ולעמוד בכל הכללים, גם בלי להיות מדוייקים ומבוססים על כל פסיק. הם כמובן לא המציאו את הגלגל, אלא הסתמכו על יוריסטיקות של חבריהם ומרציהם וכו'. וכך זה נמשך.
אז כן, כשעושים צילום מסך של מה שנעשה היום, מגלים לא מעט שטויות. ואם יורדים לעומק מגלים שמעט מאד אנשים יודעים להסביר בדיוק למה עושים כך וכך. הם פשוט עושים, כי ראו אחרים שעשו והצליחו.
בעוונותי, הפרסום היחיד שלי עד היום, מכיל שגיאה סטטיסטית כל כך מהותית, שהיא גרמה לי לכתוב מאמר שלם של איך להימנע מהשגיאה (המאמר הזה טרם התפרסם אך זכה לשבחים בכנס כשהצגתי אותו). אבל הוא התפרסם (המאמר עם השגיאה). אפילו בכתב עת סביר למדי, ואף רוויואר לא צעק ולא הבחין בשגיאה. גם המנחה שלי באותה עת (שדחפה את הפרסום יותר ממני) לא התרגשה מהעניין. ולדעתי גם לא הבינה את חומרת הבעיה. הרוויוארים ביקשו דברים אחרים לגמרי, כאמור, ועשינו מה שהם ביקשו.
 

C H 4

New member
אותי מאוד מתסכל

לראות איך יש ניסויים שעם הסטטיסטיקה הנכונה בעצם עוברים את כל המבחנים וכו', אבל צריך להציג אותם עם אנליזה סטטיסטית שגויה כדי שיתפרסמו.
מאוד מתסכל אותי לראות איך 2 הצגות גרפיות שלמעשה מראות בדיוק את אותו הדבר מתקבלות באופן אחר לחלוטין ע"י הריוויוארים סתם כי אחת הם מבינים ואחת פחות, אז קשה להתווכח איתה.
מתסכל אותי לראות איך אנשים מורידים באופן לא תקין מדידות שלא יושבות להם נח על הדאטה, ומגיעים לתצוגות גרפיות יפייפיות, ואז אני כמו איזו טמבלית מראה את הנתונים שלי עם האנליזה הנכונה ואומרים לי שהעבודה שלי לא טובה מספיק, כי אפקט כזה לא מספיק משכנע.
זה כאילו שכתבי עת ומנחים מבקשים מהסטודנטים לרמות, אבל לא רוצים לדעת מזה.
בהתחלה חשבתי שרק המנחה שלי תקועה עם כל מיני דברים שגויים בראש, ואז התחלתי לראות תגובות של ריוויוארים והבנתי שכל הנושנס האלו ממש מקובעים בתחום.
&nbsp
&nbsp
וגם מאוד מתסכל אותי שיש לי ניסוי שמצליח לחזור על עצמו, אבל מעולם לא נתן לי מובהקות טובה. פתאום הבנתי שעשיתי בו את האנליזה הלא נכונה (את זה יכולתי לשער, כי התוצאה אמיתית לחלוטין, אבל עכשיו אני יודעת איזו אנליזה הייתי צריכה לעשות). בשלב הזה אם אני פתאום אגיע אל המנחה ואגיד לו שבעצם הניסוי יוצא מובהק הוא יהיה משוכנע שאני מרמה בתוצאות.
 

אמיתית9

New member
אבל מה אומר ה SEM כאשר גודל הקבוצה שונה ?שום השוואה בין הקב?

היי

ראשית תודה על התשובות,

אני מבינה את ההבדל בין SEM לסטיית תקן, לא הבנתי איך לפרש את ה SEM כאשר בכל קבוצה גודל קבוצה שונה. נניח שאני מציגה לכם גרף עם שתי עמודות של קבוצות שאחת מהן 100 משתתפים והשניה 40. ההבדל בין הקבוצות הוא אמנם רק במניפולציה אבל ה SEM שיוצג באחת יהיה כביכול רחב יותר מהSEM שיוצג בקבוצה השניה רק בגלל גודל הקבוצה. אז נכון שהטווח של ממוצע האוכלוסיה כביכול יהיה מדוייק יותר בקבוצה של ה 100 אבל האם לגודל הקבוצה לא יהיו עוד השלכות מעבר לפרשנות של טווח הממוצע של האוכולסיה?
 

Gidi Shemer

New member
אבל, למיטב הבנתי,

(והידע שלי בסטטיסטיקה ממש לא משהו, אז קחי את זה עם חמישים גרגרי מלח), ההבדל בין שתי ה- SEs, ייצג באמת את ההבדל בין גודל האוכלוסיות וזה מה שאת רוצה. במילים אחרות, טעות השגיאה אצל אוכלוסיה אחת באמת עשויה להיות גדולה יותר מאשר הקבוצה השניה בגלל גודל הקבוצה, אבל זה לא דבר רע. זה בסדר. זה משקף כי אלו קבוצות שונות בגודלן. הסטטיסטיקה (כשהיא נעשית נכון) נועדה בין היתר להראות את ה״לכלוך״ בניסויים שלנו (ולכלוכים תמיד קיימים) ולראות עד כמה אותו ״לכלוך״ משפיע על התוצאות ובעיקר על הסקת המסקנות. אם אנחנו מייפים את הלכלוך על ידי שימוש במדדים הסטטיסטיים הלא נכונים, אנחנו לא עושים את עבודתנו כראוי.

זה מזכיר לי מדדים סטטיסטיים אחרים. אני מתעניין בתזונה וקורא לא מעט מחקרים בנושא, ויוצא לי גם לדסקס על הנושא בפורומים שונים. לדעתי האישית, וטולקין ואחרים יוכלו לתקן אותי אם אני טועה, אחת העוולות הגדולות ביותר שעדיין קיימות היא הבלטת המשמעות הסטטיסטית (p value) מול הקטנה (אם לא לומר התעלמות) מגודל האפקט הנמדד. אנשים מצליחים להעביר מסרים לגמרי מוטעים רק בגלל שהם מצאו משמעות סטטיסטית שמראה שאפקט מסויים קיים. הם לעומת זאת מתעלמים לגמרי מהעובדה שהאפקט הנ״ל יכול להיות זניח ביותר, בעיקר כשמודבר במחקרים מסוג מסוים (מחקרי cross section למשל), אבל כולם מצטטים את המסקנות המוטעות רק כי הן ״משמעותיות מבחינה סטטיסטית״
 

corrigenda

New member
מה שאתה כותב עליו הוא אחד היסודות ל"משבר המדע"

השימוש העודף במובהקות לעומת גודל אפקט הוא אבן יסוד של מה שפופולרי לדבר עליו בתור "the crisis of reproducibility in science" והיה הנושא של גילויי דעת מיוחדים של האגודה הסטטיסטית האמריקאית ממש מהעת האחרונה.

קריאה מומלצת למתעניינים (ספציפית, נקודה 5 בעמ' 132):

The ASA's Statement on p-Values: Context, Process, and Purpose
Ronald L. Wasserstein , Nicole A. Lazar
The American Statistician
Vol. 70, Iss. 2, 2016
 

אמיתית9

New member
עזר.
האם מציינים את המספרים עצמם בגרף?

המנחה שלי ביקש ממני להוריד את הטבלה, להשאיר גרפים ולהוסיף את הבאר (קווים) של ה SEM.

האם נהוג לחשב את הבאר של ה SEM לפי טעות תקן אחת מכל כיוון? (הבנתי שברירת המחדל בSPSS היא שתיים מכל כיוון משום מה, רק בגרף כמובן. בטבלה אם מבקשים מה SPSS הוא מציין טעות תקן אחת).

האם כאשר לא מכניסים טבלה (לא ברור לי מה הקטע של לא להכניס טבלה לתזה) נהוג לציין את הממוצעים וטעויות התקן במספרים בגרפים? האם היית מציין?

 
פעם ראשונה שאני שומע על לא להכניס טבלה לתזה

יש נתונים שמתאים יותר להציג בטבלה, כאלו שמתאים להציג בגרף, באיור ועוד. לא ברור לי העניין הזה של איסור גורף על הצגת נתונים בטבלה- כאמור, מעולם לא נתקלתי בזה- לא במדעי החברה, לא במדעי הבריאות, וגם לא במדעי החיים (אלא אם משהו השתנה ב 20 שנה מאז סיימתי את המאסטר)
 

C H 4

New member
אם את מכניסה את הנתונים בגרף אז למה גם בטבלה?

בד"כ מכניסים לטבלה דברים שאין להם הצגה גרפית ברורה אחרת. לפעמים, כשיש המון המון מידע שלא נכנס להצגה הגרפית ונראה לך שהוא חשוב מספיק, מציגים את הטבלאות בנספח לתזה.
לתזה שלי נכנסו רק 2 טבלאות שהכילו תוצאה שהיא במהותה רשימה. כל דבר שיש לו ערך או חישוב קצת יותר מורכב מרשימת מכולת, קיבל הצגה גרפית ברורה יותר. ברגע שאת מסבירה את השיטה (בפרק השיטות) ומתארת את התוצאות ומשתמשת בהצגה גרפית נכונה- בעצם כל המידע שם גם אם הבוחנים והקוראים לא רואים את הraw data.
 

C H 4

New member
לגבי ערכים מספריים, זו שוב שאלה של קוהרנטיות וגם של אסתטיקה

אצל המנחה שלי האסתטיקה היא כמעט חזות הכל. בדרך כלל, עד שהפיגר לא מושלם ברמה האסתטית אנחנו כמעט לא דנים באיכות של התוצאה. באופן הזוי משהו, לאורך הדוקטורט קצת ספגתי את שטיפת המח הזו כמו רוב הסטודנטים מבית היוצר שלו וכולנו מציגים פיגרים סימטריים מאוד.
יש בזה מידה רבה של הגיון, משום שברגע שאת מסתכלת על פיגר מאוד אסתטי, יותר קל להסתכל על העיקר ולא להתפס לזוטות.
&nbsp
כל זה כדי לומר, שבהצגה גרפית אמורים להבין את הערכים המספריים אבל לא הייתי מקריבה את הנראות הגרפית כדי שידעו את המספר כולל עשירית הנקודה. זה בסדר שיראו שיש לך קצת מתחת ל50% גם אם לא רואים שזה 48.3%.
יש לך צירים ויש עליהם ערכים. את יכולה למשוך קו מקוקו מהגרף אל הציר, את יכולה אפילו להוסיף את הערך המספרי המדוייק (לא נראה לי קריטי) ובד"כ אני לא עושה את זה עבור הסטיות, אבל כן עשויה לשחק עם המספרים שעל ציר הY כדי שיהיה ברור באילו טווחים הן נמצאות.
להדביק מספר ממש על הגרף עצמו נראה לי ממש חילול של הפיגר, אולי זה סתם בגלל המקום שממנו אני באה, אבל נראה לי שזה גם היה מפריע לי בתמונות של אחרים.
 

אמיתית9

New member
ממש עזרתם.

אני חושבת שלצורך האסטטיקה אעביר קווי ציר ולא אכתוב את הנתונים המספריים על הגרף. לי אישית זה יפריע שלא יהיו הנתונים המספריים ולכן אני אעביר את הטבלאות לנספחים.
&nbsp
 
למעלה