של המדידה .תצפיות עשויות לספק מידע עשיר ולכן הן מהוות כלי מחקר מרכזי הן בשיטות מחקר כמותיות והן במחקרים הנעשים בגישות איכותניות. יש מגוון רב של תצפיות שלהן מאפיינים שונים .חשוב להכיר את האפשרויות השונות ,כדי להעריך את היתרונות והחסרונות בשימוש בתצפית בעלת מאפיינים מסוימים ,במחקר שאנו עורכים .כך למשל ,במחקר אחד נוכל לצפות בהתנהגות מסוימת כפי שהיא מתרחשת באופן טבעי ,ובמחקר אחר נצטרך להבנות את הסיטואציה של התצפית ולכוון את המשתתפים לבצע התנהגות ספציפית (כגון משחק בקוביות של אם עם ילדה הפעוט) ,כך שנוכל לצפות בה .נתאר כאן מספר ממדים ורצפים המבחינים בין סוגי תצפיות שונות .ממדים אלו משפיעים על מידת התקפות ,המהימנות וההיתכנות במחקר שאותו אנו מבקשים לערוך. ^^##397מידת ההבניה של כלי התצפית תצפית היא תהליך של מדידה .תוצרי התצפית הם הערכים שמקבלים משתני המחקר אשר בהם אנו מבקשים לצפות .אחת ההחלטות המרכזיות בעיצוב כל תצפית היא המידה שבה אנו מבנים את התהליך המביא לערכים אלו .בצד אחד של הרצף מצויות התצפיות שבהן אנו מכוונים את הצופה באופן חד משמעי לסכם את מה שעולה בתצפית ללא שיקול דעת ומתוך הכוונה מרבית ,ובקצה האחר של הרצף, תצפיות שהצופה מתבקש לסכמן תוך שימוש רב בשיקול דעת ובהתרשמויות סובייקטיביות .לדוגמה ,כלים להערכת תפקודם של אנשים מבוגרים (כגון Katz ) )Index of Independence in Activities of Daily Living (ADLמנחים את הצופה לבחון את תפקודו של האדם בסדרה של משימות גופניות וקוגניטיביות ולסמן כן או לא על כל אחת מהן ,בהתאם להנחיות ברורות באשר לשאלה מהו תפקוד תקין בכל תחום .כך למשל ,נבדקות יכולות שונות ובהן :להתרחץ ,כולל צורך בהשגחה בעת רחצה ,שליטה על סוגרים ,להתלבש באופן עצמאי ,להכין אוכל ועוד .בכל אחד מהתחומים מקבל האדם הנבדק ניקוד לפי מידת התלות שלו באחרים לצורך ביצוע הפעולה .כך לדוגמה בפעולת רחצה ,נבדק המסוגל להתרחץ ללא עזרה יקבל ניקוד אפס ,מי שזקוק לסיוע קל (או מי שזקוק לנוכחות בעת הרחצה בגלל חשש לנפילה), יקבל 0.5נקודות ומי שזקוק לעזרה מלאה בכל פעולות הרחצה ,יקבל נקודה וחצי. מספר הנקודות המצטבר מבדיקת כל תחומי החיים החיוניים משמש בסיס להערכת התפקוד ולמידת התלות. בדוגמה זו נעשה מאמץ מרבי על ידי מפתח הכלי להבטיח שכל מי שעורך את התצפית יפעל בדרך שאותה הוא התווה וככל האפשר ללא שיקול דעת .זאת ,לעומת כלי תצפית המבקשים מהצופה לתת הערכות כלליות על סמך שיקול דעתו בהסתמך על כל מה שראה ,מבלי להנחות אותו בצורה מפורטת. כלי תצפית יכולים להעריך תופעות ממספר זוויות ודרכים .נתבונן לדוגמה בחוקר המנסה למדוד 'התפרצויות זעם של ילדים' ,כחלק ממחקר הבוחן את השפעתה של ההתערבות של הדרכת הורים על הפחתת התנהגויות אלו .תצפיות על ילדים המשתתפים במחקר עשויות להתנהל במספר דרכים .ראשית ,החוקר מגדיר בצורה תפעולית מהן התפרצויות זעם ,כך שניתן לזהות אותן באופן מהימן .חוקר עשוי לצפות בילד מדי יום במשך שעתיים ולסמן :שכיחות -כמה התפרצויות היו במהלך
זמן זה ,משך -מה משך ההתפרצות כל פעם ,עוצמה – עד כמה ההתפרצות היא חזקה (גם כאן ,יש מקום להגדרה תפעולית המאפשרת לזהות מתי ההתפרצות היא בעוצמה גבוהה או נמוכה). לכלי תצפית מובנים יש יתרונות רבים מבחינת התכונות הפסיכומטריות שלהם, ובעיקר בהבטחת המהימנות התוך-אישית והבין אישית של הצופים .כלי תצפית מובנים אינם הולמים במצבים שבהם החוקר מבקש לצפות בתופעה רב ממדית ומורכבת ,שלא ניתן ,לפחות בשלב מסוים של התפתחות הידע בתחום ,לתרגם אותה מראש להגדרה תפעולית חד משמעית .כך למשל ,בשלבים של מחקרי חלוץ וגישוש במחקרים כמותיים ,מקובל להשתמש בתצפיות פחות מובנות כדי לזהות התנהגויות ותופעות שלא ציפינו להם בעת היציאה למחקר .מבט ממוקד מדי באמצעות כלי מובנה ,היה עלול להביא לכך שהיינו מחמיצים תופעות שהן 'מחוץ למוקד'. לדוגמה ,במחקר על התערבות שנועדה להגביר את השתתפותם של תלמידים בעלי מוגבלויות בשיעורי חינוך גופני צפו החוקרים באופן לא מובנה בהתנהגויות של ילדים שהיו מושאי המחקר ושל עמיתיהם שהשתתפו בשיעורי החינוך הגופני ( . )Agergaard, Dankers, Munk, & Elbe, 2018החוקרים הגיעו למחקר זה כשיש להם מסגרת מושגית ותיאורטית שכיוונה אותם להתמקד בהיבטים של שילוב והדרה ( )exclusion and inclusionביחסים בין אישיים .עם זאת ,לא ניתנה הכוונה כלשהי באשר להתנהגויות הקונקרטיות שיש לצפות עליהם או כיצד לכנס את התצפיות הרבות לערכים מסכמים. בדוגמה אחרת ,רצו החוקרות ללמוד על התנהגותם של רוקחים במרפאות קהילתיות .הן התעניינו בעיקר בתגובות של רוקחים למקרים של הסחת דעת ולהפרעות בעבודתם ( .)Lea, Corlett, & Rodgers, 2015במחקר זה החוקר ליווה את הרוקח בעבודתו ורשם לעצמו הערות באופן לא מובנה כדי לתאר בפירוט רב ככל האפשר כיצד מתנהל יומו של הרוקח .במסגרת זו הצופה רשם גם התנהגויות שאותם ראה וגם את התרשמויותיו על מצב רוחו של הרוקח .כל זאת ,לצד השעה ביום שבה נרשמו הערות אלו .תצפיות לא מובנות אלו ,עשויות לשמש לאחר עיבודן, לקביעת קטגוריות רלוונטיות ש ַי ְבנּו תצפיות בהמשך. ^^##398מידת ההבניה של תנאיי התצפית תצפיות שונות זו מזו במידה שבה הן מתקיימות בתנאים 'טבעיים' או בתנאים שנוצרו במיוחד לשם התצפית .דוגמה לתצפיות המתרחשות בסביבה שנוצרה במיוחד הן הערכות של בעיות התנהגות של ילדים ,המבוססות על תצפית באינטראקציה שבין הורה לילד במסגרת קלינית או מחקרית ,אינטראקציה שנוצרה במיוחד לצורך התצפית .למשל ,במחקרים שהעריכו את ההשפעה של טיפול באמצעות משחק Parent-Child Interaction Therapy -ניתנה הנחייה לזוגות הורה-ילד לשחק ביחד ונערכה תצפית על האינטראקציה בעת המשחק ( & McNeil .)Hembree-Kigin, 2010תצפיות מעין אלו ,המבנות את סיטואציית התצפית, עשויות להתרחש בסביבות טבעיות ,כגון בבית המשפחה ( & Fleming,
,)McMahon & King, 2017וכן בסביבות מלאכותיות כמו חדר עם מראה חד כיוונית במסגרת קלינית או מחקרית. דוגמה אחרת לתצפית שבה יש שליטה רבה על תנאי התצפית היא תצפית הנערכת לבחינת הנגישות הרגשית של הורים לילדיהם עד גיל The ( 14 .Emotional Availability Scales, (Biringen et al., 2014במסגרת התצפית, ההורה מוזמן לחדר התצפית ,נאמר לו שהוא מתבקש להתנהג כרגיל ככל האפשר ושתיערך תצפית על האינטראקציה בינו לילדו .בדקות הראשונות מונחה ההורה לשחק עם הילד משחק חופשי .אחר כך ,חוקר מנהל שיחה עם ההורה במשך חמש דקות ליד הילד ובכך יוצר סימולציה של מצבים שבהם הורים עסוקים ואינם נגישים לילדם .בחלק זה ניתן היה לראות כיצד ההורה המשוחח עם החוקר מגיב לפניות של ילדו או לקשיים שבהם נתקל הילד במשחק .בהמשך ,ניתנת משימה להורה לכוון את ילדו לבצע פעולה משעממת של מציאת חפצים ,בדרך שהוא חושב שמתאימה לשלב ההתפתחותי שבו נמצא ילדו .אחר כך ניתנות עוד דקות אחדות למשחק חופשי ולאחר מכן משימה נוספת לסדר את החדר .ניתן לראות כיצד מבנה מורכב זה של הסיטואציה הנצפית נועד לאפשר הזדמנויות לבחון היבטים שונים כגון זמינות רגשית של ההורה ,יכולת לדיאלוג עם הילד וכדומה. דוגמה נוספת להבנייה מלאה של תנאי תצפית היא משימה הניתנת לילדים והנקראת )(McClelland and Cameron, The Head-to-Toes task (HTKS .)2012זו משימה הניתנת לילדים כדי למדוד את יכולתם לווסת את התנהגותם. במסגרת זו מקבלים התלמידים הוראות מורכבות המחייבות אותם לעקוב אחר ההוראות ולשלוט בתגובות האוטומטיות שלהם .למשל ,בשלב מסוים ההוראה היא שאם המדגים נוגע בראשו על הילדים לגעת דווקא בכפות רגליהם (ולהיפך) .לכל ביצוע נכון של ההוראה מקבל הילד 2נקודות ,לכל ביצוע נכון של ההוראה שמגיע לאחר תיקון שעורך הילד שמזהה שביצע את ההוראה באופן לא נכון מקבל הילד נקודה אחת ,ועל ביצוע לא נכון הוא אינו מקבל נקודות .משום שהתהליך מובנה בצורה קפדנית ותמיד ניתנות 20הוראות בסדר מסוים ,הציון שילד יכול לקבל נע בין 0ל.40- לעיתים ,בהתאם לצורכי המחקר ההבניה היא של תנאי התצפית בלבד ולא של ההתנהגות הנצפית עצמה .לדוגמה ,מחקרים שבהם נערכות תצפיות על טיפול פסיכותרפויטי ,נערכים במקום פיזי המאפשר הקלטה או הסרטה של המפגש הטיפולי ,מבלי להתערב במפגש עצמו ומבלי לתת כל הנחיות הקשורות בתצפית .כך למשל ,חוקר בחן הקלטות של עשרה מפגשים טיפוליים שנערכו עם שני מטופלים, וערך ניתוח תוכן בדיעבד של השימוש במטפורות ,על ידי המטפל והמטופל ( Tay, .)2017 דוגמה מעניינת לתצפיות הנערכות במצבי חיים טבעיים ,ולעיתים קרובות גם ללא מודעות של הנצפים ( בתנאי שאין פגיעה בכללי האתיקה ושמירת הפרטיות), אך בכל זאת מבנות את סיטואציית התצפית היא מחקר שנערך בטורקיה .החוקר ערך תצפיות על מדרגות נעות ועל גרם מדרגות רגילות במרכז קניות .הוא ביקש לבחון האם ההתנהגות של הקונים משתנה לפי השלטים שהוצגו לפני המדרגות
( .)Aksay, 2014לשם כך הוצב בסמוך למדרגות שלט שהכיתוב בו הוחלף אחת לכמה ימים .ההודעות על גבי השלט היו בין היתר' :נא להשתמש במדרגות'' ,בריא לעלות במדרגות'' ,לא בריא לעלות במדרגות' (החוקר בדק התנהגויות של קונים הסובלים מעודף משקל ניכר והבחירה בנוסחים השונים הייתה קשורה לבדיקה זו). התצפית נערכה בסביבה טבעית ,אך הגירוי בתצפית היה מובנה. במקרים מסוימים יש חשש שהבנייה של סיטואציית התצפית תפגע בתוקף שלה .ברונפנברנר ,שהיה מודע מאוד להשפעות של ההקשר ( ,)contextציין: ‘Much of contemporary developmental psychology is the science of the strange behavior of children in strange situations with strange adults for the briefest possible periods of time’ (Bronfenbrenner, 1977, p. 513). הדגשה זו בעניין החשיבות שיש לעריכת תצפית בהקשר האמיתי של התנהגות מצביעה על החשש שתוקף התצפיות בסיטואציות מובנות לקוי ,משום שאנו בודקים לא את מה שאנו מתכוונים לבדוק ,התנהגות טיפוסית ,אלא אנו בוחנים התנהגות במצבים מלאכותיים ,שאינה בהכרח דומה להתנהגות הטבעית .ו אומנם ,מחקרים שהשוו אינטראקציות אם-תינוק שנערכו במצבים מובנים (לצורכי מחקר) להתנהגויות ספונטניות הצביעו על הבדלים משמעותיים בין מאפייני האינטראקציה בסיטואציות השונות (לדוגמה ,ראו סקירה אצלTamis‐LeMonda, Kuchirko, Luo, : .)Escobar, & Bornstein, 2017.סביר שפערים דומים קיימים גם במקרים אחרים שבהם נשווה בין התנהגות בסביבה מובנת לשם תצפית לבין התנהגות במצבי חיים רגילים. חשוב להדגיש ,שאין בזה כדי לומר שאין לעשות שימוש בתצפיות בסיטואציות מובנות .להבניה זו עשויה להיות תרומה חשובה למחקר ,משום שהיא מאפשרת לחקור תופעות שיהיה קשה מאוד לזהות ולצפות בהם אם נעשה שימוש בתצפיות טבעיות בלבד .יתרה מזו ,יש גם עדויות לכך שהשפעתה של ההבניה של סיטואציית התצפית מתפוגגת עם הזמן .זאת ,משום שמשתתפים היודעים שצופים בהם ,נוטים לשכוח את זה עם הזמן ,וחוזרים ומתנהגים באופן טבעי .לכן ,הפער בין התנהגות טבעית לזו של מי שיודע שצופים בו ,הולך וקטן עם הזמן ,ויש אף החושבים שמדובר בפרקי זמן קצרים במיוחד. ^^##399תצפיות במצבי חיים טבעיים ()naturalistic observations מצדו השני של רצף ההבניה של סיטואציית התצפית ניתן למצוא תצפיות הנערכות במצבי יום-יום ללא הבניה כלשהי .תצפיות הנערכות ברחוב ,בחצר בית הספר ,בשדה התעופה ובמקומות רבים אחרים ,על התנהגויות טבעיות שאינן חלק ממניפולציה מחקרית או מהבניית הסיטואציה .כפי שניתן לשער ,התנהגויות הנערכות בתנאים שונים של תצפית ,עשויות להיות שונות .דוגמה מעניינת היא תצפית על התנהגות אימהית לתינוקות .דרך אחת היא לצפות בהתנהגות ספונטנית של אימהות המטפלות בתינוקן ודרך אחרת היא להבנות את התצפית ,למשל על ידי הכוונת האם לבצע פעולות טיפול מסוימות או הבאת האם לחדר תצפית ,שבו ידוע לה שצופים בה מעבר למראה חד-כיוונית .באשר לתקפות המדידה נראה שיש
יתרונות לתצפית על התנהגויות הנעשות באופן טבעי ובמינימום מודעות ותשומת לב לכך שההתנהגות נצפית .אולם לעיתים קרובות ,כדי שניתן יהיה לצפות באופן יעיל ולתעד את התצפית ,חוקרים נאלצים ליצור סביבה פחות טבעית ,כגון הכנסת המשתתפים לחדר תצפית. אחד האמצעים לגשר בין הרצון לאפשר תצפית בתנאים טבעיים ולצורך הטכני לתעד את התצפית הוא מכשור אלקטרוני .דוגמה מעניינת לתצפית טבעית הנעזרת במכשור אלקטרוני היא מחקרים הנעשים באמצעות Electronically Activated ) .Recorder (EARמכשיר הקלטה קטן זה נישא על ידי המשתתף שהסכים לכך ומתוכנת לפעול ברווחי זמן שנקבעו מראש (למשל 50 ,שניות כל 9דקות). המשתתפים מתנהלים בשגרת יומם ואינם אחראים להפעלת המכשיר ,שאינו משמיע רחש בעת שהוא מקליט ,כך שהמשתתף אינו מודע להפעלתו הזמנית .מכשיר זה מבטיח תיעוד של הדברים שנאמרים על ידי המשתתף ובני שיחו ,המודעים לנוכחות של מכשיר ההקלטה ,בזכות שלט קטן המבהיר שהמשתתף הוא חלק ממחקר ובו דבריו מוקלטים .לאחר תקופה קצרה של שימוש במכשיר זה ,המשתתפים נוטים לשכוח שהם מוקלטים ,ובכך ניתן להבטיח שהתצפית קרובה למצב העניינים הטבעי ככל שניתן ).(Karan, Wright, & Robbins, 2017 במחקר על הסתגלות זוגית ( )dyadic adjustmentלמחלת סרטן של אחד מבני הזוג ,רצו החוקרים לעמוד על תכני השיחות בין בני הזוג המתמודדים עם המחלה. בין היתר רצו לבחון תכנים העוסקים במחלה ,שימוש במילות עידוד של בני הזוג, הופעתן של מילים המביעות חששות ופחדים ,תקווה ואופטימיות ,תמיכה בדרך התמודדות מסוימת ועוד .הדרך המקובלת היא לשאול את בני הזוג על התנהגויות מילוליות אלו .אולם ,סביר מאוד להניח שהם יתקשו לאפיין בצורה מדויקת את תוכן השיחות ,מכיוון שמדובר בהתנהגויות שנעשות באופן בלתי מודע .כמו כן העדיפו החוקרים לא להביא את בני הזוג למעבדת המחקר ולבקש מהם לנהל שיחה כדי שאפשר יהיה להקליט אותם .החוקרים העריכו כי השימוש ב EARכעזר לתצפית שמע יהיה פתרון שיוכל לתרום להגדלת התקפות של התצפית .לפי דיווחי החוקרים, נראה היה שהכלי לא גרם להתנהגות מאולצת והחומר שהתקבל מהתצפית היה אמין ( Karan et al., 20017,כמו גם .)Robbins, López, Weihs, & Mehl 2014 ^^##400פולשנות ( )obtrusivenessותגובתיות ()reactivity ככלל ,אנו מעוניינים ככל האפשר לערוך תצפיות בתנאים קרובים למציאות ,כדי שהתצפית שלנו תתעד את ההתנהגות שבה אנו מעוניינים ולא התנהגות המשקפת את ההשפעה של המדידה .ככל שהתצפית פולשנית יותר כך היא עלולה לעורר בקרב המשתתפים תגובות השונות מההתנהגות הטבעית ,שבה יש לנו עניין ,ומשום כך להניב מידע מחקרי מוטה ובלתי תקף .כך למשל ,תצפית הנערכת על ידי אדם מבוגר בגן משחקים לילדים עלולה להביא לכך שהילדים יתנהגו בדרך שהם מקווים שתתקבל על דעתו של המבוגר ('בלי מכות') ,ולאו דווקא בדרך המשקפת את התנהגותם בדרך כלל .תופעות מעין אלו מתרחשות גם כשהצופה אינו שוהה פיזית
בקרבת המשתתפים ,אך הם יודעים שצופים בהם (למשל ,מעבר למראה חד כיוונית או באמצעות מצלמות). חוקרים ערים לצורך לצמצם את הסכנה לתוקף הנובעת מתגובתיות לצופה, ומנסים באמצעים שונים להפחית את רמת הפולשנות של התצפית .לעיתים תכופות, משך הזמן שבו נערכת התצפית משפיע על מידת התגובתיות .מסתבר ,שבמקרים רבים מתרגלים לנוכחות של צופה במשך זמן קצר .בעוד שבדקות הראשונות כל מושאי התצפית בוחנים את הצופה ואת התנהגותו (או חושבים על מה חושב הצופה שמעבר למראה) ומתנהגים באופן שאינו רגיל עבורם ,הרי בהמשך רבים מתעלמים מהצופה וחוזרים להתנהגויות הרגילות שלהם .כמובן ,ככל שהצופה עצמו מצניע את עצמו ואת התנהגותו ,כך פוחתת השפעתו במהירות רבה יותר. לעיתים ,ניתן להפחית את רמת הפולשנות של התצפית על ידי שימוש בצופה המוכר למשתתפים ומהווה חלק טבעי מסביבתם .כך למשל ,מדריך בפנימייה הצופה על חניכים המשחקים במגרש הכדורגל אינו מעורר בדרך כלל תגובה ,והחניכים ממשיכים בפעילותם הרגילה .יש לשקול כמובן את ההיבטים האתיים הכרוכים בתצפית על משתתפים שאינם יודעים שהם חלק מתהליך מחקרי. ^^##401מי הצופה אחת ההחלטות המרכזיות של חוקר המתכנן תצפיות היא הבחירה מי יהיו הצופים .ניתן לראות כאן רצף שבקצה האחד צופים שהם אנשי המחקר ואינם חלק מהמשתתפים ,ובקצה השני של הרצף ,המשתתף עצמו המשמש כצופה על התנהגותו .לכל אחת מהאלטרנטיבות על הרצף יש יתרונות וחסרונות והבחירה נעשית בהתאם לצרכים ולתנאים של המחקר המסוים שאותו אנו מבקשים לערוך. צופה לא משתתף ,איש מחקר לעיתים קרובות חוקרים נעזרים בצופים שאחראים לביצוע התצפיות כמי שאינם חלק מהמשתתפים .יתרון גדול של צופים אלו הוא חוסר המעורבות הרגשית שלהם, ה'אובייקטיביות' שלהם .יש מי שיטענו שאין אדם שהוא אובייקטיבי באופן מלא ,וכי אי אפשר להימנע ממעורבות רגשית המשפיעה על תהליך התצפית .ובכל זאת ,אנו יכולים לבחור צופים שאין להם סיבה מוקדמת לראות את התופעות בדרך מוטה. וחשוב מכך ,תהליך ההכשרה של צופים מקטין את השפעותיהן של דעות קדומות ועמדות קודמות שלהם ,כך שניתן לראות את התצפית שלהם כמהימנה ותקפה יותר. כך למשל ,חוקרים מציגים בפני מי שהם מדריכים ,סרטים המציגים דוגמאות לגירויים שעליהם הם יצפו ומנחים אותם על מה עליהם להתמקד בתצפית ,משווים את תשובותיהם לתשובות של צופים אחרים ,ומתקנים את ההערכות הצופים כדי שיתאימו להערכות התקפות המצויות בידי החוקר. דוגמה להכנת צופים ניתן לראות בתחום ההערכה של איכות ההוראה של מורים בכיתה .כפי שאומרות מק-קי וסילבה ( ,( McKay & Silva, 2015אם אנו מבקשים להעריך את איכות ההוראה של מורים באמצעות צופים ,עלינו להבטיח את התוקף והמהימנות של הצופים .זאת ,באמצעות הכשרה מוקדמת ,ליווי והדרכה .כדי להכין צופים ,נעשית עבודת הכנה שבה מציגים להם את כלי התצפית המובנה ,המכיל את כל ההערכות שעל התצפיתן למלא ,ואת ההנחיות כיצד להגיע לכל אחת מההערכות
אלו .בכלי זה ההערכות מבוססות על תצפיות בהתנהגויות קונקרטיות שעל התצפיתן להכיר ולבחון אותן במהלך התצפית .התצפיתן לומד להימנע מהערכות כוללניות שאינן מבוססות על תצפיות קונקרטיות (למורה כישורים טובים בניהול כיתה) ,וכן להתמקד בהתנהגויות הרלוונטיות בכל אחד מתחומי ההערכה. במהלך תהליך ההכשרה הצופים עברו תהליך של 'כיול' ( )calibrationשמסייע להם להשתמש בהערכות בדרך הדומה לשאר הצופים .בתהליך זה ההערכות של התצפיתן מושוות ל'תצפיות מודל' ,כך שניתן לראות עד כמה ההערכות של התצפיתן בהכשרה דומות להערכות שניתנו על אותו גירוי (סרט על התנהגות מורה בכיתה) על ידי מפתחי הכלי (המהווים את 'המודל') .באחת הדוגמאות שהחוקרות מביאות, תהליך ההדרכה כלל שלושים שעות הכנה ולמידה ,שבסופן התצפיתנים נבחנו .אולם, תהליכי הליווי וההדרכה נמשכים גם לאחר שההכנה הראשונית הסתיימה .זאת ,כדי למנוע מצב של 'סחיפה' ( )driftעם הזמן ,ואיבוד העיגון עם שנלמד במהלך ההכשרה. תצפית עצמית ,ניטור עצמי (self monitoring, systematic self- )observation בחלק מהמחקרים המשתתף עצמו צופה על התנהגותו ומתעד אותה 'בזמן אמת' .לשיטת תצפית זו יתרונות וחסרונות .אפשר באמצעותה לצפות בהתנהגויות וגם ללמוד על תחושות שקשה להגיע אליהן באמצעים אחרים ובעיתוי הנכון .כך למשל ,משתתפים יכולים לתעד את מה שהם אוכלים ,את השימוש שלהם בטלפון, את התחושות שלהם ברגע נתון ועוד .הקושי בשיטת תצפית זו נובע מהעובדה שעצם תהליך התצפית העצמית משפיע על האדם .למעשה ,יש טכניקות התערבות המבוססות על העדויות האמפיריות המשכנעות שהעובדה שאדם מתעד את התנהגותו ואת רגשותיו עשויה להשפיע על התנהגותו ותחושותיו בעתיד .לדוגמה, רישום בזמן אמת של מאכלים וכמויות אוכל שאדם צורך ,הוא אחד האמצעים שהוכיחו עצמם בהפחתת הכמויות של המזון הנצרך ,ובהתאם הפחתת משקל (ראו למשל סקירה שיטתית (.)Burke, Wang, & Sevick, 2011 תצפית משתתפת ()participant observation נפתח ונדגיש שהשימוש בשיטה זו ,המשלבת תצפיות וכלי מחקר נוספים (כגון ראיונות) ,נעשה בדרך במסגרת מחקרים איכותניים והיא מורכבת ועשירה מכדי שניתן יהיה להציגה בפירוט במסגרת זו (קוראים המעוניינים ללמוד על דרך מחקרית זו מוזמנים לעיין במקורות כגון .)Grinnell & Unrau, 2010כאן נסתפק רק בהצגה ראשונית. חוקרים בוחרים בתצפיות משתתפות כשהם מבקשים להתקרב למושאי המחקר שלהם בדרך שתבטיח שיוכלו לצפות בהם בתנאים טבעיים ככל שניתן ובאופן פתוח ולא מתגונן על ידי מושאי התצפית .כך מנסים החוקרים להבין את זווית הראייה המיוחדת למושאי מחקרם .בתהליכים של תצפית משתתפת החוקר מצטרף לקהילה שאותה הוא רוצה לחקור ,מתקרב לאנשים שבה ,יוצר יחסי אמון ,משתתף בחייהם, בטקסים ובאירועים מיוחדים וצופה בחיי היום יום שלהם בהיותו חלק מהם ,על אף שברור שהוא אינו דומה לשאר חברי הקהילה .בכך מנסה החוקר להיחשף באופן
בלתי אמצעי ולאורך זמן ניכר לרבדים עמוקים יותר של התרבות המקומית ,גם לאותם רבדים שחברי הקהילה עצמה יתקשו לנסח ולתאר באופן מילולי. בעבר נעשה שימוש רב בתצפיות מסוג זה במחקרים אנתרופולוגיים כדי ללמוד ולהכיר תרבויות לא מערביות .במשך השנים נעשה שימוש בתצפיות אלו גם כדי לחקור 'תת-תרבויות' שהחוקר מחפש דרך להתקרב ולהבין אותן על אף שהוא אינו שייך לה .כך למשל ,חוקרים ערכו תצפיות משתתפות בקרב קבוצות אסירים שהיו מעורבות בקבוצות טיפול של 'צדק מאחה' ( .)restorative justiceבמסגרת זו, הצופה שימש כעוזר למנחה קבוצה לצדק מאחה וכך היה חלק בלתי נפרד מהתהליכים ,תוך כדי תצפית לא מובנת על התהליכים הקבוצתיים .במחקר זה הצופה לא הקליט את השיחות הקבוצתיות ולא ניהל רישום שוטף כדי לא להפריע לתהליכים הטבעיים של הקבוצה .מיד לאחר כל מפגש ,הצופה תיעד את כל רשמיו מהמפגש .כמו כן ,אחת לזמן מה נערך ראיון מעמיק עם הצופה כדי לקבל ממנו מידע מקיף והתרשמויות על התהליכים שלהם היה עד ובהם נטל חלק ( & Armour .)Sliva, 2016 בדרך כלל ,אנשי מחקר העושים שימוש בתצפית משתתפת אינם מסתירים את זהותם בפני המשתתפים האחרים ,ומשקיעים זמן רב בכניסה הדרגתית לתוך הקהילה ,תוך יצירת יחסי אמון בינם ובין חברי הקהילה הנחקרת .עם זאת ,יש גם מקרים שבהם הצופה בוחר (לאחר קבלת אישור של ועדת אתיקה) להסתיר את זהותו ,ובמידה רבה להציג את עצמו כאדם אחר ממי שהוא .כך לדוגמה ,ברנשטיין ( )Bernstein, 2012ערך מחקר שבו שולבו שלושה עוזרי מחקר בצוות העובדים של מפעל מכוניות ,מבלי ליידע את שאר העובדים (רק מנהל המפעל והאחראי על משאבי אנוש ידעו מי הם) .המטרה הייתה לזהות תהליכים המתרחשים על רצפת המפעל שאינם חשופים למי שאינו עובד ייצור. בעשורים האחרונים יש שימוש גובר בתצפית משתתפת באינטרנט .בשיטת תצפית זו החוקר מצטרף לקהילה באינטרנט ומשתתף בפעילויותיה לאורך זמן ,תוך כדי שהוא מנסה לתעד את התהליכים המתרחשים בקבוצה .לדוגמה ,חוקר ביקש ללמוד על חייהם של טרנסג'נדרים המתמודדים עם סוגיות שונות בחייהם ,ובעיקר סוגיות הנוגעות למשמעות ההגדרות הרפואיות למיהו טרנסג'נדר .החוקר הצטרף לקבוצות של טרנסג'נדרים בפייסבוק וכן ביו-טיוב ופורומים באינטרנט .הוא השתתף באופן פעיל בדיון וכמו רבים אחרים בקבוצות אלו ,הוא הביע את דעותיו ,העלה פוסטים ,הגיב לפוסטים של אחרים וכדומה .החוקר מציין שהוא התייחס לאינטרנט כאל 'שדה המחקר' שלו .עם זאת ,החוקר ,וחוקרים אחרים שערכו סקירה שיטתית של תצפית משתתפת באינטרנט ,מצביעים על המורכבות הכרוכה בשדה מחקר זה שגבולותיו בזמן ו'במקום' אינם תחומים ,כפי שמקובל בתצפיות משתתפות הנערכות בשדות מחקר מסורתיים ,כמו קהילה או מקום גיאוגרפי. תצפיות משתתפות מעלות שאלות רבות בכל הנוגע לתגובתיות בעת התצפית, ולמידה שבה ההתנהגויות שבהן אנו צופים הן אומנם ההתנהגויות והתופעות שבהן יש לנו עניין או אולי אלו התנהגויות המהוות תגובה לנוכחות של הצופה .אלו הן כמובן סוגיות מרכזיות הנידונות בהרחבה בספרות הענפה העוסקת בתצפיות משתתפות. חוקרים בתחום זה עיצבו את תהליכי התצפית בדרכים שנועדו להגביר את התקפות
והמהימנות שלהם .התייחסות מעמיקה לסוגיות אלו ניתן לראות למשל ב- .Musante, & DeWalt, 2010 ^^##402ניתוח תוכן – כמותי אחת הדרכים לאסוף מידע היא באמצעות ניתוח של חומרים קיימים כגון מסמכים, סרטים והקלטות ,המכילים חומר מילולי או ויזואלי .כך למשל ,נעשה שימוש בניתוח תוכן של טקסים שונים ובהם :נאומי מנהיגים ,פרוטוקולים של ישיבות ,תיקי מטופלים ,הקלטות של טיפולים נפשיים ,תכנים של סרטים ,בחינת הסטריאוטיפים בספרי ילדים ודוגמאות רבות אחרות .ניתוח תוכן של ראיונות וטקסטים אחרים הוא כלי מרכזי בניתוח מידע שנאסף במחקר איכותני .במסגרת פרק זה נתמקד בניתוח תוכן המוביל לניתוח כמותי של הממצאים .ניתן לראות ניתוח תוכן כמותי במידה רבה כשימוש בתצפית מובנה ולא פולשנית על חומרים מילוליים או ויזואליים. לניתוח תוכן יתרונות וחסרונות ויש לבחון את התאמתו לשאלת המחקר המעניינת אותנו .למשל ,לשיטה זו עשוי להיות יתרון במצבים מסוימים שבהם אנו מנסים להבין תהליכים ועמדות כפי שהיו בנקודת זמן מסוימת בעבר וכל ניסיון לבקש תיאור רטרוספקטיבי עלול להיתקל בבעיות זיכרון ,בראייה מעוותת של העבר, שייתכן שהן מכוונות מתוך מטרה להסתיר או שהדבר נובע מתוך ראיית עולם מוטה שאינה מודעת למציאות .דוגמה מעולה למצב כזה בישראל היא ניתוח פרוטוקולים של ישיבות שנערכו על ידי מקבלי החלטות ,כגון החלטות בנושא מדיניות עלייה, יישוב עולים במקומות מסוימים ולא אחרים ,פינוי תושבים ממקומות מסוימים ועוד. בניגוד לדרך שבה המעורבים בהחלטות אלו (או אלו המבקשים להגן עליהם) ירצו להציג החלטות אלו כיום ,פרוטוקולים אלו עשויים לחשוף עמדות ושיקולים שהיו מקובלים על מקבלי ההחלטות בעבר ,אך הם אינם יכולים להודות בהם בפומבי כיום. ניתוח תוכן הוא כלי מרכזי במחקרים בתחום התקשורת המילולית והחזותית, בין היתר ניתוח פרסומות ,משדרי תעמולה ובחירות ,ספרי ילדים וספרי לימוד. לדוגמה ,קבוצת חוקרים השוותה ספרי לימוד באנגלית ממלזיה ,אינדונזיה ,בנגלדש ופקיסטן ( .(Islam & Asadullah, 2018במסגרת המחקר הם בחנו סטריאוטיפים מגדריים הנוגעים לנשים ,כפי שהן מופיעות ומצגות בספרים אלו .בין היתר הם השוו מה שיעור הנשים המופיעות בטקסט ובתמונות (פחות במידה ניכרת מאשר גברים), ובאלו פעילויות מופיעים הגברים (פעילויות מחוץ לבית) בהשוואה לנשים (פעולות אחזקת הבית) .הניתוח אפשר גם לזהות הבדלים ניכרים בין המדינות שנבדקו. בדוגמה אחרת ניתחו אהרוני וקופר ( (2015תוכן של תגוביות (טוקבקים) לכתבות שפורסמו בישראל ואשר עסקו בהתעללות בקשישים ובהזנחתם .סך הכול ניתחו החוקרות 3,463יחידות שהתייחסו לחמישים כתבות .בניתוח זה עמדו החוקרות על משתנים שונים ובהם :מה סוג השיח ,מה סגנון התגובה ומהם הנושאים הנכללים בתגובה. ניתוח תוכן הוא שיטה המתאימה למצבים שבהם מנסים לזהות התנהגויות מורכבות ודפוסים של תופעות הדורשים ניתוח מעמיק של חומר גלם רב .דוגמה בולטת היא ניתוח הקלטות של טיפולים נפשיים .בהקלטות אלו יש מידע נרחב ביותר על תהליכי הטיפול ,כפי שהם עולים בדברי המטופל והמטפל .הדרך הסבירה היחידה
למצות חלק ממידע זה ,היא לנתח את תכני השיחות העולים מההקלטות .לעיתים קרובות ,את אותם חומרי גלם ניתן לנתח מזוויות שונות ולבחון שאלות מחקר אחרות. לדוגמה ,חוקרים באוסטרליה רצו לבחון האם 'אירועי שינוי משמעותיים' ( )Significant Change Eventsבטיפול מערבים תכנים קוגניטיביים באופיים או דווקא רגשיים .חוקרים אלו ניתחו הקלטות (אודיו) של טיפולים פסיכולוגיים ,ובחנו מילים ומשפטים שהופיעו בנקודות זמן שהוגדרו כאירועי שינוי משמעותיים .החוקרים מצאו שיש שילוב של שימוש במילים המביעות רגש עז ,לצד ביטויים המצביעים על תובנות קוגניטיביות ( .(McCarthy, Caputi, & Grenyer, 2017חוקרים אחרים עשויים לנתח את אותן הקלטות כדי לבחון כיצד מתפתחת הברית הטיפולית לאורך הטיפול. עוד נציין כי ניתוח תוכן הוא חסכוני במשאבים והחומרים שנאספו יכולים לשמש מחקרים אחדים ולא מחקר יחיד .למשל ,במחקר שערכנו על קבלת החלטות לשחרור מצה\"ל עקב בעיות נפשיות ערכנו ניתוחי תוכן של מאות תיקום של חיילים שהובאו לדיון בוועדות המתאימות ,וערכנו השוואות בין מקרים שבהם התקבלה החלטה לשחרר את החייל לאחרים .אילו היינו צריכים לאסוף מידע זה רק בעבור המחקר, היה נדרש מאתנו זמן רב והשקעה גדולה מאוד של משאבים. לשיטה זו לאיסוף נתונים יש גם מגבלות ,הנובעות בעיקר מהעובדה שהחומר שאנו מנתחים לא נאסף בצורה מכוונת כדי לענות לשאלות המחקר שלנו .בדוגמה שניתנה לעיל מצאנו שונות רבה בתיעוד שערכו המטפלים למאפייני החיילים שהגיעו לטיפולם ואת ההנמקות שלהם להחלטה האם לשחרר מהשירות הצבאי .בדומה, במחקר שנועד לבחון קבלת החלטות של ועדות תכנון לטיפול בעניינם של ילדים בסיכון ,נמצא שבדוחות ובתיקים רבים שנדונו היה חסר מידע רב .כמו כן גם כשהמידע נמצא בתיקים ,הוא אינו מאפשר הבחנות רגישות לגבי תופעות ,אלא בעיקר מאפשר לדעת אם מידע מסוים קיים או לא .למשל ,ניתן לנתח את התיק ולקבוע האם מוזכרת הזנחה פיזית ,אך בדרך כלל אין דרך להעריך את חומרת ההזנחה בצורה מהימנה ,שכן הניסוחים בתיק מעורפלים. ^^##403מה ניתן ללמוד מניתוח תוכן כאשר עורכים ניתוח תוכן אפשר להתמקד במידע עובדתי ,כגון האם המטופל בתיק שאנו מנתחים שירת בצבא ,נשפט למאסר בפועל ,למד באוניברסיטה ועוד. לעיתים בחינת התוכן היא בנושאים מופשטים ולא קונקרטיים ודורשים מידה מסוימת של פירוש עדויות המצויות בתיק .לדוגמה ,האם בתיק יש עדויות לקשיים בתעסוקה, תחושות דיכאון ,פוסט טראומה וכדומה. לעיתים הניתוח דורש פרשנות מקיפה ועמוקה יותר של המידע המופיע בחומר. כך למשל ,בחנו חוקרים מחשבות שכתבו חולי סרטן בתהליכי החלמה ביומן שיועד לכך ( .)Conley & Andersen, 2019המשתתפים כתבו את מחשבותיהם לכל תחום בנפרד כגון יחסים עם אחרים ,מחשבות על העולם ,על העצמי ועוד .שלושה מקודדים בחנו כל אחת מהמחשבות הרשומות ומיינו אותן לקטגוריות .פעולה זו הניבה 22 קטגוריות שונות כגון מחשבות על טיפולים אלטרנטיביים ,הרצון לצאת לחופשה, תפיסות של אנשים אחרים לגבי המחלה ,מחשבות באשר לשינוי במקום מגורים
ועוד .בשלב הבא של המחקר ,בחנו שני מקודדים כל אחת מהמחשבות הרשומות וסימנו לאלו קטגוריות היא שייכת. במחקרים שבהם עורכים ניתוח תוכן ,בעיקר בתחום התקשורת ,יש גם התייחסות לצורה ולמבנה של החומר .לדוגמה ,בניתוח ראיונות ,ניתן לבחון את משך הזמן שבו מדבר כל אחד מהמשתתפים בראיון ,ולהשוות את משך הזמן היחסי שמדבר המרואיין בסוגי ראיונות שונים ,כמו גם ,שינויים במבנה הראיון לאורך זמן. כך למשל ,ניתן לבחון האם יש הבדל בין משך הזמן שבו מטופלים מדברים למשך הזמן שבו מדברים מטפלים ,והאם הבדלים אלו שונים בין סוגי טיפול שונים או בין נקודות זמן שונות במהלך הטיפול. בניתוחי תוכן של מסרים ויזואליים אפשר להתייחס לסוגיות כמו שימוש בצבע, מה נמצא בחזית המסר ומה מהווה רקע .כך למשל ,מחקר בחן פרסומות לתרופות שהופיעו בטלוויזיה האמריקנית .במסגרת המחקר ניתחו החוקרים את המסרים הוויזואליים המלווים את החלק בפרסומת המדווח על הסכנות ועל תופעות הלוואי של התרופה .המפרסמים חייבים על פי חוק להציג מידע זה ,אך נראה שהם מנסים להשתמש במסרים ויזואליים כדי להטות את תשומת הלב של הצופים הרחק מהסכנה .בין היתר הם מצאו כי במהלך הצגת הטקסט העוסק בתופעות הלוואי האפשריות של התרופה ,שהוא מטבעו מורכב וקשה להבנה ,הפרסומת הציגה תמונות חיוביות מלוות במוזיקה קצבית ,של אנשים מאושרים בשגרת חיים טובה, וצמצמו את נוכחותם של המסרים המאיימים ( Sullivan, Aikin & Poelman, .)2019 ^^##404תהליכי ניתוח תוכן כמותיים בכל ניתוח תוכן יש מספר צעדים. הגדרת יחידת הניתוח אחד השלבים הראשונים המקובלים בניתוח תוכן היא ההחלטה 'מהי יחידת הניתוח' .בדרך כלל יש בפני החוקר מידע המופיע במבנה המקורי שלו :סרטי קולנוע או פרסומות ,ספרים ,מכתבים ,פרוטוקולים או תיעוד של אינטראקציה מילולית מתמשכת .על החוקר להחליט האם כל סרט קולנוע הוא יחידת ניתוח אחת או אולי כל סצנה; האם ראיון מוקלט עם מטופל יהווה יחידת ניתוח אחת או אולי כל אחד מ'חילופי מילים מטפל-מטופל' או כל יחידת זמן בת שלוש דקות .אלו הן שאלות שיש לענות עליהן לפני ניתוח התוכן .החלטות אלו מתקבלות בכל שדה מחקר על בסיס אופי החומר שאותו מנתחים ,שאלות המחקר והמסגרות התיאורטיות שמנחות את המחקר .להלן דוגמאות המצביעות על הבחירה ביחידות ניתוח שונות במחקרים בתחומים שונים. במחקר על עימותים וויכוחים בבחירות ,החוקר הגדיר כיחידת ניתוח כל שאלה שנשאלה על ידי המנחה ( .)Turcotte, 2017במחקר על ניסיונות השפעה על סדר היום ( )agenda settingבאולימפיאדת לונדון ,2012יחידת הניתוח הייתה 'ציוץ בטוייטר' (.)Blaszka, Burch, Frederick, Clavio & Walsh, 2012( )tweets במחקר על ההתייחסות ל'תחושות בטן' של מתמחים ברפואה בדיונים שנערכו עם המנחים שלהם ,התייחסו החוקרים לכל אחד מהמופעים שבהם דיבר המנחה או
המתמחה ( )turnכאל יחידה שחולקה להיגדים שעסקו כל אחד בנושא אחר ( .)Stolper et al., 2015ניתן לראות שחלוקה זו ליחידות היא מורכבת יותר ,משום שהיא דורשת הערכה של מנתח התוכן האם להיגד מסוים יש תוכן שונה משל היגד אחר במידה המצדיקה התייחסות אליו כאל יחידה נפרדת .במקרים מעין אלו יש חשיבות רבה לבחינת המהימנות התוך אישית והבין אישית של המקודדים ,כדי לוודא שגם החלוקה ליחידות ולהיגדים נעשית באופן דומה על ידי מקודדים שונים. במחקר על שינויים בקרב מי שטופלו בדיכאון באמצעות האינטרנט ,החוקרים בחנו כל אחת מהמילים שבהם השתמשו המטופלים כשתיארו מה היו הסיבות שלהם לפנייה לטיפול ותיארו את מצבם הנוכחי .ניתוח זה נעשה באמצעות תוכנת מחשב שקודדה כל אחת מהמילים לפי עולמות תוכן שנקבעו על ידי החוקרים כגון מילים המעידות על רגש שלילי ,רגש חיובי ,מילים המצביעות על סיבה למצבם ועוד ( (Van ..der Zanden, Galindo-Garre, Curie, & Cuijpers, 2014במחקרים רבים יחידת הניתוח מוגדרת כפרק זמן ,כגון שלושים שניות במהלך ראיון ,או מאה מילים רצופות בטקסט. דגימה של יחידות ניתוח לעיתים ,מספר יחידות הניתוח שיש בכל טקסט הוא גדול מאוד ואין זה ריאלי לנסות להקיף את כולן .לדוגמה ,חוקר מנסה לבחון שינויים לאורך זמן בשימוש בביטויים הקשורים לעצב ולדיכאון אצל מטופלים בשיטות טיפול שונות .הוא מבקש להשוות בין שני סוגי טיפולים ובכל סוג טיפול הוא בוחן מספר מטפלים ומספר מפגשים טיפוליים בני חמישים דקות כל אחד .יחידת הניתוח היא מספר המילים הקשורות למצב רוח שלילי ולמצב רוח חיובי ביחידת ניתוח של דקת דיבור .בדוגמה זו ,יש לשקול דגימה של יחידות ניתוח ,משום שכמות יחידות הניתוח בחומר עלולה להיות רבה ביותר ,הרבה מעבר למשאבים העומדים לרשות החוקר .בפרק 9נדון בשיטות דגימה שונות ונשוב לדוגמה זו כדי להצביע על שיטת דגימה שעשויה להיות מתאימה .כאן נציין שאנו עשויים לבחור לדגום בנפרד בעבור כל מפגש טיפולי ,לכל זוג מטפל-מטופל ובתוך כל מפגש לבחור באופן מקרי עשר הזדמנויות שבהן המטופל דיבר לפחות שלושים שניות. ניסוח הגדרות תפעוליות ניתוח התוכן הכמותי המתבצע על כל יחידת ניתוח מחייב הגדרות תפעוליות לכל אחד ממשתני המחקר .לעיתים ,יש לחוקר המגיע למחקר הגדרות תפעוליות מוסכמות שכבר נעשה בהן שימוש במחקרים קודמים ,הגדרות המשקפות מושגים רלוונטיים לתיאוריה בתחום זה ,וחשוב לחזור ולהשתמש בהגדרות אלה בדרך זהה לזו שנעשתה במחקרים קודמים כדי להבטיח את היכולת לשחזר (.)replicability דוגמה ידועה לשיטה של ניתוח תוכן המשתמש בהגדרות תפעוליות מוכרות (ומחייבות) היא תהליך שפיתח בלס ( )Balesלניתוח תהליכי אינטראקציה בקבוצות קטנות () .)Bales, 1950 ,Interaction Process Analysis, IPAזו למעשה שיטה שפותחה בעבור תצפית מובנית על פעילות של קבוצות קטנות ,אך ניתן לראות אותה גם כשיטה לניתוח תוכן משום שהיא יעילה בניתוח הקלטות ושכתובים של ראיונות. בניתוח מתייחסים לכל אחד מהדוברים ומסמנים אותם על פי 12קטגוריות כגון
מסכים עם דברי האחרים ,אינו מסכים ,מראה התנגדות ( ,(antagonismמעלה הצעה ,מבקש הצעות ,מציג עמדה ,מבקש שאחרים יציגו עמדה ועוד .קטגוריות אלו שייכות לממדים ממוקדי יחסים ורגש ( )social emotionalבאופן חיובי ושלילי וממוקדי משימה ( .)Taskלכל אחת מהקטגוריות יש הגדרה תפעולית מוסכמת ומחייבת .לדוגמה ,אלו חלק מההנחיות המפורטות לקידוד פעולה כידידותית: Seems Friendly: Any act showing hospitality, being neighborly, expressing sympathy, or similarity of feeling; indicates of being attracted, demonstrations of affection; urging of unity or harmony; expressing of desire for cooperation or ;solidarity; showing a protective or nurturing attitude ;praising, rewarding, approving, or encouraging others ;sustaining or reassuring a person having difficulty complementing or congratulating; exchanging, trading, or ;lending objects (e.g., a pen); confiding in another expressing gratitude or appreciation, surrendering or …;)giving into another (e.g., when interrupted חוקרים המבקשים לעשות שימוש ב IPA -צריכים לאמן את מנתחי התוכן לעבוד בצורה שיטתית עם הגדרות אלו ,ולהגיע לרמה מחייבת של מהימנות תוך- אישית ובין אישית .דוגמה לשימוש עדכני בשיטה זו ניתן למצוא במחקר חלוץ שערכה קטלדי ( )Cataldi, 2018שהתמקד ביחסים בין מתשאל לנשאל בשיטות תשאול שונות ,והשווה בין יחסים אלו במצבים של ראיונות עומק בהשוואה לקבוצות מיקוד. לעיתים ,ההגדרות התפעוליות של משתני המחקר נלקחות ממקורות שונים ואינם מהווים שיטת ניתוח אחת כמו ב IPA-המתוארת למעלה .דוגמה עדכנית היא מחקר שביקש להבין את מהות היחסים הבין אישיים לכאורה ( )parasocialהנוצרים בין צופים ובין האישיות המפורסמת המופיעה בערוץ יוטיוב ( .)YouTubeכלומר, המידה שבה צופה עשוי לחוש שמדובר באדם אמיתי ואותנטי וזאת על סמך ניתוח סרטוני וידאו שבהם מופיעה אישיות זו .החוקרים התמקדו בעשרת הערוצים הפופולריים ביותר והציגו שורה של השערות באשר לתכנים ולמאפיינים צורניים של סרטוני הווידאו ובהן :מה הקשר בין דרגת החשיפה העצמית של האישיות ומאפייניה (חשיפה של היבטים חיוביים ,שליליים או ניטרליים) ובין היחס החברתי לכאורה אליה; מה הקשר בין כיוון המבט של האישיות ובין היחס אליה; מה הקשר בין זווית הצילום ובין היחס החברתי לכאורה לאישיות? (.(Ferchaud, Grzeslo, Orme, & LaGroue, 2018 החוקרים השתמשו בכלים שונים שהותאמו לשימוש זה לכל אחד מהמשתנים בהשערות .כך למשל השתמשו בשיטה מקובלת להעריך את המידה והתוכן של חשיפה עצמית ,לערוך קטגוריזציה של הסרטון ( Gaming, tutorial, product ,)reviews, sketches, vlogs, music videos, podcasts, and otherלהעריך בסולם בן חמש קטגוריות באיזו מידה הסרטון נתפס כאותנטי ומציאותי ,לסווג את
זווית הצילום של האישיות לפי מספר קטגוריות (פני האישיות אינם מופיעים ,פנים מופנות למצלמה ,פנים אינם מופנות למצלמה) ועוד. במקרים רבים אחרים ,תהליך עיצוב ההגדרה התפעולית מבוסס במידה רבה על למידה של החומר הקיים ובחינה של מה ניתן להפיק ממנו ומה לא מופיע בו. במחקר שבחן מהם המאפיינים של משפחות אומנה שקלטו בהצלחה ילדים לעומת משפחות אומנה שבהם הסידור קרס ונכשל ,ערכנו ניתוח של דוחות מובנים שהוכנו על ידי העובדים אשר טיפלו בתהליכי הקבלה והמיון של הילדים .היו לנו השערות מוקדמות באשר לסיבות המבחינות בין המשפחות ,אך עיון בדוחות הבהיר שעלינו לבחון תחילה את הדוחות ולא להתבסס על מה שאנו חושבים שאמור היה להיות בדוחות אלו (צרויה.(2018 , במקרים מעין אלו מתבצע תהליך מוקדם של ניתוח תוכן ,שמטרתו לזהות מה המשתנים שנראה שיש עליהם מידע ומה המשתנים שרק במקרים ספורים יש אליהם התייחסות .יש לזהות לגבי כל אחד מהנושאים (טיב היחסים בין הורי האומנה ,טיב היחסים בין הורי האומנה למשפחת המוצא שלהם ,טיב היחסים בין הורי האומנה לילדיהם הביולוגיים) ,את הנושאים השונים שעולים מתוך החומר הקיים ,ולבדוק אם ניתן לזהות סוגיות מסוימות שאליהן יש התייחסות ברמה סבירה בחומר הקיים .כך למשל ,ניתן לראות ברוב הסיכומים שהעובדים ציינו אם הורי האומנה המיועדים יכולים לסמוך על עזרה של משפחות המוצא שלהם .במצב זה ניתן להעמיק ולבחון אם יש מידע נוסף בתחום זה כדי להמשיך לקטגוריות מדויקות יותר .במקרה הנוכחי, שבו המידע לא היה עשיר ועקבי דיו ,נאלצנו לסווג את המידע המופיע בדוחות כדלקמן .1 :יש מידע המצביע על תמיכה ממשפחת המוצא .2 .יש מידע המצביע על קושי בקבלת תמיכה ממשפחת המוצא .3 .אין מידע על תמיכה ממשפחת המוצא. אימון להגברת המהימנות של מנתחי התוכן ובדיקת מהימנות כמו כל דרך מדידה אחרת ,חוקרים העושים שימוש בניתוח תוכן מבקשים להגביר את מהימנותו של הכלי ולתעד אותה ,כדי להצביע על תכונות פסיכומטריות סבירות .במחקרים אלו יש תהליכים מקדימים של אימון החוקרים העוסקים בניתוח התוכן בהכרת הקטגוריות לניתוח ,הצגת דוגמאות כיצד יש לבצע קטגוריזציה נכונה וכן בדיקה חוזרת ונשנית של מידת ההסכמה של מנתחי תוכן על הקטגוריות והערכים שבהם בחרו .לאחר מכן מתקיים דיון על אי ההסכמות ובמקרים רבים החוקרים הבכירים הם אלו המכריעים .מקובל לקבוע רף של הסכמה שעד שלא הגיעו אליו ,לא מאפשרים לכל אחד מהמקודדים לנתח את התוכן באופן עצמאי. למשל ,במחקר של פרשוד ועמיתיו ( (2018המקודדים נדרשו להגיע להסכמה בין אישית שהתבטאה במקדם מהימנות בין מקודדים העולה על ערך של .70%רבים משתמשים במדד המהימנות של קריפנדורף ( )Krippendorfשהוא דמות בעלת השפעה מכרעת בתחום (למשל.)Krippendorf, 2004 , קידוד וקידוד ממוחשב מנתחי התוכן מקודדים את החומר על פי כללי הקידוד שנקבעו ואשר הגיעו לרף של הסכמה בין מנתחי התוכן כך שיאפשר להם לקודד .בעשורים האחרונים נעשה שימוש רב בתוכנות הסורקות את הטקסט ומבצעות עיבודים מורכבים שונים
המאפשרים לחוקרים לקודד כמויות משמעותיות ביותר של תוכן באופן מהיר ,וחשוב יותר ,באופן עקבי ,קרי מהימן .לדוגמה ,מחקר שבחן כיצד סקרה חברת החדשות הרשמית של רוסיה ITAR-TASSאת המלחמה באוקראינה ב – .2014המחקר סקר כתשעים אלף ידיעות חדשותיות שפורסמו על ידי חברה זו ומעל למאה אלף ידיעות שפורסמו על ידי חברת חדשות אחרת .כל הפריטים נסרקו על ידי תוכנת מחשב ששילבה תוכנה גיאוגרפית שאיתרה את כל המקומות שהוזכרו בכתבה (ואפשרה להתמקד רק באזורים באוקראינה) ותוכנה שאפשרה לזהות את שמות התואר שנקשרו לביטויים כגון 'ריבונות' ו'דמוקרטיה' ולהעריך אם הן בטאו עמדה חיובית או שלילית .נמצא מתאם גבוה בין ההערכות של תוכנת המחשב ובין ההערכה של בודקים אנושיים שבחנו מדגם של קטעים שנותחו על ידי התוכנה. עיבוד הנתונים והצגתם לאחר תהליכי הקידוד תורגם כל המידע המילולי והוויזואלי שנותח במסגרת המחקר לקודים ממוחשבים הניתנים לעיבוד כמו כל מידע כמותי אחר .החוקרים מנתחים את המידע הזה לפי שאלות המחקר שהם הציגו .כך למשל ,הם עשויים להציג בלוח את התפלגות הקטגוריות השונות .במחקר של סוליבן וחובריו על פרסומות לתרופות ( )Sullivan et al., 2019הציגו המחברים מידע תיאורי על מספר פרצי הווידאו ( ,)video shotsכמה מתוכם היו חיובים ( )28ושליליים ( ,)1כמה מהצילומים שיקפו את הסכנות שבתרופה (אף לא אחד) .במחקר אחר ,נבחנו הקשרים שבין הקטגוריות שאליהן קודדו מחשבות של חולי סרטן מחלימים ובין הערכתם את אופי השינויים בחייהם .כך למשל ,נמצאו קשרים בין הימצאות מחשבות על מיניות ועל תופעות לוואי ובין הערכות שליליות על אופי השינוי בחיי המשתתפים. לסיכום חלק זה ,נזכיר שניתוח תוכן הוא כלי נפוץ שמשתמשים בו במחקרים איכותניים ,אך הוא כלי היכול לסייע רבות במחקרים בעלי דגש כמותי הבוחנים תכנים מילוליים וויזואליים .תהליכי הקידוד השיטתיים והמובנים וההקפדה על מהימנות הקידוד ,מאפשרים שימוש בנתונים לצורכי עיבוד כמותי. תרגילים לפרק 8 פרק 9 דגימה מבוא לעיתים אנו עורכים מחקר הממוקד באוכלוסייה שחשובה לנו ואנו יכולים להקיף את כולה .מנהל מערכת חינוך עירונית עשוי לרצות לשמוע את קולם של כל התלמידים והמורים במערכת החינוך שלו .מנהל שירות חברתי עשוי לבקש לקבל משוב על שביעות הרצון של כל הלקוחות המשתתפים בתוכנית של חלוקת מזון לנזקקים. במקרים מעין אלו ,העניין שלנו מתמקד בקבוצה מוגדרת ואין בכוונתנו להכליל ממה שמצאנו לקבוצות אחרות. במצבים רבים אחרים ,איננו יכולים להסתפק בקבוצה המצומצמת של המשתתפים במחקרנו .שוו בנפשכם שאנו מעוניינים ללמוד על שביעות הרצון של
אלפים המשתתפים בתוכנית מסוימת ,או שאנו מבקשים לשמוע מה חושבים עשרות אלפי הורים לתלמידים במערכת החינוך בתל אביב על איכות התוכניות לפעילויות אחר הצהרים שהעירייה מפתחת לתלמידיה .במצבים אלו ,הניסיון להגיע לכל אוכלוסיית המשתתפים אינו ריאלי ולכן עלינו לבחור תת קבוצה ,כלומר ,מדגם ,מכלל אוכלוסיית המשתתפים ,לערוך את המחקר רק על הקבוצה הנבחרת ולנסות להסיק ממה שלמדנו ממנה על האוכלוסייה המעניינת אותנו. הצורך במדגם בולט במיוחד במחקרים המציגים השערות מבוססות תיאוריה, המנסות לתאר תופעות שמאפיינות אוכלוסיות רחבות מכל מה שניתן לחקור באופן ישיר .חשבו על חוקר המבקש לבחון את הקשר בין רמת האמפתיה של איש מקצוע ובין שינויים חיוביים אצל מטופל או על חוקרת המבקשת לבחון את הקשר בין בריונות המופנית כלפי תלמיד ובין מחשבות אובדניות של תלמיד וכן על חוקרים המבקשים לבחון אם תוכנית מנטורינג לצעירות בסיכון מגבירה את יכולתן להשתלב בלימודים ) .)https://mentoritil.wixsite.com/mentoringבכל הדוגמאות האלה החוקרים מבקשים לבחון תופעות שהן רחבות היקף ,אך אינן אוניברסליות ,שברור שלא ניתן למצות אותן על ידי כך שננסה לחקור את כל מי שעשוי להיות רלוונטי לשאלה שאנו מציגים. ברור לכן שמרכיב חשוב במחקרים רבים שנערוך יהיה בחירת מדגם מתאים לצרכינו .מטרתנו בפרק זה היא ללמוד מה נדרש ממדגם זה ,כיצד ניתן לדגום כך שהתהליך יבטיח לנו את המדגם הטוב ביותר האפשרי ,מה צריך להיות גודל המדגם כדי שיענה לצרכים שלנו וכיצד נתמודד עם מצבים שבהם איננו יכולים לבצע את הדגימה בדרך המבטיחה את איכותה. ^^##406מה אנו מצפים ממדגם טוב? חוקרת הבוחרת מדגם ואוספת נתונים על המדגם ,אינה עושה זאת משום שיש לה עניין בתוצאות שיתקבלו לגבי הקבוצה שבחרה למדגם .מטרתה היא כמובן להסיק מסקנות על האוכלוסייה שעליה היא מבקשת ללמוד .משום כך היא זקוקה למדגם שיבטיח לה ככל האפשר ,כי מהממצאים שתקבל היא תוכל להכליל לאוכלוסייה שעליה היא מבקשת ללמוד .ככל שהמדגם דומה במאפייניו לאוכלוסייה הוא טוב יותר .זוהי תכונה הידועה כ'ייצוגיות המדגם' ( )representativenessונעמוד עליה מיד. לפני כן ,נציין תכונה חשובה נוספת של המדגם :כמעט ברור מאליו שכשאנו מסיקים מסקנות ממדגם ,שהוא תת קבוצה של האוכלוסייה ,אנו 'משלמים מחיר' .אף מדגם אינו יכול להיות זהה בכל פרט ותג לאוכלוסייה שממנה נלקח וצפוי שהמדגם יהיה דומה אך לא זהה .משום כך ברור שכשאנו מנסים להכליל ממדגם לאוכלוסייה, עלינו לעשות זאת בזהירות ולהכיר בכך שייתכנו אי דיוקים בהכללה ובהסקה זו. מדגם טוב הוא כזה המאפשר לנו להיות בטוחים יותר שההכללות שאנו עושים
מהמדגם לאוכלוסייה קולעות למטרה ,ולפחות אינן רחוקות ממנה .מאפיין זה של דגימה קשור למושגים של 'טעות דגימה' ו'עוצמת המדגם' ,שנבחן אותם בהמשך. ^^##407ייצוגיות אנו מבקשים שהמדגם ייצג את האוכלוסייה .כלומר ,שמאפיינים המצויים באוכלוסייה יבואו לידי ביטוי במדגם ,מעין 'אוכלוסייה בזעיר אנפין' .לדוגמה ,אם אנו מבקשים ללמוד על אוכלוסיית הנשים שילדו לפני שהגיעו לגיל ,18חשוב לנו לוודא נקודות כגון אלו :התפלגות ההשכלה של הנשים במדגם תהייה זהה לזו שקיימת באוכלוסיית הנשים שילדו לפני שהגיעו לגיל ,18שיעור הנשים הנשואות במדגם יהיה דומה לזה באוכלוסייה ,התפלגות ארץ המוצא ,דת ,מספר הילדים במשפחת המוצא, אזור המגורים וכן שהישגים בלימודים והתפלגותם של מספר רב מאוד של מאפיינים אחרים תהייה דומה לזו באוכלוסייה .יתרה מזו ,כדי שהמדגם ייצג את האוכלוסייה, חשוב ששיעור הנשים במדגם שהן גם מוסלמיות וגם סיימו תיכון והן בעלות תעודת בגרות מלאה ואשר במשפחותיהן יש חמישה אחים והן גרות ביישוב עירוני ,יהיה דומה להתפלגות המשותפת של כל המאפיינים האלה ועוד אין ספור מאפיינים אחרים באוכלוסייה .לאור דוגמה זו ברור למדי שייצוגיות היא תמיד על רצף הנע בין 'המדגם כלל לא מייצג את האוכלוסייה' ל' -המדגם מייצג בצורה טובה את האוכלוסייה'. עם זאת ,חשוב להבין את הפרדוקס :אם היינו יודעים עד כמה המדגם מייצג את האוכלוסייה ,לא היינו צריכים כלל את המדגם! שהרי ,אם היה לנו מידע מפורט על מאפייני האוכלוסייה ,מה הטעם בדגימה? המשמעות היא שעלינו להתמקד בתהליך הדגימה שעשוי להבטיח מדגם מייצג ככל שניתן .בחלקים הבאים נבהיר את המושג :ייצוגיות המדגם ונפרט את התהליכים שעשויים להביא לכך שמדגם יהיה מייצג. אנו אומרים שמדגם מייצג את האוכלוסייה אם 'ההסתברות שפרט מהאוכלוסייה ייכלל במדגם שווה להסתברות הופעתו באוכלוסייה' .דרך אחרת ודומה היא לומר שמדגם הוא מייצג אם 'לכל פרט באוכלוסייה יש סיכוי שווה להיכלל במדגם' .ובדוגמה שהוצגה לעיל המדגם הוא מייצג כאשר לכל אחת מהנשים באוכלוסייה של נשים שילדו לפני גיל 18היה סיכוי שווה להיכלל במדגם ותהליך הדגימה הגיע גם לנשים בדואיות או לנשים שילדו בביתן וזה הילד השני שלהן .ניתן לכן להבין ,שאם החוקרת הסתמכה על רשומות מחדרי לידה ,ייתכן שהייתה מחמיצה את היולדת שילדה בביתה ,ובכך ,המדגם שלה לא יכול היה להיות מייצג את כלל האוכלוסייה שעניינה אותה. ^^##408כיצד ניתן להגיע למדגם מייצג כשאנו רוצים לוודא שמדגם שאנו יוצרים יהיה מדגם מייצג ,יש נטייה אינטואיטיבית לנסות לכלול בו באופן שיטתי דוגמאות של כל מי שנמצא באוכלוסייה. אך זהו ניסיון לא ריאלי שאינו יכול להביא לתוצאות הרצויות כי בלתי אפשרי לכלול באופן מלא את כל הצירופים האפשריים הקיימים באוכלוסייה .למשל ,אנחנו יכולים לנסות לוודא שיש במדגם שלנו 40%נשים ערביות ו – 25%בעלות השכלה יסודית, כמו באוכלוסייה של יולדות לפני גיל ,18אך מה לגבי השילוב בין לאום ומגדר? ומה
לגבי מאפיינים אחרים כמו גיל? כפי שציינו קודם לכן כמות הצירופים היא אין סופית. ייתכן שאנו יודעים מה התפלגות הגילים של אוכלוסיית הנשים שילדו לפני גיל ,18 אך בוודאי שאיננו יודעים פריטי מידע רבים על האוכלוסייה הזו ,כגון מהו יחסם של הורים ליולדת ומהן הציפיות שלה לעתיד ,נושאים העשויים להיות רלוונטיים לשאלות המחקר שלנו. משום כך ,הדרך להתמודד עם תהליכי דגימה שיובילו למדגם מייצג ,היא בדיוק בכיוון ההפוך מהאינטואיציה .במקום לנסות לייצג תת קבוצות באוכלוסייה ולהיות שיטתיים בייצוג שלנו ,אנו מנסים במכוון ללכת בכיוון ההפוך ולהיות ככל האפשר מקריים ולא שיטתיים .במקום להתאמץ ולנסות לייצג כל תת קבוצה באוכלוסייה ,אנו מנסים ליצור מצב שלא נושפע משום דבר ועל ידי כך ניתן לכל אחת מתת הקבוצות, גם לאלו שלא חשבנו עליהן ולא ידענו עליהן ,הזדמנות להופיע במדגם שלנו .זהו ההיגיון המנחה דגימה הסתברותית ( ,)probability samplingשהרעיון העומד מאחוריה הוא שלכל פרט באוכלוסייה יש הסתברות שווה להופיע במדגם .המבחן הוא בתהליך הדגימה – עלינו לבצע את הדגימה בדרך שתבטיח שכל פרט באוכלוסייה יהיה בעל סיכויים שווים לכל פרט אחר להיכלל במדגם .למשל ,שתהיה הסתברות שווה להיכלל במדגם בית ספרי הן לתלמידים הנוטים להיעדר מהלימודים והן לתלמידים שקדנים המגיעים לבית הספר גם בחופשה .נתאר כעת תהליכי דגימה העומדים ,או המנסים לעמוד ,בדרישה זו. ^^##409אוכלוסייה חשוב לתת את הדעת למושג אוכלוסייה ( )populationשאותו הזכרנו קודם המכונה לעיתים 'האוכלוסייה התיאורטית' ונבהיר מהי אוכלוסייה לצורכי הדיון שלנו. בדרך כלל אנו חושבים על אוכלוסיות של אנשים' :תלמידים בבתי ספר תיכוניים', 'נשים חרדיות העובדות בתעשיית הטכנולוגיה העילית'' ,ילדים שהוצאו מבית הוריהם עקב הזנחה והתעללות'' ,קשישים בבתי אבות' .אולם ,אוכלוסייה עשויה להיות גם פרטים שאינם אנשים' :כלל תאונות הדרכים בישראל שבהן מעורבים קשישים', 'עמותות ללא מטרת רווח העוסקות במתן סיוע לניצולי שואה'' ,מקרי אלימות במשפחה הגורמים לנזק גופני'' ,כתבות העוסקות במקרי בריונות בבית ספר'. בדוגמאות אלו ניתן אומנם למצוא התייחסות עקיפה לאנשים ,אך הפרטים באוכלוסיות אלו אינו אדם מסוים אלא אירוע ,גוף ארגוני ,כתבה וכדומה .כל מה שנאמר בהמשך על אוכלוסייה ותהליכי דגימה רלוונטי גם לאוכלוסיות אלו ,שאינן מורכבות מאנשים. קורה לא פעם שחוקרים דנים במידת הייצוגיות של המדגם במחקרם ובוחנים עד כמה ניתן להכליל את הממצאים ,אך מבלי שהגדירו כלל מה האוכלוסייה שלגביה הם רוצים להכליל .זוהי כמובן טעות .חיוני להגדיר את האוכלוסייה ,כדי שיהיה ברור לגבי מי רוצים להכליל מהמדגם .אם חוקרת הגדירה את אוכלוסיית המחקר שלה כך: כל הנשים המוסלמיות שילדו לפני הגיען לגיל 18בישראל בשנים ,2017 – 2012אך החוקרת לא כללה בתהליך הדגימה אמצעים להגיע לנשים שילדו בביתן ,הרי המדגם שלה לוקה ,על פניו ,בחוסר ייצוגיות .אך אם הגדרת האוכלוסייה של החוקרת ,לצורכי המחקר שאותו בחרה לבצע ,הייתה :כל הנשים המוסלמיות שילדו בבתי החולים בישראל לפני הגיען לגיל ,18הרי העובדה שהמדגם שלה לא כלל נשים שילדו בבית
או מי שאינן מוסלמיות ,לא תהייה עדות לחוסר ייצוגיות .למעשה ,העובדה שלא הכללנו נשים שילדו בביתן היא עדות לייצוגיות של מדגם ולא למגבלה שלו ,אם האוכלוסייה שלנו הוגדרה כלידות בבתי חולים. הבחירה של חוקרת בהגדרה מסוימת של האוכלוסייה נובעת משאלות המחקר, מהתיאוריה המנחה אותה ומהמידה שבה היא מבקשת להקיף תופעה רחבה ככל האפשר .חשוב לזכור שההגדרה צריכה לצפות פני עתיד ולשמש את החוקרת כאשר תגיע למדגם שייצג את האוכלוסייה שאותה היא שואפת להכליל .כאן יש להפעיל שיקול דעת :האם להגדיר את האוכלוסייה בדרך רחבה ולהכיר בהמשך בחוסר הייצוגיות של המדגם שאינו יכול להכיל הגדרה רחבה כל כך (בשלב הדיווח על 'מגבלות המחקר') ,או לצמצם את הגדרת האוכלוסייה מראש ,מתוך הכרה במגבלות המדגם שאליו ניתן להגיע .במקרה דנן ,החוקרת עשויה לציין שיש לה עניין לחקור את היחסים בין הורים ובין צעירות שילדו לפני גיל ,18ללא קשר לשאלה אם הן ילדו בבית חולים או בבית .אולם ,במחקר הנוכחי היא תתמקד באוכלוסייה שילדה בבתי חולים כי אין לה אפשרות לחקור אוכלוסיות נוספות .עם זאת ,היא תחפש דרכים במחקרים עתידיים להרחיב את שאלת המחקר ולהתייחס לאוכלוסייה רחבה יותר של נשים שילדו לפני גיל ,18בבתי חולים או בכל מסגרת אחרת .כפי שהדגשנו בפרקים הראשונים ,על אף שהדגימה נערכת בשלב מתקדם של תהליך המחקר ,חשוב להתייחס למצבים עתידיים ולשקול אם הגדרת האוכלוסייה היא ריאלית וניתן יהיה להגיע למדגם מייצג של האוכלוסייה בצורה סבירה ,או אולי כדאי להקטין ציפיות ולהגדיר אוכלוסייה מצומצמת יותר שהסיכויים לייצג אותה גבוהים. ^^##410מסגרת הדגימה ()sampling framework אוכלוסיית המחקר מופיעה כהגדרה מופשטת .חוקר המבקש לערוך מחקר צריך לבצע את תהליך הדגימה באופן קונקרטי ,בשטח .כדי להבטיח שתהליכי הדגימה מאפשרים לכל פרט באוכלוסייה סיכוי שווה להידגם ,עליו לדעת מי הם כל הפרטים הנכללים באוכלוסייה .משום כך ,הוא נזקק לרשימה של כל הפרטים השייכים לאוכלוסייה המעניינת אותו .לרשימה זו אנו קוראים מסגרת הדגימה .למשל ,חוקר שרוצה ללמוד על תאונות דרכים שבהן מעורבים קשישים בישראל בעשור האחרון, חייב שתהיה בידיו רשימה הכוללת את כל תאונות הדרכים בעשור האחרון בישראל, וכן פירוט הגילים של המעורבים בתאונות .חוקרת המבקשת לבחון עמדות של אנשי מקצוע בעמותות לגבי תהליכי הפרטה ,זקוקה לרשימה של כל אנשי המקצוע בעמותות ,וחוקרים הבוחנים את היחסים בין מנהלי בתי ספר יסודיים להורים ,זקוקים לרשימה של כל מנהלי בתי הספר היסודיים. לעיתים ,רשימה של הפרטים באוכלוסייה היא נגישה .ניתן לקבל את רשימת כל בתי הספר היסודיים בארץ ,והיא תהייה שלמה ומעודכנת למדי .ייתכן שגם רשימת תאונות הדרכים בעשור האחרון בישראל וגילי המעורבים בהן ניתנת להשגה. במקרים רבים אחרים ,השגת רשימה מעין זו קשה ,עד בלתי אפשרית .ראשית ,נבחן מצב שרשימה כזו קיימת ,או שניתן להפיק אותה ,כגון רשימת בתי הספר היסודיים,
ובהמשך נדון במצבים שבהם קשה או בלתי אפשרי להשיג את רשימת הפרטים במסגרת הדגימה. ^^##411פערים בין האוכלוסייה למסגרת דגימה במשרד החינוך קיימת רשימת כל בתי הספר היסודיים (הציבוריים) במדינה. לכאורה ,יש בידינו חפיפה מלאה בין הגדרת האוכלוסייה ובין מסגרת הדגימה .אולם, גם כשניתן להשיג רשימה של כל הפרטים באוכלוסייה ,ייתכן שיש פערים מסוימים בין ההגדרה התיאורטית של האוכלוסייה לרשימה שקיבלנו .למשל ,ייתכן שבמועד שבו נקבל את רשימת בתי הספר היסודיים הרשימה לא תהיה מעודכנת ויופיעו בה בתי ספר שכבר נסגרו או שהרשימה לא תכלול בתי ספר שזה עתה נפתחו .לפער זה בין האוכלוסייה למסגרת הדגימה עלולות להיות כמובן השלכות על מידת הייצוגיות של המדגם המתבסס על הרשימה .למשל ,אם בתי הספר החדשים שנוספו וטרם עודכנו שייכים למגזר החרדי ולעומתם בתי ספר המופיעים ברשימה אך אינם קיימים הם דווקא בתי ספר חילוניים באזורים בעלי מעמד סוציו-אקונומי גבוה ,הרי בכל דגימה שתתבסס על מסגרת הדגימה יהיה תת-ייצוג לבתי ספר במגזר החרדי וייצוג- יתר לבתי ספר חילוניים במעמד סוציו-אקונומי גבוה ,שמספרם באוכלוסייה נמוך ממה שניתן להסיק ממסגרת הדגימה. במקרים אחרים שבהם ניתן להפיק את הרשימה של מסגרת הדגימה ,ייתכנו פערים גדולים אף יותר בין האוכלוסייה התיאורטית למסגרת הדגימה .שוו בנפשכם שרשימת התאונות המעודכנת במשרד התחבורה מבוססת רק על תאונות שדווחו למשטרה (למשל ,לצורכי ביטוח) .מכאן ,שסביר שרשימה זו כוללת תאונות רבות עם נפגעים ,אך רק מעט תאונות ללא נפגעים מצאו את דרכן לרשימה .נניח ,לשם הדוגמה בלבד ,שנהגים קשישים מעורבים בתאונות קלות רבות שבהן הנהגים פגעו במכונית שלפניהן עקב אי שמירת מרחק או עקב תגובה איטית לעצירה פתאומית של הנהג האחר .במקרה כזה ,מסגרת הדגימה לא תיתן לתאונות אלו ייצוג מספק, וכמובן שמדגם מתוך מסגרת זו ,גם זה שייעשה בדרכים היעילות ביותר ,לא יוכל לייצג את האוכלוסייה התיאורטית שהוצגה בשאלת המחקר .המסקנה מכל האמור כאן היא שכל בחינה ביקורתית של מידת הייצוגיות של מדגם ,חייבת לכלול התייחסות לפערים אפשריים בין ההגדרה התיאורטית של האוכלוסייה לדרך שבה היא מיוצגת במסגרת הדגימה. ^^##412ממסגרת הדגימה אל המדגם נניח שיש בידנו מסגרת דגימה המספקת אותנו כדי להמשיך בתהליך .רשימה זו מכילה פרטים שאותם עלינו למספר .למשל ,ייתכן שבידינו רשימה של 76,000 תאונות המהוות את מסגרת הדגימה שלנו .כעת ,עלינו לפעול בדרך שתבטיח שלכל פרט ברשימה של מסגרת הדגימה יש סיכוי שווה להיכלל במדגם .כלומר ,נצטרך לבחור מתוך רשימת התאונות המלאה ,מדגם של תאונות בתהליך שאין בו הטיה כלשהי שתביא לכך שנבחר תאונות אלו ולא אחרות .כלומר ,נצטרך לנקוט בתהליכי דגימה המבטיחים מדגם הסתברותי מייצג .בחלקים הבאים נתאר דרכים מקובלות
שיבטיחו מדגם הסתברותי על סמך מסגרת דגימה העומדת לרשותנו והכוללת את רשימת הפרטים השייכים לאוכלוסייה. ^^##413שימוש בלוח מספרים מקריים כפי שציינו ,מטרתנו היא לערוך הליך דגימה שבו לא יהיה מנגנון כלשהו שיגרום לכך שלפרטים או לקבוצות מסוימות יהיה סיכוי גדול או קטן יותר משל אחרים להשתתף במדגם .משמע ,עלינו לנסות להגיע למקריות ולחוסר סדר בתהליך הבחירה של הפרטים ממסגרת הדגימה .בתרגילים שערכתי בכיתות שבהן לימדתי, ביקשתי מהתלמידים להכין רשימות של מספרים מקריים כלומר שאי אפשר יהיה למצוא הגיון כלשהו בסדר המספרים ,בטווח של .100 – 1התלמידים הכינו רשימות אשר בעיניהם נראו מקריות .במרבית הרשימות הופיע מספר נמוך אחרי מספר גבוה (כדי לאזן אותו) ,ולא ניתן היה למצוא מספרים עוקבים או מספרים החוזרים על עצמם .בכך שיקפו התלמידים את הדרך האינטואיטיבית שבה אנו מאמינים שמקריות פועלת .אולם ,במציאות ,המקריות פועלת בדרכים מורכבות מאוד ומספרים עוקבים או סדרה של מספרים גבוהים שאחריה מספרים נמוכים היא סבירה בדיוק כמו כל צירוף אחר .גם עבודותיהם של טברסקי ,כהנמן ואחרים הצביעו על פערים בין התחושה האינטואיטיבית שלנו באשר לתהליכים מקריים ובין התהליכים שנראו במציאות ( .)Tversky & Kahneman, 1981נראה לכן שזו תהייה טעות להישען על התפיסה האינטואיטיבית שלנו לגבי מקריות בבחירת פרטים ממסגרת הדגימה כדי לכלול אותם במדגם .למזלנו יש אלטרנטיבה לאינטואיציה של החוקר. אנשי מדע רבים הקדישו מאמצים ניכרים כדי למצוא סדר והיגיון בצירופי מספרים .לעומתם ,יש גם אנשי מדע שהתאמצו לייצר סדרות של מספרים ,שהמייחד אותן הוא חוסר סדר ומקריות .אלו הן סדרות מספרים שבהן אי אפשר למצוא היגיון או שיטתיות כלומר ,הסיכוי שמספר אחד יופיע ולאחריו יופיע מספר גבוה יותר שווה לסיכוי שהמספר שלאחריו יהיה דווקא נמוך יותר ,ואין שום סדר הגיוני בצירופי המספרים .התוצאה היא לוחות של 'מספרים מקריים' המכילים אלפי מספרים המאורגנים בלוחות שבכל אחד מהם אין שום סדר ושיטה בהופעת המספרים ,גם כשבוחנים את הלוחות בצורה אופקית או אנכית וגם במבט אלכסוני .רשימות של מספרים מעין אלו יכולות לכן לשמש אותנו בניסיון להבטיח שלא נכניס הטיה שיטתית כלשהי בבחירת הפרטים שייכללו במדגם (ראו למשל .)Blalock, 1960 ^^##414שימוש בפונקציות סטטיסטיות ליצירת מספרים מקריים בעבר היה מקובל להשתמש בלוחות של המספרים המקריים שהופיעו בספרי הסטטיסטיקה כדי לדגום מדגם מקרי .עם השנים פותחו אמצעים המאפשרים לנו לייצר מספרים מקריים בדרכים קלות ונגישות ,הנוחות יותר לשימוש מאשר לוחות למספרים מקריים .במרשתת יש אתרים אחדים המאפשרים ליצור בקלות מספרים מקריים .למשל ,באתר mathgoodies http://www.mathgoodies.com/calculators/random_no_custom.html ,ניתן לציין טווח של מספרים (לדוגמה )45,000 – 1 -ולבקש לייצר מספר רנדומלי בטווח זה .כל לחיצה על מקש ה enterמפיקה מספר מקרי נוסף ,כך שניתן לבחור בעזרתו את הפרט המתאים במסגרת הדגימה .לדוגמה ,כשביקשתי מספרים מקריים
בין 1ל – ,45,000חמשת המספרים הראשונים שקיבלתי היו,42 ,29 ,136 ,3 : .34 390כשאתם תנסו לייצר מספרים מקריים באמצעות אתר זה תקבלו כמובן מספרים אחרים ,הנובעים מהמנגנונים הסטטיסטיים שנועדו להפיק מספרים מקריים. לעיתים ,הרשומות של מסגרת הדגימה מצויות בקובץ אקסל או .SPSS במקרים מעין אלו ,אפשר ליצור משתנה נוסף שהוא מספר מקרי ,לצד מספר הזיהוי של הרשומה המקורית .באקסל הדבר נעשה על ידי )( = randובתוכנת SPSSניתן ליצור משתנה חדש (כיניתי אותו בשם המקרי ,)Mikriתוך ציון ערכי המינימום והמקסימום הרלוונטיים למחקרכם : )Compute mikri=RV.UNIFORM(1,45000 הפקודה הזו תיצור ,בעבור כל אחת מהרשומות במסגרת הדגימה המופיעות בקובץ ה SPSSשלכם ,משתנה נוסף שהוא מספר מקרי .לדוגמה ,כשהשתמשתי בתוכנה קיבלתי לצד חמש הרשומות הראשונות במסגרת הדגימה שלי את המספרים – .7009 13085 27548 19409 6285כמובן ,שבזכות התהליך המקרי ,מספרים אלו לא יחזרו על עצמם כשהקוראים ינסו את התהליך בתוכנה שלהם. כעת ,לכל רשומה במסגרת הדגימה יש מספר מקרי הצמוד לה .נניח שמסגרת הדגימה שלכם מכילה 45,000רשומות .כדי לשלוף מדגם ובו 350רשומות מתוך מסגרת הדגימה הגדולה זו ,הדרך הפשוטה היא למיין את הרשומות לפי הערך של המשתנה המכיל את המספר המקרי ,ולבחור את 350הרשומות הראשונות או האחרונות (ולמעשה כל קבוצה אחרת של 350רשומות עוקבות) במסגרת הדגימה הממוינת. ^^##415דגימה מקרית שיטתית נניח שיש לנו רשימה של 50,000עובדים סוציאלים בישראל השייכים לאיגוד העובדים הסוציאלים ואנו מבקשים לדגום באופן מקרי 400מתוכם .כלומר ,אנחנו צריכים מדגם המהווה 400/50,000מהרשימה ( .)1/125לערך הזה של 1/125 קוראים 'יחס (או צעד) הדגימה' .במילים אחרות ,אם מתוך כל 125עובדים סוציאלים נבחר עובד סוציאלי אחד ,נגיע ל .400-כיצד נבחר את אותם עובדים סוציאלים כך שהם יהוו מדגם מקרי? התהליך הוא כדלהלן .יש להכין רשימה ממוספרת של כל הפרטים במסגרת הדגימה .למשל ,רשימת כל החברים הרשומים באיגוד .הרעיון בדגימה זו הוא לבחור פרטים למדגם על ידי דילוגים שיטתיים ברשימה שיצרנו .כלומר ,אנחנו בוחרים באופן מקרי את נקודת ההתחלה של הדגימה ולאחר מכן אנו דוגמים על ידי כך שאנו מדלגים על מספר מסוים של פרטים ,ובמקרה זה מדלגים 125מקומות .לדוגמה ,בחרנו באופן מקרי להתחיל מפרט מספר 25ואז נדלג על 125פרטים ,ונגיע ל ,150 -לסמן אותו כשייך למדגם ,ומשם לדלג 125 פרטים נוספים ולהגיע ל ,275-לסמן אותו כשייך למדגם ,לדלג לפריט ,400לסמן אותו ,לדלג ל ,525 -לסמן אותו וכך הלאה ,עד שנשלים הכללה של 400פרטים במדגם .אם בדוגמה אחרת נבקש להגיע למדגם של 500מרפאים בעיסוק מתוך
מסגרת דגימה של 8,000אנשי מקצוע ,יחס הדגימה הוא 500/8000ששווה ל 1/18 ונבצע את הבחירה השיטתית בקפיצות של .18 שיטה זו יכולה להביא למקריות שאנו מבקשים ,אלא אם מתקיימים תנאים מסוימים שעלולים לפגוע במקריות .צריך להיזהר שמא הדרך שבה מסודרת רשימת הפרטים במסגרת הדגימה עלולה לפגוע במקריות .לדוגמה ,נניח שאנו רוצים לדגום הורים מתוך רשימת כל ההורים בבית הספר (ונניח שמדובר בהורים ממשפחות שלמות שבהן לכל ילד שני הורים) .אם הרשימה מאורגנת כך ששני בני הזוג מופיעים זה ליד זה ,הרי ברור שבמדגם שלנו לא יכללו שני בני זוג ,כי הם קרובים מאוד זה לזה ברשימה ובאופן שיטתי הם לא ייבחרו יחד להיכלל במדגם .יתרה מזו ,אם אנו מדלגים במספרים זוגיים (נניח כל הורה ,)50הרי יתכן שנבחר רק אבות או רק אימהות .בדוגמה אחרת ,נניח שאנו מבקשים ללמוד על יחסים בין תלמידים בכיתה. אם תלמידים יקבלו מספרים לפי סדר הישיבה בכיתה ,הרי ישנה אפשרות סבירה שבה כל מי שייכלל במדגם הם תלמידים שאינם יושבים קרוב זה לזה בכיתה .ייתכן שמצב זה ייפגע ביכולת שלנו להכליל מהיחסים בין התלמידים במדגם ליחסים בין התלמידים באוכלוסייה ,הכוללת גם תלמידים היושבים זה לצד זה .ודוגמה נוספת, אם אנו בוחרים מתוך רשימה של פונים לפי תאריך הגעתם ללשכה לשירותים חברתיים ,ויחס הדגימה המסוים שבחרנו מביא אותנו משום מה לבחור בעיקר פונים שהגיעו ללשכה בסוף החודש ,אנו עלולים להגיע להטיה .נציין ,שאם הרשימה מסודרת בסדר אלפביתי של שמות משפחות ,יש החוששים לבעייתיות בדגימה כי לחלק משמות המשפחה (כהן ,לוי) יש יותר סיכוי להידגם .אך ,זהו חשש שווא ,משום שאם יש יותר פרטים ברשימת הדגימה ששמם לוי ,מן הראוי שמספרם הרב ישתקף במדגם שאנו בוחרים ,כך שהסיכוי שלהם להיכלל במדגם יהיה שווה לחלקם באוכלוסייה. ^^##416דגימת שכבות ()stratified sample בחלקים הקודמים הצגנו שיטות שונות (לוח מספרים מקריים ,דגימה מקרית שיטתית) שמטרתן להגיע למדגם הסתברותי מייצג .לעיתים דגימה מקרית פשוטה, כמו אלו שהצגנו ,אינה מהווה פתרון טוב ,ויש לשקול שיטות מורכבות יותר .נניח שחוקר מתכוון לחקור משפחות שבהן שני הורים לילד עם סכרת נעורים ומבקש להשוות בין רמות הדחק של האבות לעומת האימהות .החוקר מתכונן לתהליך הדגימה מתוך ידיעה שברצונו להשוות בין שתי קבוצות ההורים ,שגודלן באוכלוסיית המחקר שלו שווה .אנו מכנים את קבוצת ההורים ואת קבוצת האימהות 'שכבות' באוכלוסייה .אם יבחר באחד התהליכים שתיארנו קודם ,הוא עלול (בהסתברות מסוימת ,אולי לא גדולה ,אך קיימת) לקבל מדגם מקרי שבו שיעור האימהות שונה באופן משמעותי משיעור האבות .אפשרות זאת היא חלק מהטעות שעליו לקבל בתהליך הדגימה המקרי .החוקר יכול להחליט לפעול בדרך אחרת ,לפצל את תהליך הדגימה המקרית ולדגום מחצית מהמדגם בנפרד מתוך אוכלוסיית האבות ואת המחצית השנייה לדגום מאוכלוסיית האימהות .המדגם שיקבל החוקר יהיה מקרי, כפי שרצה ,אך בדגימה הנפרדת של כל שכבה ,הוא מנע את האפשרות לקבל מדגם
שבו ההתפלגות של אימהות מול אבות הייתה שונה מ ,50:50שאנו יודעים שהיא מתקיימת באוכלוסייה .במקרים אלו לדגימת השכבות יש יתרון משמעותי. נאמר לכן ,שבמקרים שבהם אנו יודעים מראש שנבקש לערוך השוואות בין קבוצות ,ואנו יודעים כיצד השייכות הקבוצתית מתפלגת באוכלוסייה ,יש מקום לשקול 'דגימת שכבות' ,קרי ,לדגום באופן נפרד מכל שכבה .לדוגמה ,במחקר שערכנו על אלימות במערכת החינוך רצינו לקבל מידע על קורבנות של תלמידים לאלימות בנפרד לתלמידים בבתי הספר היסודיים ,בחטיבת הביניים ובחטיבות העליונות (בנבנישתי וחובריו .)2005 ,משום כך ,בתהליכי הדגימה זיהינו שכבות לפי סוג בית ספר ואת הדגימה ערכנו בנפרד בקרב תלמידים בבתי הספר היסודיים ,בחטיבות הביניים ובחטיבות העליונות .זאת ועוד ,התבקשנו להעריך האם יש הבדלים ברמות הקורבנות לפי הפיקוח על בתי הספר :ממלכתי יהודי ,ממלכתי ערבי וממלכתי דתי. לכן רצינו לדגום בנפרד מכל קבוצה .למעשה ,שילבנו את השכבות כך שדגמנו בנפרד מכל צירוף של שכבות (כגון תלמידים בבתי ספר יסודיים בממלכתי דתי ,תלמידים בבתי ספר תיכוניים במגזר הערבי וכדומה) .בדוגמה זו יש תשעה תאים (שלושה סוגי בתי ספר כפול שלושה סוגי פיקוח) .בדגימת שכבות זו ,נעשית דגימה מקרית מכל אחד מהתאים בנפרד. יש להבחין בשני סוגים של דגימת שכבות :פרופורציונלית ולא פרופורציונלית. בדגימה מהסוג הראשון אנו דואגים לכך שבכל אחת מהשכבות במדגם יש מספר פרטים המשקף את חלקה היחסי (פרופורציה) של השכבה באוכלוסייה .למשל, בדוגמה שהוצגה לעיל ,במחקר על אבות ואימהות מספר המשתתפים בשכבת האבות יהיה זהה למספר האימהות .במחקר המשווה תלמידים יהודים לערבים בבתי הספר היסודיים שבו גודל המדגם הוא אלף תלמידים ,כאשר ידוע שיש 1/3תלמידים מהמגזר הערבי ו 2/3-יהודים ,נדגום 667תלמידים יהודים ו 333-תלמידים ערבים, כך שנשמור על משקלם היחסי באוכלוסייה של תלמידים בבתי ספר יסודיים. בנסיבות מסוימות ,מדגם שכבות פרופורציונלי עלול להיות מוגבל ולא מתאים. לדוגמה ,חוקר המבקש להשוות שביעות רצון בעבודה בין עובדים לעובדות סוציאליות או בין מורים למורות בבתי ספר יסודיים יגלה שאם יקפיד לשקף במדגם את הפרופורציות באוכלוסייה ,מספר הגברים שיוכל לכלול במדגם יהיה קטן כל כך, שיקשה עליו לבצע את המחקר .לדוגמה ,שיעור הנשים המורות הוא כ.86% - כלומר ,במדגם של 500משתתפים מספר הגברים יהיה רק 70לעומת 430נשים. בהשקעה הגדולה הנדרשת להשיג מדגם של 500משתתפים יש קושי להסתפק ב- 70גברים בלבד .כפי שנראה בהמשך ,המספר הנמוך של הגברים במדגם פוגע בניסיון שלנו לאמוד בצורה טובה את שביעות הרצון של הגברים באוכלוסיית המורים על סמך המדגם שבחרנו. האלטרנטיבה במצבים כאלה היא לבחור בדגימת שכבות לא פרופורציונלית. בדוגמה שלפנינו ,החוקר עשוי לבחור לדגום 250מורים בדגימה מקרית בקרב המורים ו 250-מורות בדגימה מקרית מכלל המורות .בדרך זו הוא יוכל להבטיח השוואה יעילה בין שני מדגמים מייצגים ,אחד מייצג את אוכלוסיית המורים והאחר את אוכלוסיית המורות .אולם ,ברור שמדגם של 500מורים ומורות אינו מייצג את
אוכלוסיית המורים והמורות ,שהרי החוקר עשה מאמץ מיוחד שמאפייני האוכלוסייה לא יהיו מיוצגים כהלכה במדגם שלו. האם יש דרך להשתמש במדגם שכבות לא פרופורציונאלי בדרך שתבטיח שהוא בכל זאת ייצג את האוכלוסייה? התשובה היא חיובית .מכיוון שאנו יודעים כיצד 'סטינו' מהפרופורציה באוכלוסייה ,אנו יכולים לתקן את הסטייה בדיעבד .לדוגמה, במחקר שתיארנו קודם ,הפרופורציה של גברים במדגם היא 50%בעוד שהפרופורציה שלהם באוכלוסייה ,הפרופורציה ה'אמיתית' שלהם ,היא רק .14% לעומת זאת ,הפרופורציה של נשים באוכלוסייה היא 86%אך במדגם רק .50%כדי להגיע לפרופורציות הנכונות ,עלינו להקטין את המשקל של כל גבר במדגם (14/50 = ,)0.28ולהתאים את המשקל של כל אישה ( .)1.72 = 86/50למקדמים אלו אנו קוראים משקלות דגימה והם מסייעים לנו לקבל מדגם מייצג .כעת ,לצד כל גבר מופיע משקל הדגימה שלו 0.28ולצד כל אישה משקל הדגימה שלה .1.72 נניח ששביעות הרצון הממוצעת של מורים גברים היא 7בסולם 10 – 1שבו 10 הוא שבע רצון מאוד ו 1 -כלל לא .נניח גם שממוצע שביעות הרצון של המורות הוא .5אילו חישבנו את הממוצע הפשוט של 7ו 5-היינו מקבלים את הערך .6אולם, ממוצע זה מבוסס על משקל שווה של נשים וגברים ואינו מביא בחשבון את משקלות הדגימה .הדרך הנכונה היא לחשב ממוצע משוקלל ,תוך שימוש במשקלות הדגימה, כך שכל גבר יתוקן באמצעות משקלו וכך גם כל אישה .חישוב זה נראה כך0.28*7 : .5.16 = 5*1.72 +כצפוי ,ניתן לראות שממוצע המדגם לאחר שימוש במשקלות הדגימה משקף את ממוצע הנשים (המהוות רוב גדול) יותר מאשר את ממוצע שביעות הרצון של הגברים .נדגיש :ניתן לחשב משקלות דגימה לקבוצות במדגם ,רק כשידוע לנו מה הפרופורציה של כל קבוצה מכלל האוכלוסייה. עוד על משקלות דגימה השימוש במשקלות דגימה כדרך להגביר ייצוגיות אינו מוגבל למחקרים שבהן נעשית דגימת שכבות לא פרופורציונית .למעשה ,סקרים רבים מחשבים משקלות דגימה כדי שהמדגם שאליו הגיעו יהיה דומה ככל שניתן לאוכלוסייה שאותה הם מבקשים לייצג. לדוגמה ,קבוצת חוקרים בספרד ערכה בדיקות סרולוגיות במטרה להעריך את השכיחות של החשיפה לנגיף הקורונה באוכלוסייה (.) Pollann et al., 2020 במחקר מסוג זה חשוב במיוחד להגיע למדגם מייצג ככל שניתן משום שעל בסיס הממצאים במדגם מבקשים להעריך את רמת התחלואה האמיתית באוכלוסייה ,כולל מי שאינם מראים סימפטומים ,או מי שהיו חולים והחלימו ,ואינם יודעים על כך .לאחר שביצעו דגימה שכבתית לא פרופורציונית בקרב המחוזות השונים בספרד חישבו החוקרים משקלות דגימה .חלק מהחישוב דומה למה שתיארנו קודם ,ובאמצעותו נתנו משקל מתאים למחוזות השונים משום שחלקם קטנים במיוחד והיה צורך לדגום מהם דגימת יתר וחלקם גדולים במיוחד והם נדגמו דגימת-חסר. החלק האחר של החישוב נועד לתת מענה לעובדה שלא כל האזרחים שפנו אליהם הסכימו להשתתף ,כך שהמדגם בפועל לא היה המדגם המתוכנן ,שהיה אמור להיות מייצג .משום כך ,החוקרים בחנו עבור כל מחוז את התפלגות ההכנסה ,המין והגיל של כלל האוכלוסייה של המחוז (כפי שהיא ידועה ממקורות אמינים כגון מפקד
האוכלוסין) .כעת ,עבור כל מחוז הייתה להם ההתפלגות בפועל במדגם של שלושה משתנים אלו ,וכן את ההתפלגות באוכלוסייה .חישוב משקלות הדגימה נועד להביא לכך שההתפלגות של הכנסה ,מין וגיל במדגם המתוקן (לאחר חישוב משקלות הדגימה) יהיה זהה (או דומה ככל שניתן) להתפלגות באוכלוסייה. בדוגמה אחרת ,ערכנו סקר בקרב כלל הסטודנטים באוניברסיטה העברית ושאלנו אותם שאלות שונות הקשורות להתנסויות שלהם בזמן מגפת הקורונה .אנו אמנם פנינו לכל הסטודנטים באמצעות דוא\"ל אישי ,אך ,כצפוי ,לא כולם ענו .קיבלנו מדגם שבו יכולנו לחשב את ההתפלגות של מין ,השתייכות לפקולטה מסויימת ,התואר שאליו למדו (ראשון ,שני ,שלישי ,לימודי תעודה) ולאום יהודי-ערבי .במקביל ,קיבלנו מהאוניברסיטה את המידע על ההתפלגות של משתנים אלו באוכלוסיית האוניברסיטה .חישבנו משקלות דגימה שנועדו להביא את המדגם שלנו למצב שבו יהיה דומה יותר לאוכלוסייה של הסטודנטים באוניברסיטה העברית. בשתי דוגמאות אלו היה בידי החוקרים מידע על התפלגות משתנים באוכלוסייה. חוקרים רבים המבקשים לחשב משקלות דגימה פונים למידע שנאסף על ידי רשויות כגון הסקר החברתי של הלשכה המרכזית לסטטיסטיקה בישראל (https://www.cbs.gov.il/he/subjects/Pages/%D7%94%D7%A1%D7%A7%D7% )A8-%D7%94%D7%97%D7%91%D7%A8%D7%AA%D7%99.aspxובארה\"ב ( .)https://www.census.gov/programs-surveys/acs/data/pums.htmlאולם ,לא תמיד יש בידינו מידע על האוכלוסייה הרלבנטית למחקר שלנו .למשל ,מי שעורך מחקר בקרב צעירים בסיכון יתקשה למצוא מידע על מאפייני האוכלוסייה של צעירים בסיכון ולכן לא יוכל לחשב משקלות דגימה להתאמת המדגם לאוכלוסייה הרלבנטית. חישוב משקלות הדגימה עלול להיות מורכב למדי .זאת ,משום שלא די לחשב כיצד לתקן את התפלגות המין במדגם כך שיתאים לזו באוכלוסייה (למשל ,לתת משקל קטן יותר לנשים מאשר לגברים ,כי יותר נשים הסכימו להשתתף במחקר בהשוואה לגברים) ,אלא יש להביא בחשבון גם את הצורך בתיקונים ברמת ההכנסה והגיל בדוגמה מספרד ותיקונים בהתפלגות הפקולטות ,התארים והלאום ,בדוגמה של האוניברסיטה העברית .ייתרה מזו ,תהליך מדויק יותר הוא כזה שאינו רק מתקן עבור מין ולאום ,אלא גם עבור ההתפלגות המשותפת שלהם -ייתכן שהתפלגות המין בקרב אוכלוסיית הסטודנטים היהודיים אינה דומה לזו שבקרב הסטודנטים הערבים, ולכן לא די יהיה לתקן לפי שיעור הגברים והנשים ושיעור היהודים והערבים ,אלא גם לפי שיעור הסטודנטיות שהן ערביות ויהודיות ,וכן הלאה .מורכבות זו דורשת תהליך חזרתי ( )iterativeשבו מחשבים משקלות דגימה על ידי התאמה למשתנה אחד (למשל מין) כך שההתפלגות של המשתנה מין במדגם זהה לזו באוכלוסייה .אחר כך עוברים למשתנה השני (לאום בדוגמה זו) .מתחילים ממשקלות הדגימה שנקבעו על ידי התאמה למשתנה המין ומחשבים תיקון במשקלות הדגימה כך שההתפלגות של לאום במדגם תהייה זהה לזו באוכלוסייה .אולם ,תיקון זה מביא לכך שההתפלגות של מין במדגם תסטה במעט מזו שבאוכלוסייה ,ולכן עושים תיקון נוסף ,עוברים למשתנה הלאום ומתקנים גם שם .כל אחד מהתיקונים הוא קטן מקודמו ,עד שאין ממש צורך בתיקון נוסף (כלומר ,מגיעים להתכנסות ,ובאנגלית (.)convergence - יש המוצאים בתהליך זה דימיון לשימוש במגרפה בגינה שבה מגרפים לכיוון אחד,
ואחר כך לכיוון הניצב ,וחוזר חלילה עד שמגיעים לפני שטח מיושרים .משום כך, הביטוי המקובל באנגלית לדרך שבה מחשבים משקלות דגימה כך שההתפלגות במדגם המתוקן תתאים להתפלגות באוכלוסייה הוא , rakingתהליך של גירוף ) .( .https://www.abtassociates.com/raking-survey-data-aka-sample-balancing נציין שהמורכבות של חישוב משקלות דגימה ידועה ופותחו טכניקות שונות לחישוב משקלות דגימה ,כשידועה התפלגות של משתנים מסוימים באוכלוסייה .פותחו אלגוריתמים לחישוב משקלות דגימה והם מוטמעים כתוכניות מאקרו בתוכנות סטטיסטיות כמו SAS (https://www.abtassociates.com/sites/default/files/files/Insights/Tools/rake_a )nd_trim_G4_V5.sasו) https://www.ibm.com/support/pages/raking- SPSS - .or-rim-weighting-spss-statistics אחת המכשלות בתהליך זה הוא שלעתים יש שונות רבה מאוד במשקלות הדגימה. למשל ,אם הגענו לשיעור קטן מאוד של משיבים מהפקולטה לרפואה יחסית לשיעורם באוניברסיטה ,משקל הדגימה של תלמידי רפואה במדגם עלול להיות גבוה מאוד, לעומת משקל הדגימה של תלמידים בבית הספר לעבודה סוציאלית שרבים מהם נענו לקריאה להשתתפות במחקר .השונות הרבה במשקלות הדגימה משפיעה על מבחני המובהקות .מבלי להיכנס לפרטים נציין שככל שהשונות במשקלות הדגימה גדולה יותר ,קשה יותר לדחות את השערות המחקר ולקבל ממצאים מובהקים (בהשוואה למצב שבו משקלות הדגימה אינם שונים במידה רבה) .משום כך ,חלק גדול מהתוכנות הסטטיסטיות מפעילות כללים מסוימים כדי להקטין את השונות במשקלות דגימה על ידי הקטנת משקלות חריגים בגודלם והגדלה של משקלות קטנים במיוחד .לתהליך זה של שינוי המשקלות יש כמובן השפעה על המידה שבה ההתפלגות במדגם זהה להתפלגות באוכלוסייה. מן הראוי להציב תמרור אזהרה .לעתים חוקרים דוגמים בצורה שאינה מקרית, ובהמשך מתקנים את המדגם באמצעות משקלות דגימה ומדווחים שהמדגם שלהם הותאם לאוכלוסייה ולכן הוא מייצג .אך לעתים קרובות לא כך הוא המצב .ניקח לדוגמה חוקרים שביקשו לערוך סקר מקוון בקרב הקהילה החרדית ,או בכפרים ערבים .לכל ברור שהגישה לסקר מקוון בקבוצות אלו היא מוטה ,ולא לכל הפרטים באוכלוסייה החרדית או בכפרים ערביים יש סיכוי שווה להשתתף בסקר .למשל, לצעירים יש סיכוי רב יותר להשתתף מלמבוגרים (ואולי גם לבעלי הכנסה גבוהה יותר בהשוואה לאחרים) .העובדה שהחוקרים משתמשים במשקלות דגימה כדי לתקן בדיעבד את התפלגות הגילים וההכנסה במדגם ,אינה פוטרת אותם מלהכיר בעובדה שלא לכל פרט באוכלוסייה היה סיכוי שווה להשתתף במחקר .קושי זה בולט במיוחד אם יש משקלות דגימה קיצוניים ,המרמזים על כך שהייצוג של חלק מהאוכלוסייה הוא ייצוג-חסר או ייצוג-יתר במידה רבה. ^^##417דגימת אשכולות ()cluster דגימה מקרית ,בדרכים שתיארנו עד עתה ,מחייבת רשימה מלאה של כל הפרטים במסגרת הדגימה .לעיתים יש קשיים טכניים ותקציביים המונעים מאיתנו
להשתמש ברשימה מפורטת של מסגרת הדגימה .למשל ,אם נרצה לדגום עובדים סוציאליים העובדים בעמותות ללא מטרת רווח או פסיכולוגים בתחנות לבריאות הנפש או חיילים המשרתים ביחידות שדה או ילדים מבתי ספר שונים בארץ בכיתות א' – ד' .הבעיה היא שבמקרים כגון אלה קשה ,אם לא בלתי אפשרי ,לקבל את רשימת כל הפרטים במסגרת הדגימה. במצבים מעין אלו יש בדרך כלל גם בעיה נוספת .נניח שהייתה בידינו רשימת כל החיילים המשרתים ביחידות השדה או רשימת כל הילדים בכיתות א' – ד' בארץ והיינו דוגמים מתוכה באופן מקרי מדגם של משתתפים במחקר .הקושי הגדול שהיינו נתקלים בו היה הצורך להגיע לחיילים המשרתים בכל רחבי הארץ או לילדים בבתי ספר שונים ורבים ברחבי הארץ .המחיר שהיה נדרש להגיע לתלמיד המסוים או למספר קטן מאוד של תלמידים בבתי ספר רבים ושונים או לחיילים המסוימים שעלו במדגם ביחידות השדה השונות עלול להיות גבוה מאוד ,משום שהיינו נאלצים להשקיע משאבים רבים כדי להגיע לכל מי שנכלל במדגם. למצבים מעין אלו פותחה שיטת דגימה הנקראת דגימת אשכולות ( cluster .)samplingשיטה זו מתאימה למצבים שבהם הפרטים במסגרת הדגימה מקובצים באשכולות ,כגון תלמידים בכיתות ,פסיכולוגים במרכזי בריאות נפש ,תאונות באזורים שונים בארץ ,חיילים ביחידות שלהם ועוד .לעיתים האשכולות מאורגנים בדרך רב- רמתית כגון עובדים סוציאליים מקובצים בלשכות רווחה ,לשכות רווחה מקובצות במסגרת יישוב ויישובים מקובצים במסגרת מחוזות. הרעיון הוא להתחיל בדגימת האשכולות שאליהם שייכים הפרטים ולא לדגום את הפרטים עצמם .למשל ,במקום לדגום מטפלים במרכזים לטיפול באלימות במשפחה ,אנו דוגמים קודם כל מדגם של מרכזים מתוך כלל המרכזים; במקום לדגום תלמידים אנו דוגמים קודם כל בתי ספר; במקום לדגום עובדים סוציאליים בלשכות ,אנו דוגמים לשכות לשירותים חברתיים .אם כך ,בדגימת אשכולות יש לנו לפחות שני צעדים :בצעד הראשון אנו דוגמים מתוך כל האשכולות שבאוכלוסייה ומגיעים למדגם של אשכולות .בצעד השני אנו דוגמים פרטים רק מתוך אותם האשכולות שעלו במדגם. לדוגמה ,נבקש רשימת כל הלשכות החברתיות ברחבי הארץ וזו תהיה מסגרת הדגימה שלנו .מתוך רשימה זו נדגום באופן מקרי מספר לשכות (בהמשך נדון במספר המתאים) .בצעד השני ,נבקש את רשימת העובדים הסוציאליים בכל אחת מהלשכות שעלו במדגם (ורק בלשכות אלו!) ,ומתוך הרשימה בכל לשכה נדגום מדגם מקרי של עובדים סוציאליים באותה הלשכה או שנכלול במחקר את כל העובדים הסוציאליים באותה לשכה .שימו לב שבדרך זו ,לא היינו זקוקים לרשימת העובדים הסוציאליים בכל הלשכות לשירותים חברתיים בארץ ,אלא רק לרשימת העובדים בלשכות שנדגמו .כמו כן ,כשנבצע את המחקר הוא יתמקד במספר המצומצם של לשכות שנבחרו ,ולא יתפרש בכל רחבי הארץ .יהיה בכך חיסכון ניכר במשאבים. באשכולות שבהם יש מבנה מורכב יותר ,אנו פועלים במספר שלבים ,בהתאם לרמות שבהן מתקבצים האשכולות .לדוגמה ,בצעד הראשון אנו דוגמים בתי ספר מרשימת כל בתי הספר הרלוונטיים ,בצעד השני אנו דוגמים כיתות בתוך כל אחד
מבתי הספר ובצעד השלישי אנו פונים לכל התלמידים באותה הכיתה או דוגמים מספר ילדים מכל כיתה ובכל בית ספר שעלו במדגם. לפני שנמשיך ונפרט ,מן הראוי לחזור ולעמוד על היתרונות של שיטת דגימה זו. בשלב ראשון אנו מתחילים מרשימה של אשכולות ,שבדרך כלל קל יותר להשיגה מאשר רשימה של פרטים .קל יותר להשיג רשימה של כל המרכזים לטיפול בהתמכרויות מאשר רשימה של כל המטפלים או המטופלים במרכזים אלו ,קל יותר להשיג רשימה של עמותות המעניקות סיוע כלכלי לנזקקים מאשר להשיג את רשימת כל העובדים בעמותות אלו .בשלב השני של הדגימה ,עלינו להשיג רשימות של פרטים ,אך רק בתוך המספר המוגבל של אשכולות שעלו במדגם .זה עלול לדרוש מאמץ ומשאבים ,אך בוודאי פחות ממה שהיה נדרש להשיג מראש את רשימת כל הפרטים במסגרת הדגימה שלנו. יתרון שני טמון בעובדה שעל ידי דגימה של אשכולות ודגימה של פרטים רק בתוך מספר מוגבל של אשכולות אנו מקטינים את המאמץ הנדרש לביצוע המחקר. המאמץ שעל החוקר להשקיע כדי להגיע לאלף ילדים המפוזרים בבתי ספר בכל רחבי הארץ ,תלמיד כאן ושניים שם ,או למאות חיילים המפוזרים במאות יחידות ברחבי הארץ ,הוא מאמץ גדול מאוד בהשוואה למאמץ הנדרש להגיע למספר מוגבל של בתי ספר ,לשכות לשירותים חברתיים ויחידות שדה. מקרה מיוחד של דגימת אשכולות הוא דגימה לפי מיקום גיאוגרפי .כפי שראינו שתלמידים מתקבצים לכיתות המתקבצות לבתי ספר המתקבצים למחוזות וכולי ,ניתן לומר שבודדים מתגוררים בדירות המתקבצות למבני מגורים ,המתקבצים לשכונות, המתקבצות למקומות יישוב והמתקבצים לאזורים גיאוגרפיים .לפי היגיון זה ,אם אנו רוצים לדגום אנשים או משקי בית ,אנו יכולים להתחיל ביחידות גיאוגרפיות גדולות, לדגום מהן יחידות גיאוגרפיות קטנות יותר ובכל אחת מהיחידות שנדגמה ,לבחור בתוכה יחידות גיאוגרפיות קטנות אף יותר .חלוקות מעין אלו נעשו על ידי הלשכה המרכזית לסטטיסטיקה שחילקה את הארץ ל 3,000 -אזורים סטטיסטיים .כל אזור סטטיסטי מחולק ל 20-תאים שבכל אחד מהם כ 50-משקי בית .כדי לדגום משקי בית ניתן לדגום קודם כל אזורים סטטיסטיים ,אחר כך בכל אזור שנבחר לדגום תאים ובתוך כל תא לדגום משק בית (ובמקרה הצורך ,בכל משק בית לדגום אנשים נפרדים). גם כאן ניתן לראות את היתרונות של דגימת האשכולות .איננו נזקקים לרשימת כל משקי הבית בישראל (וכל מי שנכלל בהם) .לאחר דגימה של האזורים הסטטיסטיים איננו צריכים להתמודד עם איסוף נתונים באלפי אזורים סטטיסטיים (שלא עלו במדגם) ,ולאחר שדגמנו תאים בכל אזור ,איננו צריכים להגיע לכל רחבי האזור אלא למספר מוגבל של מקומות ,וכך הלאה .אנו זקוקים לרשימה מפורטת של משקי בית רק באותם תאים שנדגמו ,ואנו זקוקים לרשימה מפורטת של החברים במשקי הבית ,רק עבור משקי הבית שנדגמו. אלו היתרונות ,אך מה הם החסרונות? בכל תהליך דגימה אנו משלמים 'מחיר' על הפער שבין האוכלוסייה ובין המדגם שבחרנו ,זוהי טעות הדגימה .בתהליך הכרוך בדגימת אשכולות אנו משלמים מחיר כזה בכל צעד :כשאנו דוגמים בתי ספר מתוך
כלל בתי הספר ,יש לכך מחיר וכאשר בוחרים כיתה מתוך כלל הכיתות בבית הספר יש לכך מחיר וכשבוחרים מספר תלמידים מתוך כלל התלמידים בכיתה ,משלמים שוב מחיר בטעות דגימה. כדי ל'פצות' על טעויות הדגימה הנוספות ,מקובל להגדיל את מספר הפרטים הנכללים במדגם .לדוגמה ,אם בדגימה מקרית אנו עשויים להסתפק במדגם שגודלו 100תלמידים ,הרי כדי להגיע לאותה רמת ביטחון באומדנים שנובעים ממדגם אשכולות יתכן שנצטרך להגיע ל – 200משתתפים או יותר .כפי שנראה בהמשך, החישובים באשר לגודל המדגם הנדרש אינם פשוטים ולא נוכל להיכנס כאן לפרטים. לענייננו ,חשוב לזכור שמדגם הנובע מדגימת אשכולות דורש מספר גדול יותר של פרטים בהשוואה למדגם הסתברותי מקרי רגיל. ^^##418דגימת אשכולות פרופורציונלית ולא פרופורציונלית בצעד הראשון בדגימת אשכולות עלינו לבחור מדגם של אשכולות .האשכולות השונים עשויים להיות בגדלים שונים ,קרי להכיל מספר שונה של פרטים :יש שכונות גדולות מאחרות ,מרכזים טיפוליים שבהם יש יותר ופחות פונים ומחלקות בבתי חולים שבהן מאושפזים רבים ומחלקות אחרות שבהן יש פחות מאושפזים .נניח שאנו רוצים לדעת מהי מידת שביעות הרצון של מאושפזים מתהליך שחרורם מבית החולים (הנעשה יחד עם העובד הסוציאלי) .החלטנו על דגימת אשכולות בשני צעדים :בצעד הראשון לדגום מחלקות בתוך כל אחד מבתי החולים בארץ ובצעד השני לדגום חולים בכל מחלקה שנבחרה .האם ניתן לכל אחת מהמחלקות סיכוי דומה להיבחר ,בלי קשר לגודלן ,או אולי אנו דואגים שלמחלקות הגדולות יותר יהיה סיכוי גדול יותר להיכלל במדגם מאשר למחלקות קטנות יותר .האם בכל מחלקה שנבחרה נדגום מספר זהה של החולים ,בלי קשר למספר החולים בה. במסגרת הנוכחית לא נוכל להציג כיצד לבצע תהליכי דגימה אלו ,אך נציין שהתשובות המקובלות הן: .1ההסתברות של כל מחלקה להופיע במדגם המחלקות תהיה בפרופורציה למספר המאושפזים בה .כלומר ,למחלקות שבהן מספר רב יותר של מאושפזים יהיה סיכוי גדול יותר להיכלל במדגם ,ביחס ישר לגדלן. .2בכל מחלקה יידגמו מספר שווה של מטופלים. .3המשמעות היא שהסיכוי של מאושפז להידגם שווה בכל המחלקות .זאת משום שהסיכוי של מאושפז להידגם היא מכפלת הסיכוי של המחלקה להידגם מתוך כלל המחלקות בסיכוי של המאושפז להידגם בתוך המחלקה שלו .שני המרכיבים 'מאזנים' זה את זה :הסיכוי של מחלקות שבהן מאושפזים רבים להיבחר למדגם גדול יותר מזה של מחלקות שבהן פחות מאושפזים ,אך בה בעת ,למאושפז במחלקה גדולה יש סיכוי קטן יותר להיבחר בתוך המחלקה ,משום שעליו 'להתחרות' במאושפזים רבים יותר .לכן ,המכפלה דומה עבור כל אחד מהמאושפזים ,בכל המחלקות. אחת השאלות שיש להתייחס אליה כשמתכננים מדגם אשכולות היא ,בהינתן גודל מדגם מסוים ,כיצד עדיף לחלקו -יותר אשכולות ופחות משתתפים בכל אשכול, או פחות אשכולות ויותר משתתפים בכל אשכול .התשובה אינה פשוטה .חלקה קשור
לשיקולים סטטיסטיים מורכבים וחלקה למשאבים הנדרשים כדי לדגום אשכולות בהשוואה למשאבים הנדרשים לדגום פרטים בכל אשכול .בדרך כלל ,יש העדפה לדגימה של יותר אשכולות ,מאשר לדגימה של מספר רב יותר של פרטים בפחות אשכולות. נזכיר שבפרק 4תיארנו שאלות מחקר רב-רמתיות שבהן ,בנוסף לעניין שלנו בפרטים השונים (תלמידים ,עובדים סוציאליים ,כתבות בעתון) יש לנו עניין מיוחד גם במאפיינים של האשכולות עצמם (בתי הספר ,מחלקות האשפוז ,העמותות, העיתונים שבהם מופיעות הכתבות) .במחקרים מסוג זה ,עלינו לוודא שמדגם האשכולות גדול דיו כדי שיהיה אפשר ללמוד על מאפייני האשכולות .נדגיש שוב, שדגימה במחקרים מעין אלו היא מורכבת ומחייבת לעיתים התייעצות עם סטטיסטיקאי המתמחה בדגימה רב-רמתית. ^^##419שילובים של תהליכי דגימה ההסתברותיים לכל אחת מהשיטות שתיארנו למעלה יש יתרונות וחסרונות והיא עשויה להתאים יותר או פחות להקשר של מחקר מסוים .לעיתים ,יש יתרון לשילוב בין שיטות כדי לענות על מספר צרכים בו-זמנית .לדוגמה ,במחקר שערכנו על אלימות במערכת החינוך עשינו שימוש בדגימת אשכולות שבה דגמנו בצעד הראשון בתי ספר .אולם ,בתהליך זה של דגימת בתי ספר עשינו שימוש בדגימה שכבתית – הצבנו את בתי הספר על שני צירים – שלב חינוך (יסודי ,חטיבת ביניים ועליונה) וקבוצת תרבותית (חינוך ממלכתי יהודי ,ממלכתי ערבי ,ממלכתי דתי) .השילוב של שני הצירים יצר 9 = 3*3תאים שונים .את הדגימה המקרית של בתי הספר ערכנו בנפרד לכל תא .כלומר ,זיהינו למשל את כל בתי הספר היסודיים בפיקוח הממלכתי- דתי ומתוכם דגמנו באופן מקרי 40בתי ספר .אחר כך ,בכל אחד מבתי הספר שנדגמו ,דגמנו כיתה בכל אחת מדרגות הכיתה (בבתי ספר יסודיים למשל ,כיתה מכל אחת מהשכבות ד' ה' ו'). בדוגמה אחרת ,רצינו לדגום מטופלים במרכזים לאלימות במשפחה .מרכזים אלו שונים בגודלם (כלומר ,במספר המטופלים בכל אחד מהם) .בדגימת אשכולות רגילה, למרכזים הגדולים היה סיכוי רב להיכלל במדגם עקב גודלם ולעומתם למרכזים הבינוניים והקטנים היו סיכויים קטנים למדי להיכלל במדגם .חשבנו שלגודל המרכז עשויה להיות חשיבות לתוצאות המחקר ולא רצינו שלמטופלים במרכזים הקטנים יותר לא יהיה ייצוג במדגם .לכן ,התחלנו בדגימת שכבות וזיהינו שלוש שכבות: מרכזים גדולים ,בינוניים וקטנים .בצעד השני ערכנו דגימת אשכולות מקובלת ,בכל אחת מהשכבות בנפרד .בדרך זו נתנו ייצוג גם למרכזים השונים בגודלם וגם למטופלים בהם. ^^##420גם תהליך דגימה נכון עלול להביא לתוצאה בעייתית לאחר שתיארנו את התהליכים הנכונים לביצוע דגימה הסתברותית ,חשוב מאוד להבהיר את ההבדל בין תהליך הדגימה לתוצאה שלו .תהליכי הדגימה שהצגנו הם הטובים ביותר המוכרים לנו המבטיחים ששום הטיה שיטתית לא תשבש את תהליך הדגימה .אולם ,אין בכך להבטיח שהמדגם שקיבלנו באמצעות התהליך הוא אומנם מדגם מייצג .בשפה טכנית ניתן לומר שאם היינו דוגמים באמצעות הליכים אלו אין
סוף מדגמים ,הרי ממוצע מדגמים אלו היה זהה לממוצע האמיתי באוכלוסייה ולכן היה מדגם מייצג .כמובן שאיננו דוגמים אין סוף מדגמים אלא רק אחד ,יש סיכוי שדווקא המדגם המקרי שנדגום יהיה רחוק מלייצג את האוכלוסייה .כפי שנראה בהמשך ,יש לנו דרך לאמוד את הסיכוי שזה קרה ולהביא סיכוי זה בחשבון כאשר אנו מציגים את תוצאות המחקר. כפי שצוין קודם ,אין אנו יודעים את כל מאפייני האוכלוסייה ומשום כך איננו יכולים להעריך עד כמה המדגם שיצרנו מייצג את האוכלוסייה ומשקף את כל מאפייניה .אולם לעיתים ,הבעייתיות במדגם בולטת לעין .למשל ,חוקר המנסה לבחון את רמת השחיקה של מורים ומורות בבתי ספר יסודיים או של עובדים ועובדות סוציאליים בשירותי הרווחה ומגלה שהמדגם המקרי שבחר מכיל מספר דומה של מורים ומורות ושל עובדות ועובדים סוציאליים ,חייב לשאול את עצמו האם מדגם זה יכול להיות מייצג ,כשההבדלים בשיעור הנשים והגברים בקבוצות אלו באוכלוסייה הרלוונטית גדולים כל כך .במקרים בולטים מעין אלו מן הראוי לשקול לבצע את תהליך הדגימה שוב .כמובן ,שיש להיזהר מביטולו של מדגם על סמך 'תחושות בטן' או על בסיס ידע לא מבוסס על האוכלוסייה. ^^##421מהמדגם המתוכנן למדגם בפועל גם כאשר חוקר תכנן את המדגם כך שהוא אמור לייצג בצורה טובה את האוכלוסייה ,אין די בכך .יש לעיתים קרובות פער בין המדגם המתוכנן למדגם בפועל, המדגם שלגביו נאספו נתונים .כך למשל ,חוקרת המבקשת ללמוד על חוויות של אחיות חדר מיון הקשורות לאלימות מצד מטופלים ובני משפחותיהם ועל תחושת המוגנות שלהם ,עשויה לזהות מדגם מייצג של אחיות ולנסות ולהגיע לכל אחת מהן כדי לראיין אותה .חוקרת זו עשויה לגלות שעל אף מאמציה ,קשה לה להגיע לחלק מהאחיות .חלקן נעדרות מהעבודה ,חלקן מסרבות להתראיין ,ועם חלקן היא אינה מצליחה ליצור קשר .מכיוון שהחוקרת מנוסה ומצפה לתופעות מעין אלו ,היא מכינה לעצמה רשימה נוספת של אחיות ,גם היא מבוססת על דגימה מקרית ,ובמקום אחיות שאינה מצליחה לראיין היא דוגמת מהרשימה החילופית ומראיינת את ה'מחליפה'. לכאורה ,כל הדגימה היא הסתברותית ומייצגת .אולם ,יש לשים לב לכך שלפער בין המדגם המתוכנן לבין המדגם שעליו נאספו הנתונים עשויות להיות השלכות רציניות על מידת הייצוגיות שלו .ייתכן שהעובדה שיש אחיות שהחוקרת אינה מצליחה לראיין אינה מקרית .ייתכן שדווקא האחיות הנחשפות יותר לאלימות נעדרות יותר מהעבודה ולכן קשה להשיג אותן ,וייתכן שדווקא אלו שנחשפו לאלימות מוכנות יותר להתראיין בנושא זה ,ואחיות אחרות מעדיפות לא לבזבז את זמנם בנושא שהן חשות שאין לו רלוונטיות לגביהן .איננו יודעים .אך מה שברור הוא ,שעלינו לבחון היטב את הפערים בין המדגם המתוכנן למדגם בפועל ולנסות לזהות האם יש שיטתיות בפערים אלו ,העלולים לפגוע בייצוגיות .לדוגמה ,ייתכן שהבדיקה תגלה שהוותק של אחיות במדגם שהיה אמור להיות מייצג הוא גבוה (או נמוך) באופן משמעותי ,מהממוצע של הוותק באוכלוסיית האחיות .במקרה כזה ,החוקרת יודעת שהמדגם שלה מוטה ולוקה בייצוג יתר (או ייצוג חסר) של אחיות וותיקות .עליה
לדווח על ממצא זה בעת הצגת הממצאים ולהביא אותו בחשבון בעת שהיא מסיקה מסקנות מממצאי המחקר ,ומבקשת להכליל מהמדגם לאוכלוסייה. ^^##422שיקולים של גודל מדגם בחלק זה נעמוד על סוגיות הקשורות לגודל המדגם הרצוי .ננסה להתייחס לסוגיות אלו בשפה פשוטה ואינטואיטיבית ככל שניתן .בפועל ,חישובים של גודל מדגם דורשים לעיתים מומחיות רבה ויש אנשי מקצוע בתחום הסטטיסטיקה שזה תחום המומחיות שלהם .בהקשר הנוכחי ננסה להסביר את העקרונות העומדים בבסיס השיקולים. נתחיל בתרגיל המחשבתי הבא .בידיי 1000קלפים שעל כל אחד רשום מספר מ 1עד .10לצרכינו ,זוהי אוכלוסיית המחקר שלנו ,כל הפונות והפונים למרכזי הסיוע בשנה האחרונה ,והערך המופיע על הקלף הוא ציון מידת שביעות הרצון שלהם מהשירות שקיבלו .התפקיד שלכם הוא להעריך מהו ממוצע שביעות הרצון של הפונים למרכזי הסיוע .המחיר שאני דורש כדי להראות לכם קלף ,ובמילים אחרות כמה יעלה לכם לראיין כל מטופל במדגם שתבחרו ,הוא .₪ 5אם בידיכם סכום בלתי מוגבל ואתם רוצים להשקיע אותו במדגם ,סביר שתשלמו לי ₪ 5,000ותהפכו את כל הקלפים ו ְת ַח ְשבּו את הממוצע שהתקבל .נניח שהממוצע שהתקבל הוא .7.2על סמך המדגם שבחרתם ,מה תהייה הערכה שלכם את מידת שביעות הרצון באוכלוסייה? סביר שתגידו 7.2כי זה הערך שקיבלתם במדגם .עד כמה אתם בטוחים שהממוצע הזה הוא אומנם הממוצע באוכלוסייה? סביר להניח שתהיו בטוחים לגמרי ,שהרי אין כלל מקום לטעות באומדן שלכם. הבה נשחק את המשחק כך שבידיכם תקציב מוגבל של ₪ 50בלבד ,המאפשר לכם לבחור רק עשרה קלפים .בחרתם קלפים אלו באופן מקרי ,בחנתם את עשרת הקלפים וקיבלתם ממוצע של .6.8נשאל שוב ,מה תהייה ההערכה שלכם את מידת שביעות הרצון של המטופלים במרכזים? סביר שתענו ,6.8שהרי זה האומדן הטוב ביותר שיש לכם ,בהסתמך על המחקר שערכתם .עד כמה אתם בטוחים שהממוצע הזה הוא אומנם הממוצע באוכלוסייה? סביר שהפעם תהיו זהירים יותר ותרגישו פחות בטוחים מאשר בסיבוב הראשון ותציינו שמידת הביטחון שלכם קטנה יותר ,כי תהיו ערים לכך שאולי עשרת הקלפים שבחרתם אינן מייצגים בצורה הטובה ביותר את כל 1,000הקלפים בחפיסה. נניח שהיו בידיכם ₪ 1000לצורכי דגימה ,וכך יכולתם לחשוף 200קלפים. חישבתם וקיבלתם ממוצע של .7.4נשאל שוב :מה תהייה ההערכה שלכם את מידת שביעות הרצון של המטופלים במרכזים? אתם יודעים את התשובה -ההערכה הטובה ביותר שלכם היא .7.4עד כמה אתם בטוחים שהממוצע הזה הוא אומנם הממוצע באוכלוסייה? ובכן ,סביר שתרגישו יותר בטוחים מאשר כשהפכתם 10 קלפים אך פחות בטוחים מאשר כשהפכתם את כל הקלפים. מה למדנו מתרגיל זה על גודל המדגם? אנו אומדים את המצב באוכלוסייה באמצעות הערכים שקיבלנו במדגם ,בלי קשר לגודל המדגם .אולם ,גודל המדגם
משפיע על מידת הביטחון שלנו שהאומדן שמצאנו משקף את המצב באוכלוסייה בשאלה שנבדקה. הבה נעשה תרגיל נוסף ,הפעם אני ממליץ שתנסו לעשות אותו בפועל ,כדי שתתרשמו בעצמכם שמדובר בתופעה 'אמיתית' .כתבו על עשרה פתקים את המספרים מ -1עד .10זו תהייה 'האוכלוסייה' שלכם .אתם ואני יודעים שהממוצע באוכלוסייה שלכם הוא ( 5.5חשבו את הממוצע של סדרת המספרים .)10 – 1כעת, נבצע סדרה של דגימות כל פעם בגודל מדגם אחר .למשל ,הפכו שלושה קלפים ורשמו את הממוצע שהתקבל (אם אתם רוצים לעשות זאת לפי כל הכללים ,החזירו כל קלף לערמה לפני שאתם מושכים הקלף הבא ,בדרך זו האוכלוסייה שלכם היא אין סופית ,כפי שנדרש מאוכלוסייה תיאורטית) .כעת ,הפכו שוב שלושה קלפים ורשמו את הממוצע .עשו זאת עשר פעמים לפחות .קיבלתם כעת עשרה ערכים שונים .אם הייתם עושים את זה אין ספור פעמים (כפי שמקובל לדרוש בטקסטים סטטיסטיים)... הייתם מקבלים התפלגות של הערכים ,שכל אחד מהם הוא הממוצע של שלושה קלפים .זוהי התפלגות הדגימה של .n = 3להתפלגות זו יש ממוצע ושונות מסוימת מסביב לממוצע .אם בצעתם את התהליך פעמים רבות אולי לא תופתעו שהממוצע של כל הערכים שקיבלתם (ממוצע של ממוצעי המדגמים) הוא 5.5או קרוב לכך (במקרה שבחרתם לא לכלות את ימיכם במספר דגימות אין סופי). כעת ,חזרו על אותה הפעולה ,אך הפעם שלפו כל פעם חמישה קלפים וחשבו את הממוצע שלהם .ואם יש לכם סבלנות ,חזרו על הפעולה הזו עם שמונה קלפים כל פעם ועם עשרה קלפים וחשבו את הממוצע של כל מדגם ובסוף התהליך את הממוצע של כל הממוצעים שקיבלתם לדגימה בגודל מסוים. התמונה שתקבלו היא :א .הממוצעים של ממוצעי כל הסדרות של מדגמים שבחרתם יהיו 5.5או קרוב לכך .ב .במדגמים הגדולים יותר סדרות הממוצעים יהיו קרובות יותר זו לזו ובמדגמים הקטנים יותר השונות בין הממוצעים תהייה גדולה יותר .האיור הבא מציג את הרעיון באופן עקרוני .באיור זה אנו מציגים התפלגויות דגימה של מספר גדלי מדגם (מ 500 -ועד ל .(20 -כל אחד מהמדגמים נלקח באופן
מקרי מהאוכלוסייה ,הדומה לתרגיל שערכנו :הערך הנמוך ביותר הוא 1והגבוה הוא 10והממוצע שלה הוא .5.5 איור 9.1 התפלגויות דגימה של מדגמים בגדלים שונים מה המשמעויות של התרגיל והאיור? כל חוקר דוגם רק פעם אחת ולא אינספור פעמים ,ולכן הוא מחשב רק ממוצע אחד (בהנחה שאנו מתמקדים כעת רק באומדן אחד) .השאלה שהוא חייב לשאול את עצמו היא אם ממוצע זה קרוב לממוצע האמיתי באוכלוסייה או רחוק ממנו? לרוע המזל איש אינו יכול לענות על שאלה זו (אם היינו יודעים מה הממוצע באוכלוסייה לא היינו זקוקים למדגם) .אולם ,כפי שהאיור מדגיש ,נוכל לומר לו מה הסיכוי שהממוצע שלו קרוב או רחוק מהממוצע האמיתי .מכיוון שניתן לחשב את התפלגות הדגימה המתאימה לגודל המדגם שבו בחר נוכל לציין לגבי הממוצע שקיבל מה הסיכויים שהוא בטווח מסוים מהממוצע האמיתי (והלא ידוע). בשפה טכנית מקובל להשתמש בביטויים בנוסח הבא :יש סיכוי של 95%או יותר שהממוצע באוכלוסייה נמצא בטווח שבין 4.4ל ,5.4 -ודוגמה אחרת -יש סיכוי של 99%שהממוצע באוכלוסייה נמצא בטווח שבין 4.5ל .6.5 -לטווח שמעל ומתחת לאומדן שלנו את הממוצע אנו קוראים 'רווח בר סמך' ( .)confidence intervalבאופן אינטואיטיבי ניתן לראות שיש יחסי גומלין בין גודל הטווח לבין מידת הביטחון בו .ככל שאני מצמצם את הטווח שאני נותן (קרי ,אני מתחייב לדיוק רב יותר) ,אני פחות בטוח בו ,ולהיפך -אם אגדיל את הטווח (ולא אתחייב להיות מאוד מדויק) ארגיש בטוח יותר שהממוצע האמיתי נמצא אי שם בתוך הטווח. כחוקרים יש לנו עניין לערוך מחקר הנותן אומדן למצב באוכלוסייה בטווח צר ככל שניתן וברמת ביטחון גבוהה ככל שניתן .בדוגמה של משחק הקלפים ,אם המדגם גדול כל כך שהוא כולל את כל האוכלוסייה ברור שאנו לא צריכים לתת טווח ורמת הביטחון שלנו היא .100%אין זה מצב מציאותי (בין היתר משום שבהגדרה הטכנית, האוכלוסייה התיאורטית היא בעלת גודל אין סופי ,כך שאין מדגם שיכול להכיל אותה) .במציאות אנו מתמודדים עם מדגמים שבהם יש טעות הנובעת מהדגימה והמחייבים אותנו לתת אומדן ורווח בר סמך ,כדי לאפיין את הטעות האפשרית שלנו. הכלים הסטטיסטיים שבידינו מאפשרים לתת הערכות של הרווח בר סמך ,ואחת
התוצאות של העיבודים שאנו עורכים במחשב הוא חישוב הרווח בר סמך ,על סמך מאפייני המדגם .אנו לא נלמד לחשב רווח בר סמך באפן עצמאי .אלא נשען על תוצאות העיבוד כפי שיתקבלו מהמחשב. ^^##423הגורמים המשפיעים על גודל המדגם הרצוי נקדים ונאמר שברוב רובם של המקרים (אם לא בכולם) ,אם יש לנו אפשרות לבחור מדגם גדול ,נעדיף אותו על פני מדגם קטן יותר .אולם ,מדגמים גדולים יותר דורשים משאבים רבים יותר ,שבדרך כלל אינם זמינים לנו .לכן ,האתגר שאנו מתמודדים אתו הוא להעריך מה גודל המדגם המינימלי הנדרש כדי לענות על הצרכים שלנו .נתחיל בהבנת הביטוי 'הצרכים שלנו' .שוו בנפשכם שאתם עובדים בשני מקומות .האחד ,מפעל לתרופות והאחר במחלקת הסקרים של פוליטיקאי. מפעל התרופות מייצר תרופה שיש לה חומר פעיל שהריכוז שלו חייב להיות 0.4 מיליגרם בכל קפסולה .סטייה של 0.02מיליגרם מעל או מתחת לערך הנדרש עלולה לגרום לנזק ומשום כך אסור לשווק תרופה שאינה עומדת בתנאי זה .התפקיד שלך הוא לבחון מדגמים של התרופה המיוצרת בכל יום כדי להתריע אם התוצרת היומית חורגת מהדרישות .במקרה זה ,הצרכים שלנו דורשים טווח ביטחון צר מאוד ורמת ביטחון גבוהה מאוד .גודל המדגם של קפסולות ישקפו את הצורך הזה. לעומת זאת ,בסקרים הנערכים בעבור פוליטיקאים טווח הביטחון בדרך כלל יהיה רחב יותר ומידת הביטחון תהייה נמוכה יותר .לא פעם אנו שומעים על ממצאי סקרים פוליטיים שבהם טווח ביטחון של 4%-+בביטחון של .95%בסקרים אחרים הדרישות עשויות להיות גבוהות יותר .למשל ,כשהתבקשנו להעריך רמות של אלימות בבתי הספר ,הציפייה הייתה לטווחי ביטחון קטנים יותר ,בעיקר בכל הנוגע לתופעות בשכיחות נמוכה ,כמו הבאת נשק לבית הספר .דרישות אלו חייבו מדגמים גדולים יותר ,מאשר במחקרים אחרים שבהם הדרישות היו לטווחי ביטחון גדולים יותר. דוגמאות אחרות נוגעות למחקרים המנסים לבחון אם חל שינוי בעקבות התערבות ,או אם יש הבדלים בין קבוצות שונות באוכלוסייה .אם הציפייה שלנו היא לשינוי גדול בעקבות התערבות או שיש הבדלים גדולים בין הקבוצות ,נזדקק למדגמים פחות גדולים כדי לזהות הבדלים אלו ,מאשר במצב שבו אנו מנסים לזהות שינויים או הבדלים קלים .למשל ,אם אנו מצפים שהתערבות נגד דיכאון תפחית את רמות הדיכאון בנקודה אחת על סולם של עשר נקודות ,מחקר שבסיומו נאמר שהשינוי ברמות דיכאון הוא 2 -+ 1.5נקודות ,לא יתרום דבר ,משום שגם אם ההתערבות הצליחה ,וחל שינוי אמיתי של נקודה ,המדגם שבחרנו לא יאפשר לנו לזהות שינוי זה בביטחון .ככל שנבקש לזהות שינויים או הבדלים קטנים יותר ,אנו מציגים ציפיות גבוהות ומחייבות יותר ,ולכן נזדקק למדגמים גדולים יותר כדי לעמוד בהן. ניתן לסכם חלק זה ולומר שחלק מהגורמים המשפיעים על תכנון גודל המדגם הם הציפיות באשר לגודל רווח בר הסמך של האומדן שהוא יפיק :ככל שנרצה להגיע לרווח בר סמך צר יותר ולרמת ביטחון גדולה יותר ברווח בר סמך ,נזדקק למדגם
גדול יותר .אולם ,אין די במידע זה כדי לתכנן את גודל המדגם .עלינו להתייחס גם למושג של שונות באוכלוסייה. ^^##424הקשר בין השונות באוכלוסייה לבין גודל המדגם שני חוקרים עם דרישה דומה לגודל רווח בר סמך בביטחון של 95%העוסקים באוכלוסיות שונות יזדקקו למדגמים בגדלים שונים .שוו בנפשכם שאתם מכירים מישהו העובד במפעל בארץ רחוקה המבקש לבנות מכונה לחליבת עיזים .מכיוון שבארץ רחוקה זו אין עיזים ,הוא נשלח לארצך עם משימה מחקרית להעריך את מספר הפטמות הממוצע שיש לעיזים .הוא נדרש לספק אומדנים מאוד מדויקים ,כי עלות הייצור של מכונות החליבה היא גבוהה ,ויש להבטיח שמספר הפטמות במכונה יהיה זהה בדיוק למספר הפטמות של העיזים .אם הייתם יכולים ללחוש על אוזנו, הייתם בוודאי אומרים לו שהוא זקוק למדגם של עז אחת בלבד ,כי לכל העיזים יש מספר דומה של פטמות ואין טעם לבחון עוד ועוד עיזים .לעומת זאת ,אם חבר אחר שלכם היה נשלח לאמוד את מידת שביעות הרצון של הורים מבית הספר של ילדם, סביר שהייתם ממליצים לו לקחת מדגם גדול ככל שניתן כדי לעמוד על כל ההבדלים במידת שביעות הרצון של הורים ,כי ידוע שיש הבדלים בין ההורים .בשפה טכנית ניתן לומר ,שגודל המדגם הרצוי מושפע מהשונות באוכלוסייה – ככל שזו גדולה יותר, יהיה צורך במדגמים גדולים יותר כדי לשקף אותה. כאשר מדובר בתשובות דיכוטומיות (מסכים – לא מסכים) והתשובות ניתנות להצגה כפרופורציה של תשובות חיוביות ,ניתן לחשב את השונות מראש .השונות תהיה מקסימלית כשהפרופורציה הצפויה היא של 50%והיא תלך ותרד ככל שההתפלגות פחות סימטרית ,עד לנקודה שבה יש רק תשובה אחת (פרופורציית העיזים בעלות שתי פטמות היא .)100%במקרה קיצוני זה כמובן שהשונות היא הקטנה ביותר. לכן ,בחישובים של גודל מדגם אופטימלי ,יש לכלול את אומדן השונות .לעיתים יש לנו מידע מוקדם על השונות באוכלוסייה ממחקרים אחרים ,ולעיתים חוקרים עורכים מחקר מקדים שכל מטרתו להעריך את השונות באוכלוסייה של התופעה המעניינת אותם .זאת ,כדי שיוכלו לשלב את אומדן השונות בחישובים שנועדו להעריך את גודל המדגם האופטימלי. יש כיום באינטרנט אתרים המאפשרים לחשב את גודל המדגם האופטימלי בעבור מחקר מסוים (לדוגמה ,האתר National Statistics Service - https://www.abs.gov.au/websitedbs/D3310114.nsf/home/Sample+Size .) +Calculatorלאור מה שהצגנו למעלה ,לא מפתיע שהן כוללות את 'מידת הביטחון' (למשל ,האם מדובר ב ,99% ,95%או ,)99.9%ואת 'גודל רווח בר הסמך' שאנו דורשים. כמו כן ,האתר מתייחס למדדים שונים המאפשרים לחשב את מרכיב השונות בתהליך החישוב של גודל המדגם .במקרים שבהם מדובר על משתנה דיכוטומי, אחת הדרכים המקובלות היא להתייחס לשאלה ,לאיזו פרופורציה אנו מצפים בתשובות (לדוגמה ,כמה יאמרו 'כן' לעומת כמה יאמרו 'לא') – ככל שאנו מצפים שהפרופורציה תהייה קרובה ל( 50% -מצב של מקסימום שונות) יש צורך במדגם
גדול יותר .משום כך מומלץ ,שאם אין מידע אחר ,יש להכניס את הערך ,50%שהוא השמרני ביותר ומאפשר לחשב מדגם בגודל הנותן מענה למשתנים עם השונות הרבה ביותר. נמליץ לקורא לנסות ולהכניס ערכים שונים לפרמטרים המופיעים בממשק של התוכנה לחישוב גודל המדגם ולראות כיצד גודל המדגם המוצע משתנה בהתאם לערכים השונים .כך ניתן לראות שהכנסת רווח בר סמך קטן יותר תגדיל את המדגם המוצע ושינוי הפרופורציה לערך הקטן מ 50%-יקטין את גודל המדגם המוצע .נדגיש, שלעיתים קרובות החישוב בפועל של גודל המדגם האופטימלי עשוי להיות מורכב ונתון בידי אנשי מקצוע המתמחים בסוגיות אלו .אנו נמשיך ונדון בסוגיות אלו כשנציג את ההשלכות של גודל המדגם על העוצמה של מבחנים סטטיסטיים. נסכם ונאמר ,ככל שאנו מבקשים להיות בטוחים יותר באומדן שהגענו אליו באמצעות המדגם וככל שאנו מבקשים לתת רווח בר סמך צר יותר וככל שהשונות של התופעה באוכלוסייה גדולה יותר ,נזדקק למדגם גדול יותר .שימו לב ,שבניגוד לאינטואיציה של רבים ,לגודל האוכלוסייה אין בדרך כלל השפעה משמעותית על גודל המדגם .כאשר האוכלוסייה גדולה באופן משמעותי מגודל המדגם ,אין הבדל ניכר בגודל המדגם הנדרש לאוכלוסיות גדולות בהשוואה לאוכלוסיות גדולות מאוד .למשל, מדגם של 500ייתן תוצאות טובות לאוכלוסייה שגודלה מיליונים אחדים באותה מידה כמו באוכלוסייה המונה .100,000לגודל האוכלוסייה יש משמעות רק כשהיא קטנה למדי יחסית לגודל המדגם. ^^##425דגימה לא הסתברותית למרות העניין הרב שלנו במדגמים מייצגים ,במקרים רבים אין לנו מסגרת דגימה מפורטת ,כך שאיננו יכולים לדגום ממנה באופן מקרי .אם נרצה ללמוד על היחסים בין נשים החשות דיכאון לבין ילדיהן ,נתקשה למצוא רשימה של נשים אלו. ייתכן שנוכל להגיע לרשימה של נשים המטופלות עקב דיכאון ,ומתוכה לגזור את הקבוצה של נשים שלהן ילדים ,אך אם העניין שלנו הוא בטווח הרחב של תחושות דיכאון לא נצליח להגיע למסגרת דגימה מפורטת .במקרים אחרים יש לנו עניין בתופעות בעלות היקף קטן יחסית או שהן חדשות יחסית ,כך שאין לנו מידע מוקדם רב עליהן ,ובוודאי לא מידע שיאפשר לנו לדגום באופן הסתברותי .במקרים מעין אלו נפנה לשיטות דגימה לא הסתברותיות אשר אינן מבוססות על מסגרת דגימה קיימת. נפתח ונאמר שיש דמיון רב בין שיטות הדגימה הלא הסתברותיות השונות וניתן לראות שלא תמיד יש הסכמה בספרות על ההגדרות של השיטות השונות ועל ההבדלים ביניהן .כמו כן ,נבהיר מראש שלמדגמים אלו יש מגבלות רבות וניתן לזהות שאינם עומדים בקריטריונים הנדרשים כדי לטעון לייצוגיות .מגבלה מרכזית היא שאין לנו דרך יעילה להעריך את מידת הביטחון שלנו באומדנים שאנו מגיעים אליהם (רווח
בר סמך) כמו במקרים שבהם אנו נשענים על דגימה הסתברותית .עם זאת ,חוקרים המכירים במגבלות של שיטות אלו עושים מאמץ מכוון להקטין חלק ממגבלות אלו. מקובל להבחין במספר סוגים של דגימות לא הסתברותיות: מדגם נוחות מדגם זה מבוסס על הרעיון שאנו נבחר מדגם שיש לנו גישה נוחה אליו. לדוגמה ,אשת מקצוע שרוצה ללמוד על הכוחות החיוביים של ילדים הנמצאים בהשמה חוץ-ביתית מחליטה לחקור את מצבם של כל הילדים שבאחריות העמותה שבה היא עובדת משום שהם נגישים לה יותר מאשר ילדים בעמותות אחרות (זאת ,תוך הקפדה על כך שלילדים ולהוריהם יש אפשרות להימנע מלהשתתף במחקר מבלי שייפגעו כי אינם משתפים פעולה עם החוקרת) .לבחירה זו עלולות להיות מגבלות רבות ולכן חשוב לתאר את הדרך שבה ביצענו את הדגימה ,ולתת בכך לקורא הרוצה להחליט כיצד להתייחס למחקר הזדמנות להעריך את הדגימה על סמך העובדות המפורטות. לעיתים קרובות אנו נתקלים בחוקרים המדווחים שנשענו על מדגם נוחות מבלי לעשות מאמץ כלשהו לפרט כיצד נבחרו המשתתפים בפועל .חשוב להדגיש שגם כשאין ברירה ונאלצים להשתמש במדגם נוחות ,יש הבדלים ניכרים במידת הייצוגיות של מדגמים שנבחרו בדגימת נוחות .דגימת נוחות שבה החוקרת מראיינת לקוחות שפגשה במקרה בקניון השכונתי שונה באופן משמעותי מדגימת נוחות של חוקרת שבחרה מספר קניונים שאליהם הייתה לה גישה נוחה ,אך בכל אחד מהם הקפידה לדגום באופן מקרי לקוחות בשעות שונות של היום .על אף שגם דגימה זו המבוססת על מדגם נוחות ויש להיזהר בהכללות ממנה ,הממצאים של מחקר המבוסס על דגימת נוחות זו יהיו משכנעים יותר משל החוקרת שנשענה על מדגם נוחות של לקוחות שפגשה במקרה בקניון השכונתי שלה .משום כך ,חשוב לציין כיצד בצענו את הדגימה או את בחירת המשתתפים ,ולא להסתפק במשפט סתום שהמחקר התבסס על דגימת נוחות .זאת ,כדי שהקורא יוכל לבחון ולהעריך כמיטב יכולתו אם קיימת הטיה ,מה עוצמתה ומה הכיוון שלה .לעיתים החוקר יכול להראות את התפלגות המאפיינים של מדגם הנוחות שבחר ולהצביע על כך שהם דומים למאפייני האוכלוסייה ,ככל שהם ידועים .בכל מחקר המבוסס על מדגם נוחות יש לציין את מגבלותיו ולהיות זהירים בהכללה ,יותר מאשר בשיטות דגימה הסתברותיות (שגם להן מגבלות שיש להתייחס אליהן בדיון). מדגם כדור שלג לעיתים אנו עוסקים באוכלוסייה ובתופעות שקשה לאתר ,או שיש למשתתפים פוטנציאלים התנגדות רבה להודות שהם משתייכים לקבוצה זו. למשל ,חוקרת המבקשת ללמוד על הקשיים של עובדים זרים הנמצאים בארץ שלא כחוק לא תוכל להשתמש ברשימות קיימות או לתלות שלט בסופרמרקט המציע להם להשתתף במחקר .במקרים כאלה החוקרת מנסה לזהות משתתף אחד או מספר קטן של משתתפים הבוטחים בה והיא מבקשת שיפנו אליה משתתפים פוטנציאלים אחרים .וכך ,המדגם הולך ואוסף תאוצה ,ככדור
שלג המתגלגל במדרון .אפשר לכנות שיטה זו \"מפה לאוזן\" או \"חבר מביא חבר\". מדגם מכוון (מהמילה כוונה) או מדגם מטרה כל מדגם הוא מדגם מכוון כי אנו רוצים ומכוונים להגיע לאנשים מסוימים. ואכן ,יש חוקרים הרואים בצורות הדגימה הלא הסתברותיות וריאציה על רעיון הדגימה המכוונת .אולם ,אנו משתמשים בביטוי זה בדרך שונה ומתכוונים לכך שמדובר בניסיון לזהות תת קבוצה מיוחדת ,בעלת מאפיין שעליו אנו רוצים ללמוד לשם הבנת תופעה .מדובר במדגם קטן יחסית של אנשים אשר יכולים לשפוך אור על תופעה מסוימת .בדרך כלל משתמשים במדגם כזה בצעדים ראשונים במחקר כדי לאסוף מידע ראשוני שיעזור לתכנן מחקר מעמיק ורחב היקף יותר .למשל ,אנו מנסים להגיע למומחים בתחום מסוים או למנהיגים בקהילה שלהם ,כדי לקבל את זווית הראייה המיוחדת להם. מדגם מכסה במדגם מסוג זה אנו דוגמים עד שאנחנו ממלאים מכסה מסוימת שאליה רצינו להגיע .לדוגמא :דוגמים עד שנגיע למכסה של 50בנות ו – 50בנים. מדגם זה הוא כמו מדגם שכבות הסתברותי אך הוא לא נעשה בצורה מקרית ואקראית אלא בצורה הנוחה לנו .בדומה לדגימת שכבות הסתברותית ,אנו עשויים לבחור בדגימת מכסה פרופורציונלית (למשל ,להבטיח שבמדגם יש 60%גברים ו 40%-נשים) ,או בדגימת מכסה לא פרופורציונלית ,שאינה משקפת את ההתפלגות באוכלוסייה ,כפי שהיא ידועה לנו .למשל ,לדגום מכסה של 50%עובדים סוציאליים ו 50%-עובדות סוציאליות ,מתוך אוכלוסייה שידוע ששיעור העובדות הסוציאליות בה גבוה בהרבה משיעור העובדים. מדגם שונות מקסימלית בסוג דגימה זה אנו עושים מאמץ מיוחד לחפש משתתפים או תופעות השונים זה מזה כך שנוכל ללמוד על מגוון תופעות ,מבלי שאנו מוטרדים מהשאלה עד כמה תופעה מסוימת שכיחה יותר או פחות .למדגם זה יש יתרונות בעיקר במחקרים איכותניים המנסים ללמוד על השונות בתופעות מסוימות. הדגימה היא חלק חשוב בכל מחקר .יש העדפה ברורה ומוצדקת לשימוש במדגמים מייצגים וגדולים היכולים לתת מענה מספק על שאלות מחקר .לשם כך ,נערכים לעיתים מחקרים שבהם מושקעים משאבים רבים כדי להבטיח את טיב המדגם .אולם ,כפי שניתן להתרשם מקריאה בכתבי עת מדעיים ומעיון במחקרים הרבים הנערכים על ידי תלמידי מוסמך ודוקטורט ,רוב רובם של המחקרים מבוססים על דגימת נוחות ועל מדגמים לא גדולים .החלק המטריד במיוחד בקריאת עבודות מדעיות אלו וכן בדיונים הציבוריים המתקיימים בעקבות מחקרים שהגיעו לתקשורת ,היא ההתעלמות מהיכולת המוגבלת
להכליל ממחקרים המבוססים על מדגמי נוחות ,שהייצוגיות שלהם כלל אינה ברורה. דוגמה להתעלמות מסוגיות של דגימה ולהימנעות מדיווח מלא ניתן למצוא בסקרי דעת קהל המתפרסמים חדשות לבקרים ,בעיקר לפני בחירות. עם כל ההערכה לידע המקצועי של הסוקרים המאפשר להם לבנות מדגמים מייצגים האמורים לתת תמונת מצב משקפת של כלל האוכלוסייה הבוגרת בישראל על סמך מדגם המונה פחות מ 600-משתתפים ,הדיווח על תהליכי הדגימה הוא פחות ממינימלי .סביר להניח כי הדבר נובע מהרצון לשמור על סודות מקצועיים .ובכל זאת ,כל מי שרוצה להעריך את ייצוגיות המדגם ,חייב לקבל מידע רב יותר על הדגימה ,כולל על שיעור המשיבים .אם שיעור המשיבים הוא נמוך מאוד ,קשה להניח שהמדגם יכול להיות מייצג (כי הוא בוודאי אינו מייצג את הפלח באוכלוסייה ,המעדיף לא לענות על סקרים). חשוב לכן ,ליישם את הלקחים שנלמדים בפרק זה לא רק לצריכה נבונה של מחקרים מדעיים ,אלא גם לקריאה ביקורתית של סקרים ומחקרים שהמדגמים שלהם עלולים להיות מוטים ושאינם ניתנים להכללה לאוכלוסייה שאותה הם אמורים לייצג. תרגילים לפרק 9 פרק 10 מערכי מחקר ^^##426מבוא בחלק זה של התהליך המחקרי ,מטרתנו היא לתכנן באלו דרכים נפעל כדי לענות בדרך מיטבית על השערות המחקר .הביטוי 'מערך המחקר' מתייחס לסדרת פעולות שבהן אנו מתכוונים לנקוט כדי לבחון את השערות המחקר .מערך המחקר עונה על שאלות כגון: • מה יהיה תפקידנו במחקר :האם רק נצפה ונאסוף נתונים בלי לשנות דבר (מערך תצפיתי ,)observational -או שאנו מתכוונים להיות מעורבים באופן אקטיבי ולהפעיל התערבות (מערך ניסויי ?)experimental - • האם אנו מתכוונים לבדוק קבוצה אחת של משתתפים? להשוות בין מספר קבוצות של משתתפים? האם נשווה בין קבוצות קיימות ,למשל בין כיתה אחת לכיתה שנייה? בין גברים לנשים? או אולי ניצור קבוצות שונות
לצורך המחקר? למשל ,לקבוצה אחת ניתן התערבות טיפולית מסוימת ולקבוצה אחרת לא ניתן? • אם אנו מתכוונים ליצור מספר קבוצות ,כיצד נחליט מי המשתתפים שייכללו בכל אחת מהקבוצות? • האם אנו מתכוונים לאסוף מידע במהלך חד פעמי ,במדידה אחת? או אולי במדידות מספר ,למשל ,לפני ואחרי הפעלת ההתערבות? האם נמשיך ונעקוב אחר משתתפים לאורך זמן רב? באיזו תכיפות? התשובות לשאלות אלו וההחלטות על מערך המחקר שבו נבחר ,מושפעות משיקולים רבים. ^^##427שיקולים לבחירת מערך מחקר באופן כללי ניתן לומר שאנו מעצבים את מערך המחקר כדו-שיח בין מה שאנו מבקשים לדעת ,כפי שבא לידי ביטוי בשאלות המחקר ,ובין מה שאנו מסוגלים לעשות במחקר המסוים .הגורם המרכזי המניע את הבחירה במערך המחקר הוא אופי שאלות המחקר שאנו מציגים .עם זאת ,לפני שנדון בהרחבה בדרכים שבהן אופי השערות המחקר ישפיע על עיצוב מערך המחקר ,נפנה את תשומת הלב לשיקולים רלוונטיים נוספים שישפיעו במידה רבה על הבחירות שנעשה בהמשך. שיקולים אתיים לשיקולים האתיים משקל רב במחקר .ייתכן שנוכל לבחון את השערת המחקר על ידי כך שנטעה את המשתתפים ונגרום להם להאמין שהם משתתפים במחקר על נושא אחר .במקרה כזה יש לשאול אם הטעייה זו מוצדקת ואם אפשר להקטין את השלכותיה השליליות .ובדוגמה אחרת ,ייתכן שהדרך הנכונה ללמוד על התפתחות התגובות לאובדן בן משפחה היא למדוד את משתני המחקר מיד עם קבלת הידיעה המרה ולאחר מכן בכל יום במהלך החודש הראשון שלאחר המוות .האם אפשר לעשות זאת בלי לפגוע בצורה משמעותית במשתתף האבל? סביר שנצטרך לבחור במערך מחקר אחר שיפגע פחות במשתתף .דוגמה נוספת היא :ייתכן שהדרך המתאימה ביותר לבחון השערת מחקר היא על ידי מניעת טיפול מקבוצת משתתפים -האם מן הראוי יהיה לעשות זאת? האם יש דרך שבה נוכל לענות על השערת המחקר באופן סביר גם ללא מניעת טיפול? אולי אפשר לדחות את הטיפול בקבוצת משתתפים מבלי שיגרם להם נזק ולא למנוע אותו כליל? אלו הם רק חלק מהשיקולים האתיים שאנו חייבים להתייחס אליהם במעבר שבין השערות המחקר לעיצוב מערך המחקר. שיקולי ישימות ועלות אילוצים אחרים נובעים משיקולי ישימות ,עלויות ,יכולות טכניות ועוד .לדוגמה, ייתכן שהדרך המתאימה ביותר לענות על השערה מסוימת היא לראיין את אותם המשתתפים לעיתים תכופות במשך שלוש שנים רצופות .לפני שנחליט על בחירה במערך מחקר כדאי לשאול אם עומדים לרשות המחקר משאבים שיאפשרו לבצע מהלך זה; האם ניתן לצפות שנצליח לאתר את המשתתפים במהלך כל השנים
האלה? האם ירצו לשתף פעולה? האם נוכל לפצות אותם על הזמן שיקדישו להשתתפות במחקר? כפי שצוין בפרק שבו תיארנו את מהלך המחקר ,חלק ניכר מהתהליך צופה פני עתיד .כאשר אנו מתלבטים בניסוח שאלות המחקר והשערותיו ,עלינו לחשוב מה המשמעויות של הבחירה שלנו בהשערת המחקר המסוימת על מערך המחקר .ייתכן שאנו מציגים השערת מחקר שאם נבחן אותה בצורה ביקורתית נמצא שאין לנו דרך טובה לענות עליה באמצעים שבידינו .חשוב לכן ,שכבר בשלב ניסוח השערות המחקר ותכנון המערך ,החוקרת תצפה את הקשיים האתיים והמעשיים שיעמדו בפנייה בעתיד ,תעריך מה היכולת שלה להתמודד אתם ,ולאור הערכה זו ,תחליט על השערות המחקר ועל מערך המחקר המתאים .לעיתים ,החוקרת תבצע שינויים בניסוח השערות המחקר המקוריות ותבחר במערך מחקר מתאים יותר לנסיבות .כך למשל ,יש חוקרים המבקשים לענות על שאלות סיבתיות ,אך משהם בוחנים את יכולתם לבצע מחקר ובו מערך מחקר מתאים לשאלה סיבתית ומגיעים למסקנה שלפחות בשלב זה של המסע המחקרי אינם יכולים לאמץ מערך מחקר סיבתי ,הם מחפשים אלטרנטיבה .במקרים מעין אלו ,יש חוקרים המחליטים להציג השערות על קשרים בין תופעות ,שהן פחות שאפתניות מבחינת הידע שהן יכולות להפיק ,אך אפשר לענות עליהן באמצעות מערכי מחקר שאפשר לעמוד בדרישותיהם .בהמשך המסע המחקרי ,גם בזכות הידע שנצבר באמצעות המחקרים על קשרים בין תופעות, עשויים החוקרים להציג שאלות סיבתיות ולהתמודד עם מערכי מחקר קשים יותר לביצוע. שיקולים הנובעים מאופי ההשערה כאמור ,הגורם המרכזי המנחה את הבחירה במערך המחקר הן השערות המחקר .על החוקר לבחור מערך מחקר המאפשר לענות על השערות המחקר .אם ההשערה של החוקר היא שיש הבדל בין נשים לגברים בתפיסתם באשר ליכולות שלהם לפתור בעיות מתמטיות ,על מערך המחקר לאפשר השוואה בין שתי הקבוצות .אם חוקרת מבקשת לבחון לאורך זמן מה השינוי שחל בהזדהות העובד עם הארגון שבו הוא מועסק ,מערך המחקר חייב לכלול התייחסות למשך הזמן שבו העובד מועסק בארגון .חוקר הבוחן את הקשר בין מידת האמון בבית המשפט העליון לדפוס ההצבעה בבחירות ,חייב לעצב מערך מחקר המאפשר לבחון את המתאם בין שני המשתנים .חוקרת הבוחנת השערה סיבתית ,שרמת האמפתיה של מרפאה בעיסוק מקדמת את נכונותו של המטופל להכיר במגבלותיו הפיזיות ,חייבת לעצב מערך מחקר שיבטיח כי הקשר שמצאה בין אמפתיה לנכונות להכיר במגבלות ,מקורו בהשפעת האמפתיה על הנכונות ,ואינו נובע מהכיוון ההפוך -שמטפלות נוטות להגיב באמפתיה רבה יותר למטופלים המוכנים להכיר במגבלותיהם הפיזיות. לאור ההשפעה החשובה של ההשערות על מערך המחקר ,נציג בנפרד מערכי מחקר ניסויים ( ,)experimentalהמתמודדים עם השערות סיבתיות ומערכי מחקר מתאמיים ( )correlational or observationalשנועדו לענות על השערות על קשרים בין משתנים .השימוש בביטוי ' 'observationalמשקף את העובדה שבמערכי מחקר שנועדו לבדוק קשר ,החוקר בוחן תופעה המתרחשת ללא התערבותו .לעומת זאת, במערכי מחקר ניסויים החוקר מפעיל (או מתפעל) את המשתנה הבלתי תלוי ,כמו
מתן התערבות או ִט ְפלּול (הפעלת מניפולציה) .בהמשך ,נציג סוג נוסף של מערכי מחקר המתאימים להשערות שבהן לזמן יש חשיבות מיוחדת ,כגון שאלות על שינויים המתרחשים לאורך זמן. ^^##428בחינה של השערות סיבתיות בפרק 4הצגנו השערות סיבתיות .למדנו שאנחנו יכולים לומר שיש קשר סיבתי בין משתנה בלתי תלוי (סיבה) למשתנה תלוי (תוצאה) כאשר: .1יש קשר בין המשתנה הבלתי תלוי לתלוי. .2סדר הזמנים הוא כזה שהמשתנה הבלתי תלוי מתקיים לפני התלוי ולא להיפך. .3אין גורמים אחרים המסבירים את הקשר בין המשתנה הבלתי תלוי למשתנה התלוי. וכך ,כדי לטעון שחרדת בחינות היא גורם סיבתי לכישלון בבחינה ,עלינו קודם כל להראות כי: .1יש קשר בין חרדת בחינות לכישלון בבחינה .קרי ,מי שסובל מחרדת בחינות צובר כישלונות רבים יותר בבחינות בהשוואה לנבחנים שרמת חרדת הבחינות שלהם נמוכה. .2תחושת החרדה קדמה בזמן לכישלון בבחינה. .3להביא עדויות נוספות ומשכנעות שלחרדה יש תרומה ייחודית לכישלון בבחינות ,בנפרד מההשפעות של גורמים אחרים .למשל ,עלינו להביא הוכחות לכך שהקשר שמצאנו אינו נובע מהעובדה הפשוטה שתלמידים עם ידע מוגבל או מיומנויות נמוכות חרדים יותר מבחינות (מסיבות מוצדקות) ,שהרי אז הכישלון נובע מהמיומנויות הנמוכות ולאו דווקא מהחרדה מהבחינה ,כפי שהייתה הטענה הסיבתית של החוקר .נדגיש ,אין הכוונה שעלינו להוכיח שחרדת בחינות היא הגורם היחיד או החשוב ביותר לכישלון בבחינה ,אלא עלינו להראות שלחרדת הבחינות הייתה תרומה ייחודית משלה ,לכישלון בבחינה. לפני שנתאר את מערכי המחקר הבוחנים השערות סיבתיות ,חשוב להבין את האתגרים שבפניהם עומדים חוקרים המציגים השערות סיבתיות ,ואת הדרישות שבהן עליהם לעמוד כדי לשכנע שעלה בידם להוכיח את ההשערות הסיבתיות שהציגו ,כלומר להוכיח כי ההבדלים בין קבוצה שקיבלה התערבות לקבוצה שלא קיבלה אותה ,נובעים מהגורם שנטען שהוא הסיבה ,ולא גורם או גורמים אחרים המעורבים בקשר זה .על ידי הבנה של הדרישות שבהן על החוקרים לעמוד ,ניתן יהיה להבין אלו מערכי מחקר מאפשרים להם לעמוד בקריטריונים הנדרשים לשם הוכחה של קשר סיבתי. ^^##429תוקף פנימי בביטוי תוקף פנימי אנו מתייחסים למידה שבה מערך המחקר שבחרנו מאפשר לנו לטעון את הטענה הסיבתית שאנו מבקשים לבדוק ( ;Campbell, 1957 .)Campbell & Stanley, 1963; Shadish, Cook, & Campbell, 2002ובמילים אחרות ,האם אומנם המחקר ,כפי שבוצע ,משכנע את הקהילה המדעית שנמצא קשר סיבתי בין המשתנה הבלתי תלוי שהציע החוקר ובין המשתנה התלוי ,או אולי,
יש טענות משכנעות שייתכן שממצאי המחקר יכולים להיות מוסברים אחרת ,ולא על ידי הקשר הסיבתי שהציע החוקר. חוקרים המתכננים מחקר צופים את פני העתיד וחושבים על היום שאחרי איסוף הנתונים ועיבודם ויבקשו לטעון שהשערתם הסיבתית אוששה .הם יעמדו אז בפני ביקורת הקהילה המדעית שתבחן את התוקף הפנימי של המחקר שביצעו ותציג בפניהם שאלות המעמידות בספק את המסקנה שלהם שהשערתם הוכחה .לכן, חוקרים חושבים מראש מה הם ה'איומים לתוקף הפנימי' ( threats to internal ,)validityומנסים ,במידת האפשר ,להכין להם פתרונות ,בדרך של תכנון מערך המחקר שלהם ,כך שיקטין למינימום איומים אלו. דרך נוחה לחשוב על הסכנות לתוקף פנימי היא לראות אותן כטענות במסגרת דיאלוג של החוקר עם הקהילה המדעית שבוחנת בביקורתיות את הטענה הסיבתית. החוקר טען זה עתה כי המחקר הזה מאושש את הטענה שלי שהמשתנה הבלתי תלוי הוא הסיבה לשינוי במשתנה התלוי .הנציג הביקורתי של הקהילה המדעית עונה :איני בטוח שאומנם איששת את הטענה הסיבתית שלך .אני חושב שלמערך המחקר שלך יש מגבלה מסוימת ,המהווה איום וסכנה לתוקף הפנימי של מחקרך, ומשום כך היא מפחיתה את האמון שלי בטענה הסיבתית שלך .שהרי ,ייתכן שלא המשתנה הבלתי תלוי שלך אחראי לתוצאות המחקר ,אלא שהתוצאות נובעות מ... וכאן תופיע אחת הסכנות שברשימה למטה .תפקידו של החוקר הוא להראות כיצד מערך המחקר 'עונה' על טענה זו .ככל שתגובת החוקר משכנעת יותר ,ניתן לומר שהתוקף הפנימי חזק יותר. כדי להדגים את התהליך נתייחס לחוקר שהחליט לתת לקבוצת ילדים טיפול שאמור לשפר את יכולתם לווסת רגשות ולקבוצה אחרת -לא .הוא מדד את היכולת לוויסות רגשות בשתי הקבוצות לפני הטיפול ולאחריו .הוא מצא שמי שקיבלו את הטיפול הראו יכולת גבוהה יותר לווסת רגשות מאשר הילדים שלא קיבלו טיפול. החוקר מבקש לטעון שהטיפול שנתן הוא הסיבה להבדל ביכולת ויסות הרגשות של שתי הקבוצות .להלן האיומים לתוקף הפנימי של המחקר: סלקציה -בחירה דיפרנציאלית של משתתפים ( differential )selection ייתכן שהתוצאות של המחקר המראות שההתערבות הצליחה (שיפור בוויסות רגשות -המשתנה התלוי) נובעות מהבחירה בקבוצה מיוחדת של משתתפים ,ולאו דווקא בשל ההשפעה של ההתערבות (המשתנה הבלתי תלוי) .למשל ,ייתכן שמי שקיבלו את הטיפול היו ילדים שההורים שלהם הפנו אותם לטיפול והשיפור ביכולות הוויסות הרגשי שלהם נבע דווקא מהמעורבות של ההורים ,ולא מהטיפול שנתן החוקר .כלומר ,ההבדל בתוצאות בין שתי הקבוצות נובע מההבדלים בין המשתתפים שנכללו בכל אחת מהקבוצות (ובמקרה זה ,הבדלים במעורבות ההורים) ,ולא מהטיפול עצמו ,כפי שטוען החוקר .כדי להתמודד עם איום זה על החוקר לערוך את
מחקרו כך שיוכל לשכנע שלא היו הבדלים קודמים בין המשתתפים בשתי הקבוצות המסבירים את ההבדלים בתוצאות. במחקר אחר ,חוקרת הראתה שבקרב אסירים שהשתתפו בסדנת מדיטציה נצפתה הפחתה בסימפטומים של חרדה ושל התנהגות מוחצנת ואגרסיבית בכלא, והציעה לאמץ את הסדנה כדרך לטיפול באסירים בזכות העדות להשפעה הסיבתית שלה .אולם ,הטענה עשויה להיות שייתכן שבחירת המשתתפים למחקר הייתה דיפרנציאלית כך שרק אסירים בעלי תכונות מסוימות נכללו בקבוצת ההתערבות ,ורק בזכות תכונות אלו חל שיפור .למשל ,אם שלטונות הכלא הציעו את הסדנה רק לאסירים שהתנהגו באופן נאות בשלושה החודשים שקדמו למחקר או שהחוקרת בחרה רק אסירים שהיו מוכנים להשתתף בסדנת מדיטציה ,הרי מדובר ב'קבוצה נבחרת' .הטענה לתוקף הפנימי היא שהשיפור במצב חל בזכות תכונות כגון מוטיבציה לטיפול ויכולת שליטה בהתנהגות תוקפנית ולא בהכרח בזכות ההשתתפות בסדנה .משום כך אין טעם לאמץ את הסדנה ,שהרי ייתכן שלא היא האחראית לתוצאות אלא דרך הבחירה במשתתפים .במקרה זה על החוקרת למצוא דרך להראות שהתוצאות אינן משקפות את התכונות המיוחדות של המשתתפים ,אלא את ההשפעה הסיבתית של הסדנה. נשירה דיפרנציאלית ()differential attrition 'אתה מראה שבעקבות ההתערבות חל שינוי במשתנה התלוי אצל המשתתפים, אך נראה שרק חלק מהמשתתפים הגיעו לשלב של סיום ההתערבות .ייתכן שנשירה זו מטה את התוצאות ,כי מי שההתערבות לא סייעה לו ,לא נכלל במדידה של המשתנה התלוי בסיום ההתערבות' .זוהי טענה דומה לטענת הבחירה הדיפרנציאלית שהוצגה לעיל ,אך היא מתייחסת למה שארע למשתתפים במהלך המחקר ולא לתהליכים של בחירת המשתתפים למחקר .משמע ,החוקר צריך לשכנע שההבדל ברמות הוויסות הרגשי שנמצאו בין שתי קבוצות הילדים ,אינו נובע מכך שבמדידה שלאחר הטיפול השתתפה רק קבוצה נבחרת של ילדים בקבוצת הטיפול, שהיא הקבוצה שהמשיכה בטיפול עד לסיומו .לקבוצה זו ,עשויות להיות תכונות מיוחדות (כגון יכולת עמידה בתסכול) שהן האחראיות לשינוי ביכולת הוויסות הרגשי ולאו דווקא הטיפול .על החוקר לשכנע ,באמצעות מערך המחקר שלו ,שהנשירה אינה מסבירה את תוצאות המחקר. ובדוגמה אחרת ,בבחינה של ההשפעה של תוכניות לעזרה עצמית באינטרנט עבור חולי סרטן המתמודדים עם סימפטומים פיזיים ואיכות חיים ירודה ,חשוב לתת את הדעת לכך ,שאומנם ניתן לזהות תוצאות חיוביות בעקבות ההשתתפות בתוכנית, אך שיעור הנשירה מהטיפול הוא בדרך כלל גדול ( Moradian, Voelker, Brown, .)Liu & Howell, 2018בדיקת מצבם של אלו שהגיעו לקו הסיום של התוכנית עלולה להטעות משום שסביר שיש כאן נשירה דיפרנציאלית .כלומר ,ייתכן שאלו שנשרו ,היו נושרים ממילא וההתערבות לא הייתה עוזרת להם ,ואילו אלו שנשארו
השתפרו ,לפחות במידה מסוימת ,בזכות התכונות שגרמו להם להחזיק מעמד בתוכנית התערבות זו ,שדרשה התמדה ויכולת לעמוד בתופעות הלוואי של הטיפול. היסטוריה ()history 'ייתכן שלא ההתערבות שלך אחראית לתוצאה ,אלא גורמים אחרים שהתרחשו במקביל ,והם למעשה אלו שאחראיים לתוצאות '.כלומר ,ייתכן שבמקביל להפעלת ההתערבות של החוקר חלו אירועים אחרים ,כמו הפעלת תוכנית הדרכה להורי הילדים ,ואירועים אלו הם האחראים לתוצאות ,ולאו דווקא ההתערבות שהפעיל החוקר .על החוקר לשכנע ,באמצעות מערך המחקר ,שההבדלים בתוצאות אינם נובעים מאירועים חיצוניים שהתרחשו במקביל לטיפול ולהראות כי גם קבוצת הילדים שלא קיבלה טיפול ,נחשפה לאירועים חיצוניים דומים ובכל זאת נמצאו הבדלים. טענה דומה ניתן להעלות בפני פוליטיקאים הטוענים שהם האחראים להישגים בתחום הכלכלה .כהוכחה לתרומה של תוכניתם הכלכלית ,הם מראים שהמצב הכלכלי במדינה השתפר במהלך כהונתם .אולם ,טענה נגדית עשויה להיות טענת ההיסטוריה' :אתה נכנסת לתפקידך בתקופת שפל בכלכלה העולמית ובזכות השיפור במצב הכלכלה העולמית ,חל שיפור במצב הכלכלי של ישראל ,ולאו דווקא בזכות התוכנית הכלכלית שלך '.האתגר הוא להראות שהמדיניות היא האחראית לתוצאות, מעל ומעבר לשינויים שחלו בעקבות השיפור במצב הכלכלה העולמית. בשלות ()maturation 'השינויים שאתה מצביע עליהם כהוכחה ליעילות ההתערבות (להשפעה של המשתנה הבלתי תלוי שלך) היו מתרחשים באופן טבעי ,גם ללא התערבות ,בזכות תהליכי הבשלה '.משמע ,ייתכן שילדים שהתקשו בוויסות רגשי עוברים תהליך טבעי של התפתחות רגשית המביא לעלייה ביכולת הוויסות הרגשי ,גם ללא טיפול .טענה זו דומה לטענת ההיסטוריה ,אך כאן מדובר באירועים ובשינויים פנימיים ,ולא חיצוניים. דוגמה אחרת ,חוקרת עשויה לתכנן התערבות המיועדת להקל על קשיי ההסתגלות של עולים חדשים .אם היא תראה שעולים חדשים המקבלים התערבות זו מדווחים על הפחתה עם הזמן בקשיי הסתגלות ,עליה גם להראות ששינויים אלו לא היו מתרחשים בכל מקרה כחלק מתהליך ההסתגלות שעוברים כל העולים (גם אלו שאינם מקבלים טיפול) .זאת ,משום שהממצא לפיו אחרי ההתערבות התמתנו קשיי ההסתגלות ,עשוי לשקף תהליכי הבשלה טבעיים ,ולאו דווקא לשקף שההתערבות אחראית להתמתנות של קשיי ההסתגלות .ובמילים אחרות ,על החוקרת להראות שההתערבות הביאה לשינויים שאינם מוסברים בתהליכי הבשלה העוברים על כל אחד מהעולים. נסיגה אל הממוצע ()regression to the mean 'השינויים שאתה מצביע עליהם כהוכחה ליעילות ההתערבות (להשפעה של המשתנה הבלתי תלוי שלך) היו מתרחשים באופן טבעי כי אתה בחנת התנהגויות קיצוניות ,והתנהגויות אלו נוטות לשוב עם הזמן אל הממוצע שלהם' .לדוגמה, התערבויות במשבר בין בני זוג ,מתמקדות במצבים חריגים ,שבהם המשתנה התלוי הרבה יותר גבוה (כגון מתח בין בני הזוג) או הרבה יותר נמוך (תמיכה הדדית),
מהמקובל בין בני הזוג לאורך זמן ('הממוצע') .הטענה היא ,שבדרך כלל תופעות מתאזנות עם הזמן ומצבים קיצוניים נוטים להתמתן (שהרי אם לא ,המצב הקיצוני היה הופך להיות הממוצע) .טענת הרגרסיה אל הממוצע רלוונטית כאשר מדובר בניסיון להשפיע על תופעה קיצונית ,שייתכן מאוד שגם ללא התערבות היא תחזור למסלול הרגיל שלה. כך למשל ,במחקר שנערך לבחינת ההשפעה של תוכניות התערבות להפחתת מחשבות אובדניות ודיכאון בקרב מתבגרים נבחנו שתי התערבויות שונות: התוכנית ) Attachment-based family therapy (ABFTהושוותה לתוכנית ) .Family-enhanced nondirective supportive therapy (FE-NSTבניגוד להשערת החוקרים ,לא היו הבדלים בין התוכניות ובשתיהן הייתה ירידה משמעותית במחשבות אובדניות ובסימפטומים דיכאוניים .החוקרים ציינו שייתכן שנבחרו משתתפים בעלי רמות גבוהות במיוחד של סימפטומים והתוצאות משקפות נסיגה אל הממוצע (קרי לרמות פחות קיצוניות של סימפטומים ומחשבות אובדניות) ,בשתי הקבוצות במחקר ,ללא קשר להתערבות (.)Diamond et al., 2018 תלמידים בשלבי לימודים מתקדמים מעלים לעיתים שאלות באשר להבדלים בין טענות על הבשלה לטענות על רגרסיה לממוצע .הדוגמה על מחשבות אובדניות ודיכאון שהבאנו כאן מדגימה ,שהחשש שמה שאנו רואים נובע מנסיגה אל הממוצע, הוא באותם המקרים שבהם התופעה חריגה ,שונה במידה משמעותית מהמצב הרגיל ,הממוצע .במקרים כאלה ,כמו עלייה חריגה ברמות הדיכאון ,מעלים את האפשרות שתהייה התמתנות וחזרה לממוצע ,גם ללא התערבות .בדוגמה אחרת, כמו קשיי הסתגלות למקום חדש ,ההסבר שלנו לירידה בסימפטומים ובקשיים יהיה קשור יותר לתהליכי ההתפתחות עם הזמן (קרי ,הבשלה) ,מאשר חזרה לממוצע ולמצב הרגיל ,שהרי מדובר במצב חדש. השפעות המדידה ()testing 'מקורם של ההבדלים שמצאת בין המדידה הראשונה ,לפני הפעלת המשתנה הבלתי התלוי ,למדידה שאחרי הפעלת המשתנה הבלתי תלוי ,אינו בהשפעה הסיבתית של המשתנה הבלתי תלוי ,אלא במדידה עצמה' .ניתן לזהות מצבים שונים שבהם ההבדלים בין המדידה לפני הפעלת המשתנה הבלתי תלוי ולאחריה נובעים מהמדידה עצמה ,ולאו דווקא בזכות הפעלת המשתנה הבלתי תלוי .מצב אחד נוגע לפעולת המדידה עצמה שעשויה לשנות את התופעה .לדוגמה ,חוקרת מבקשת להגביר את המודעות של מורים לתלמידים שקטים ולא מעורבים ,תלמידים אשר המורים מקדישים להם בדרך כלל פחות תשומת לב .כדי לבדוק את השפעות ההתערבות ,החוקרת מציגה שאלות למורים בתחילת המחקר ואת אותן השאלות לאחר הפעלת ההתערבות .וכך ,בצעד הראשון ,החוקרת מציגה למורים סדרת שאלות באשר למי מהתלמידים הם בדרך כלל מקדישים תשומת לב בכיתה .ייתכן שעצם הצגת השאלות ,מעלה את המודעות של המורים להתנהגותם כלפי תלמידים, והם יקדישו תשומת לב רבה יותר לתלמידים השקטים ,גם ללא ההתערבות .דוגמה אחרת ,שניתנה על ידי קמפבל ( )Campbell, 1957היא מדידה של משקלו של משתתף בתחילת התערבות המכוונת להשפיע על הרגלי אכילה .עצם המודעות
למשקל משפיעה בהמשך על הרגלי האכילה (לפחות לטווח הקצר) ,גם ללא התערבות. במקרים אחרים ,השפעת המדידה נובעת מכך שמי שנבחן פעם אחת ,נוטה להצליח יותר במבחן השני מכיוון שהנבחן מכיר את תוכן המבחן וסגנונו .כך למשל, התוצאות במבחן אינטליגנציה הן בדרך כלל גבוהות יותר כשלנבחן ניתנת הזדמנות שנייה לבחינה שכן הנבחן רכש מיומנות מסוימת להתמודדות עם הבחינה. קמפבל ( )Campbell, 1957גם מפנה את תשומת הלב ל – instrumental ,decayירידה באיכות המדידה בין המדידה שלפני הפעלת המשתנה הבלתי תלוי למדידה אחרי ההפעלה .לדוגמה ,המדידה השנייה התבצעה על ידי תצפיתנים אחרים מאשר אלו שביצעו את המדידה הראשונה או שמי שבצעו את המדידה הראשונה ביצעו את המדידה השנייה בדרך אחרת ,למשל עקב עייפות או משום ששינו את הדרך שבה העריכו את המשתתפים ,לאחר שנחשפו למספר רב של משתתפים במדידה הראשונה ושינו את ציפיותיהם .במקרים אלו ,הפערים בין המדידה שלפני הפעלת המשתנה הבלתי תלוי ואחרי הפעלתו עלולים לנבוע מהשפעות המדידה ,ולאו דווקא עקב הפעלת המשתנה בלתי תלוי. תגובתיות להשתתפות במחקר ()Reactivity 'אתה טוען שההתערבות המסוימת שהפעלת היא האחראית לשינויים במשתנה התלוי ,אך ייתכן שעצם התגובה להשתתפות במחקר ,למשל התגובה לתשומת הלב שהורעפה על המשתתפים ,היא האחראית לשינוי במשתנה התלוי '.לדוגמה ,חוקר עשוי להראות שהכנסת חיות מחמד לבית אבות במסגרת של מחקר התערבות שיפרה את מצב רוחם של המתגוררים בבית האבות .אולם ,ניתן להסביר את השינוי שחל במשתנה התלוי גם בתגובת הנחקרים לעצם השתתפותם במחקר ללא קשר להתערבות כלשהי .תשומת הלב ,העניין וההתייחסות הרצינית למה שהם אומרים, הם אלו האחראים לשינוי במצבם. מקובל להתייחס לטענה זו כאל' -אפקט הות'ורן' ( .)Hawthorne Effectאפקט זה נקרא על שם בית חרושת שבו נעשה מחקר על שינויים בתנאי העבודה במטרה לזהות אלו שינויים מביאים לעלייה בתפוקה .התוצאה המעניינת הייתה שכל השינויים שהוכנסו ,גם אם היו סותרים (הגברת תאורה או דווקא החלשתה) הביאו לתפוקה גבוהה יותר .במחקר זה ובמחקרים אחרים נמצא שהן עצם ההשתתפות במחקר על התערבות והן הציפיות לשינוי בזכות ההתערבות משפיעות פעמים רבות על השינוי במשתנה התלוי. הטיית הנסיין ()experimenter expectancy bias 'השינויים שאתה רואה בהתנהגות של המשתתפים אינם נובעים מהפעלת המשתנה הבלתי תלוי ,אלא מכך שהמשתתפים מבינים שהציפייה שלך כחוקר היא שהם יפגינו שינויים בכיוון מסוים ,והם נענים לציפייה שלך' .חשש זה לתוקף פנימי הושפע מעבודתו של רוזנטל ( )Rosenthal, 1976שהראה שמשתתפים בניסויים פסיכולוגיים נוטים להגיב בהתאם למה שהם רואים כצפייה של החוקר באשר לתוצאות המחקר .לפי רוזנטל ,החוקר 'משדר' ,מבלי משים ,את מה שהוא מבקש לראות ,והמשתתפים קולטים את השדר ומגיבים בהתאם .בהקשר אחר הדגים
רוזנטל שהצפיות של מורים מתלמידיהם השפיעו על התוצאות של התלמידים, תופעה המכונה 'אפקט פיגמליון' ( .)Pygmalion effect, Rosenthal 1994כדי להתגבר על חשש זה ,על החוקר להראות שצפיותיו לגבי תגובות המשתתף לא יכולות היו להשפיע על התוצאות .למשל ,אם את ההתערבות מבצע גורם שאינו יודע מה צפויות להיות תוצאות הפעלת המשנה הבלתי תלוי ,צפיותיו אינן יכולות להשפיע על המשתתפים. צירופים של איומים ()interactions לעיתים החשש לתוקף הפנימי נובע מצירופים בין איומים שונים .לדוגמה, הצירוף בין בחירה והיסטוריה :אם קבוצה אחת חשופה לאירועים שונים מאשר קבוצה אחרת (למשל ,משום שהם מתגוררים בישובים שונים) יש קושי להפריד בין ההשפעה של המשתנה הבלתי תלוי ובין החשיפה השונה של כל אחת מהקבוצות להיסטוריה .דוגמה אחרת היא צירוף בין בחירה לבשלות -אם הבחירה נעשתה כך שלקבוצה אחת קצב בשלות השונה מהקבוצה האחרת (למשל ,בחירת קבוצות עולים ממדינות שונות או מקבוצות גיל שונות) ,קשה לדעת אם השינויים שחלו בעקבות הפעלת המשתנה הבלתי תלוי משקפים את השפעתו או אולי את קצב ההבשלה השונה בין הקבוצות .לדוגמה עולים ממדינות בעלות תרבות זהה לזו שבמדינה הקולטת עשויים באופן טבעי להסתגל מהר יותר בהשוואה לאלו שתרבותם שונה. לאחר שהצגנו את האיומים השונים לתוקף פנימי ,נסקור כיצד מערכי המחקר מבקשים להתמודד עם איומים אלו. ^^##430מערכי מחקר לבחינת השערות סיבתיות לפני שנתאר מערכי מחקר שונים ,נציג דרך רישום שהוצעה לפני שנים רבות על ידי קמפבל ( )Campbell, 1957והיא מקובלת עד היום. = Xהמשתנה הבלתי תלוי ,ההתערבות ,הסיבה המשוערת = Oתצפית /מדידה של המשתנה התלוי = O1תצפית/מדידה לפני הפעלת המשתנה הבלתי תלוי = O2תצפית/מדידה לאחר הפעלת המשתנה הבלתי תלוי = ------הקצאה לקבוצת מחקר ולקבוצת השוואה = Rהקצאה מקרית ( )randomלקבוצת מחקר ולקבוצת ביקורת מטרתם של מערכי מחקר שנועדו לענות על השערות סיבתיות היא לסייע לענות על טענות לתוקף פנימי .אחת הדרכים להבין כיצד מערכי מחקר מצליחים לענות על שאלות סיבתיות היא לבחון מערכי מחקר שאינם עונים כראוי על טענות לתוקף הפנימי ,ולזהות מה חסר בהם ,כדי לעצב בהמשך מערכי מחקר העונים במידה מספקת לאיומים לתוקף הפנימי .אנו הולכים כאן בעקבות קמפבל ונציג מערכי מחקר 'טרום ניסויים' ( ,)experimental-preנראה כיצד הם מתקשים לענות על
Search
Read the Text Version
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- 139
- 140
- 141
- 142
- 143
- 144
- 145
- 146
- 147
- 148
- 149
- 150
- 151
- 152
- 153
- 154
- 155
- 156
- 157
- 158
- 159
- 160
- 161
- 162
- 163
- 164
- 165
- 166
- 167
- 168
- 169
- 170
- 171
- 172
- 173
- 174
- 175
- 176
- 177
- 178
- 179
- 180
- 181
- 182
- 183
- 184
- 185
- 186
- 187
- 188
- 189
- 190
- 191
- 192
- 193
- 194
- 195
- 196
- 197
- 198
- 199
- 200
- 201
- 202
- 203
- 204
- 205
- 206
- 207
- 208
- 209
- 210
- 211
- 212
- 213
- 214
- 215
- 216
- 217
- 218
- 219
- 220
- 221
- 222
- 223
- 224
- 225
- 226
- 227
- 228
- 229
- 230
- 231
- 232
- 233
- 234
- 235
- 236
- 237
- 238
- 239
- 240
- 241
- 242
- 243
- 244
- 245
- 246
- 247
- 248
- 249
- 250
- 251
- 252
- 253
- 254
- 255
- 256
- 257
- 258
- 259
- 260
- 261
- 262
- 263
- 264
- 265
- 266
- 267
- 268
- 269
- 270
- 271
- 272
- 273
- 274
- 275
- 276
- 277
- 278
- 279
- 280
- 281
- 282
- 283
- 284
- 285
- 286
- 287
- 288
- 289
- 290
- 291
- 292
- 293
- 294
- 295
- 296
- 297
- 298
- 299
- 300
- 301
- 302
- 303
- 304
- 305
- 306
- 307
- 308
- 309
- 310
- 311
- 312
- 313
- 314
- 315
- 316
- 317
- 318
- 319
- 320
- 321
- 322
- 323
- 324
- 325
- 326
- 327
- 328
- 329
- 330
- 331
- 332
- 333
- 334
- 335
- 336
- 337
- 338
- 339
- 340
- 341
- 342
- 343
- 344
- 345
- 346
- 347
- 348
- 349
- 350
- 351
- 352
- 353
- 354
- 355
- 356
- 357
- 358