הטענות לתוקף פנימי ובהמשך נציג מערכי מחקר ניסויים ( )experimentalהעונים לרבות מהטענות לתוקף הפנימי שמערכים טרום ניסויים אינם עונים עליהם. ^^##431מערכי מחקר טרום ניסויים X O1 קבוצה אחת אחרי (:)post-test only, one-shot case study זהו מערך שבו אנו פוגשים את המשתתפים רק אחרי שהאירוע התרחש, ומנסים להעריך את השפעת האירוע ,רק באמצעות המדידה לאחר שהתרחש. לדוגמה ,נניח שאנו מבקשים להבין כיצד צפייה בתוכנית טלוויזיה שבה הופיעה אישיות פוליטית השפיעה על עמדות הצופים .במערך זה נבחן את עמדות המשתתפים לאחר שצפו בתוכנית הטלוויזיה .זהו מערך הנותן מידע חלקי ביותר ומקשה על ההסקה ש אומנם הצפייה היא זו שאחראית לעמדות הצופים ולא גורמים אחרים .כך למשל ,יש חשש לתוקף הפנימי הנובע מהבחירה הדיפרנציאלית – מי שבחר לצפות בתוכנית הוא כבר בעל נטייה לעמדות פוליטיות מסוימות .כמו כן מערך מחקר זה אינו יכול להתמודד עם טענות על כך שאירועים אחרים כגון חשיפה למידע אחר על המועמד ,אחראים לעמדות אלו .קושי מרכזי הוא כמובן העובדה שאין לנו מידע על מצבו של המשתתף לפני שצפה .ייתכן שעמדותיהם של המשתתפים הן למעשה המצב 'הרגיל' של המשתתפים ואינם נובעים מהצפייה בתוכנית או קשורים אליה בדרך כלשהי .מערך המחקר הבא מנסה לענות על חלק ממגבלות אלו של המערך שבו אנו צופים על ידי הוספת מדידה של עמדות המשתתפים עוד לפני שצפו בתוכנית. קבוצה אחת לפני ואחרי (:(one group pretest-post O1 X O2 במערך מחקר זה נבצע תצפית על עמדותיהם של משתתפים לפני ( )O1שצפו בתוכנית ( )Xואחרי הצפייה ( .)O2מההשוואה נרצה לבדוק אם הצפייה בתוכנית הטלוויזיה היא הגורם הסיבתי לפער זה. נניח שמצאנו הבדל בעמדות בין המדידה לפני הצפייה בתוכנית לזו שאחרי הצפייה בתוכנית .אנו רוצים לטעון שהצפייה (ה )X -היא הסיבה לשינוי אשר חל במשתנה התלוי .האם אפשר לשלול את הטענות לתוקף הפנימי שהעלינו קודם? כלומר ,האם ניתן להציג השערות אלטרנטיביות סבירות המסבירות את השינוי בעמדות מבלי לכלול את הצפייה כסיבה? התשובה היא חיובית .מערך מחקר זה מתקשה להתמודד עם טענות לתוקף פנימי כגון בחירה דיפרנציאלית ,היסטוריה ובשלות .למשל ,ייתכן ,שמי שבחרו לצפות בתוכנית כבר שקלו שינוי בעמדותיהם כלפי הדמות הפוליטית ולכן החליטו לצפות בתוכנית .ייתכן שגם ללא הצפייה בתוכנית ,קבוצה מיוחדת זו הייתה משנה את עמדותיה .כמו כן ,ייתכן שאירועים
אחרים שהתרחשו בזירה הפוליטית במקביל לתוכנית הטלוויזיה ,טענת ההיסטוריה, השפיעו על המשתתפים. אחת הדרכים לחזק את מערך המחקר הזה ולהתמודד עם חלק מהטענות לתוקף הפנימי היא להשתמש במערכי מחקר אשר כוללים שימוש בקבוצת השוואה או ביקורת. לפני ואחרי עם קבוצת השוואה ללא השמה מקרית ( pretest-posttest :)control group, no random assignment קבוצת מחקר O1 X O2 ------------------------------------------------------------ קבוצת השוואה O1 O2 במערך מחקר כזה נבחר בשתי קבוצות ונתייחס לאחת מהן כקבוצת המחקר, שבה נפעיל את המשתנה הבלתי תלוי ,ההתערבות ,ולאחרת כקבוצת השוואה ובה לא נפעיל את המשתנה הבלתי תלוי .לפני הפעלת המשתנה הבלתי תלוי נצפה במשתנה התלוי בשתי הקבוצות ( .)O1נפעיל את המשתנה הבלתי תלוי ( )Xבקבוצת המחקר .לאחר ההפעלה של המשתנה הבלתי תלוי נמדוד את ערך המשתנה התלוי הן בקבוצת ההתערבות והן בקבוצת ההשוואה ( .(O2כעת נשווה את הפערים בין O1 ל O2 -בין שתי הקבוצות .ככל שיש הבדלים בין שתי הקבוצות בפער שבין המדידה לפני למדידה אחרי ,נרצה לשייך אותם להשפעת ה .X -כפי שהוצג בדוגמה של תוכנית הטלוויזיה ,נבחן במערך זה את העמדות של המשתתפים לפני צפייה בתוכנית הטלוויזיה ,את חלקם נחשוף לתוכנית הטלוויזיה (קבוצת המחקר) ולחלק האחר (קבוצת ההשוואה) לא נראה את התוכנית .אחר כך ,נבחן את עמדות המשתתפים בשתי הקבוצות ,נמדוד את הפערים בין המדידה שלפני למדידה שאחרי בכל אחת מהקבוצות ונשווה ביניהם. דוגמה נוספת :בקרב קבוצה אחת של בני נוער בסיכון נפעיל תוכנית הדרכה שמטרתה להקטין את השימוש בטבק ונבחר קבוצת השוואה שלה לא ננגיש את תוכנית ההדרכה ,ונראה אם רמת השימוש בטבק של בני הנוער שקיבלו את ההדרכה נמוכה מזו של מי שלא קיבלו הדרכה .במערך זה נבדוק את השימוש בטבק לפני ואחרי ההתערבות .נדגיש שוב שהבדיקה במקרה זה אינה בהשוואה בין שתי הקבוצות בנקודת הזמן השנייה (\"אחרי הטיפול\" עבור הקבוצה שקיבלה טיפול) ,אלא בהשוואה של השינויים שעברו על שתי קבוצות אלו .כלומר ההשוואה נעשית על עוצמת השינוי בשתי הקבוצות ( O2 – O1בקבוצת המחקר בהשוואה לO2 – O1 - בקבוצת ההשוואה). במערך מחקר זה אנו מתכוונים להתמודד עם סוגיות של בשלות והיסטוריה בכך שנטען שתהליכי בשלות והשפעות היסטוריות פעלו הן על קבוצת הטיפול והן על קבוצת הביקורת .כך למשל ,אם במהלך המחקר פורסמו מחקרים חדשים ברשתות החברתיות שהראו כיצד שימוש בטבק פוגע ביחסי המין של משתמשים צעירים ,הרי
נטען שהן פעלו על שתי הקבוצות באותה דרך ,ולכן ,אם יש הבדלים בין שתי הקבוצות ברמת השימוש בטבק ,הם לא יכולים להיות מוסברים על ידי אירועים היסטוריים אלו. הקושי המרכזי שיש במערך מחקר זה נוגע לאפשרות שקבוצת הטיפול וקבוצת ההשוואה שונות זו מזו באופן משמעותי וייתכן שהתוצאות שאנו עדים להן נובעות מההבדלים בין הקבוצות (הקצאה סלקטיבית לקבוצות) .בדוגמה הנוכחית, אם בני הנוער יכלו לבחור האם להשתתף בקבוצת ההדרכה על נזקי השימוש בטבק הרי מי שקיבלו את הטיפול כנראה שונים במאפיינים משמעותיים מבני הנוער שבחרו לא להשתתף בתוכנית .מקורם של ההבדלים של 'לפני' ו'אחרי' בין שתי הקבוצות עשוי להיות ההבדלים במאפייניהם (כגון ,מידת ההפנמה של נורמות קונפורמיות), ולאו דווקא ההשתתפות בתוכנית ההדרכה .כדי להתמודד עם קושי זה ,הנובע מהבדלים אפשריים בין קבוצת המחקר לקבוצת ההשוואה ,נשתמש במערכים ניסויים. ^^##432מערכים ניסויים ()experimental designs מערכים ניסויים פותחו כדי לענות על שאלות סיבתיות בדרך היעילה ביותר, ובמילים אחרות ולאור החלקים הקודמים ,כדי שיעמדו בצורה הטובה ביותר בטענות לתוקף הפנימי .כפי שראינו ,כאשר אנו עושים שימוש במערך שבו אנו מפעילים גורם מסוים (כמו התערבות) ומשווים בין שתי קבוצות ,האחת שמקבלת את הגורם הסיבתי והאחרת שאינה מקבלת ,אנו מבקשים לטעון שכל הבדל בתוצאות של שתי הקבוצות (קרי הפער בין תוצאות התצפית לאחר מתן הגורם הסיבתי לאלו של התצפית לפני הפעלת הגורם הסיבתי) ,נובע אך ורק מהגורם הסיבתי .ראינו גם, שכשהשתמשנו במערך שבו היו שתי קבוצות (מחקר והשוואה) ,הטענות לתוקף הפנימי תוקפות את ההנחה שלנו ששתי הקבוצות זהות ,מלבד העובדה שאחת קיבלה את הגורם הסיבתי והאחרת לא קיבלה אותו .משום כך ,נרצה ליצור מצב שבו איש לא יוכל לטעון ששתי הקבוצות שונות ולו במעט. נניח שאנו רוצים לבחון את ההשערה שהתערבות שפותחה על ידינו מגבירה את האמפתיה בקרב ילדים בגיל הגן .כלומר ,להתערבות שלנו ה ,X -יש השפעה סיבתית על רמת האמפתיה .כדי לבחון את ההשערה ,נחלק קבוצה של ילדי גן לשתי קבוצות ,ורק לאחת מהן ניתן את ההתערבות שפיתחנו (קבוצת המחקר או קבוצת הטיפול) ,ולאחרת לא ניתן כל טיפול מיוחד .מכיוון שאנו ערים לטענה האפשרית, שהקבוצה שלה אנו נותנים את ההתערבות שונה מהקבוצה האחרת ,אנו מבקשים דרך להבטיח את הדמיון בין שתי הקבוצות .הנטייה האינטואיטיבית היא לוודא ששתי הקבוצות זהות .אם נשייך ילד בן ארבע לקבוצה אחת ,נחפש ילד אחר בן ארבע, שיהיה בקבוצה האחרת ,אם נרצה לשייך ילד שלו הורים משכילים לקבוצה אחת, נחפש ילד אחר שלו הורים משכילים ,ואם מולנו ילדה שהגננת טוענת שהיא 'מלאך' ומגיבה באמפתיה רבה לכל הילדים האחרים נבחן האם יש מלאכית אחרת בגן כדי לוודא שהיא תהייה בקבוצה האחרת וכדומה .קרוב לוודאי שמדובר במהלך שאין לו סיכוי להבטיח זהות בין שתי הקבוצות .גם אם נעלה בדעתנו כל גורם אפשרי ונמצא משתתפים הדומים בגורמים אלו ,הרי ייתכן שהמשתתפים יהיו שונים בגורמים
אחרים ,שלא העלנו בדעתנו .ייתכן ,שדווקא גורמים אחרים אלו המבחינים בין הקבוצות אחראים להבדלים בתוצאות ולא תוכנית ההתערבות שלנו. כפי שלמדנו בפרק על דגימה ,שבו רצינו לייצג את כל האוכלוסייה ,הדרך היעילה היא להשתמש בתהליכים מקריים .ואכן ,הדרך לקבל קבוצות שבאופן עקרוני דומות זו לזו היא באמצעות הקצאה מקרית ( .(random assignmentכלומר ,אנו בוחרים בתהליך ,שעל פניו ,אינו מעדיף שום גורם ,והוא מפנה לכל קבוצה באופן מקרי .כעת ,כשתושמע הטענה שהקבוצות אינן זהות ,נוכל לטעון שאין סיבה לטענה זו ,משום שתהליך ההקצאה המקרית הבטיח לנו שלא נעשה כל מהלך שיטתי הגורם לקבוצת המחקר להיות שונה מקבוצת הביקורת ,וניתן לכן להניח שהן דומות. מערכי מחקר ,שבהם אנו מקצים באופן מקרי את המשתתפים לקבוצה שבה מופעל הגורם שאנו רוצים לבחון את השפעתו ,קבוצת הניסוי או קבוצת המחקר, ולקבוצה שבה לא מופעל גורם זה ,קבוצת הביקורת ,נקראים מערכי מחקר ניסויים ( .)experimental designsלהלן יוצגו הסוגים השונים של מערכי המחקר הניסויים. מערך ניסויי קלסי :לפני ואחרי עם קבוצת ביקורת בהקצאה מקרית O1 X O2 R O1 O2 במערך מחקר זה שתי קבוצות :קבוצת מחקר ,שבה מופיע הגורם הסיבתי, הגורם שמופעל על ידי החוקר ,וקבוצת ביקורת ,שבה לא ניתן הגורם הסיבתי. המיוחד במערך זה הוא שההקצאה לקבוצה היא מקרית .במערך זה ,נבצע תחילה מדידה של המשתנה התלוי הן בקבוצת המחקר והן בקבוצת הביקורת .לאחר מכן, נפעיל את המשתנה הבלתי תלוי ,Xשהוא המניפולציה או ההתערבות שהחוקר מפעיל ,רק על קבוצת המחקר .לבסוף ,נמדוד שוב את ערכו של המשתנה התלוי בשתי הקבוצות ונשווה ביניהן .אם נראה כי שינוי אשר חל בקבוצת המחקר הוא גדול יותר ,ניתן לומר כי Xהוא הגורם לשינוי. O2 - O1 O2 - O1 קבוצת המחקר קבוצת הביקורת נתבונן לדוגמה בשאלת מחקר סיבתית ונראה כיצד מערך המחקר הניסויי מתמודד איתה .חוקרים שיערו שלחיצת יד ( )handshakeמשפיעה על הנכונות 'לסגור עסקה' ( .)deal makingבמסגרת מחקר במעבדה שלהם הציגו החוקרים בפני זוגות משתתפים משימה של משא ומתן ובחנו עד כמה התוצאות היו חיוביות בעבור שני בני הזוג ( .)Schroeder, Risen, Gino, & Norton, 2018בחלק אחד של המחקר הם צפו במשתתפים במעבדה והשוו בין זוגות שבחרו ללחוץ ידיים לפני
תחילת המשא והמתן לאלו שבחרו לגשת ישירות למשא ומתן .הם מצאו שמי שלחצו ידיים הגיעו לתוצאות טובות יותר בעבורם .אולם ,תצפיות אלו לא יכלו להוכיח את ההשערה הסיבתית שלחיצת היד היא הגורם שתורם לתוצאות הטובות .למשל ,ייתכן שמי שבחרו ללחוץ ידיים הם דווקא אלו שיש להם עניין ונכונות לקדם משא ומתן התורם לשני המשתתפים ,ולחיצת היד אינה הגורם הסיבתי לתוצאות הטובות של המשא ומתן אלא עמדות המשתתפים שבאו לידי ביטוי בין השאר בלחיצת יד. בחלק הניסויי של מחקרם ,ליוו החוקרים את המשתתפים לחדר המשא ומתן ונקטו ,באופן מקרי ,באחת משתי הפעולות :א .הושיבו את שני המשתתפים משני צדי שולחן כדי שיתחילו במשימת המשא ומתן ואמרו' :מקובל שאנשים יושבים משני צדי השולחן במהלך משא ומתן'; או ב .אמרו לשני המשתתפים עוד לפני שהתיישבו: 'מקובל שאנשים לוחצים ידיים לפני שמתחילים משא ומתן' .תוצאות המחקר הראו שזוגות משתתפים שלחצו ידיים לפני תחילת המשא ומתן (קבוצת המחקר) הראו התנהגויות מילוליות ולא מילוליות של שיתוף פעולה והסכמה באופן משמעותי יותר משל זוגות משתתפים שלא לחצו ידיים (קבוצת הביקורת) .משום שההקצאה לשתי הקבוצות הייתה מקרית ,אי אפשר להסביר את התוצאות בהבדלים מוקדמים בין הזוגות בשתי הקבוצות .ההקצאה המקרית גם עונה לסוגיות של היסטוריה ובשלות, שאמורות להשפיע בצורה דומה בשתי הקבוצות ,ומשום כך אינם מהווים הסבר אפשרי לתוצאות השונות בשתי קבוצות. מערך ארבע הקבוצות של סולומון ()Solomon four-group design כפי שציינו ,אחת הסכנות לתוקף הפנימי הוא החשש שהמדידה של מצב הבסיס לפני הפעלת הגורם הסיבתי ( ,)O1משפיעה על התוצאות הנמדדות לאחר הפעלת הגורם הסיבתי ( .)O2אחת הדרכים להתמודד עם חשש זה היא באמצעות מערך הידוע כמערך ארבע הקבוצות של סולומון .נציין כי על אף שמערך זה מופיע במרבית ספרי הלימוד ,לא רבים הם המחקרים הנעזרים במערך המלא ,בין היתר מכיוון שהוא מחייב הקצאה של משאבים רבים .אנו מציגים את המערך כאן ,כדי להראות את ההיגיון של קבוצות ביקורת ,שלכל אחת מהן תפקיד בהתמודדות עם סיכון לתוקף פנימי. מערך ארבע הקבוצות של סולומון O1 X O2 1 קבוצות מחקר X O2 2 R קבוצות O1 O2 3 ביקורת O2 4 במערך המחקר הזה ,קבוצה 1וקבוצה 2מהוות את קבוצת המחקר וקבוצות 3 – 4הן קבוצת הביקורת .קבוצה 2מהווה קבוצת ביקורת להשפעה של המדידה הראשונה בקבוצה – 1ההבדלים בין הקבוצות נובעים רק מהשפעת המדידה
הראשונה .קבוצה 3מהווה קבוצת ביקורת להשפעה של ההתערבות בקבוצה – 1כל הבדל בין שתי הקבוצות נובע מה .X-קבוצה 4מהווה קבוצת ביקורת להשפעה של המדידה הראשונה בקבוצה ( 3כל ההבדל ביניהן נובע מהמדידה הראשונה) וכן מהווה קבוצת ביקורת להשפעה של ההתערבות בקבוצה ( 2כל הבדל ביניהם נובע מ .(X ג'ורדן ועמיתיו ( (Jordaan, Beukes, & Esterhuyse, 2018בחנו את ההשפעה של תוכנית לשיפור כישורי חיים בקרב עבריינים צעירים .בצעד הראשון הם הקצו משתתפים באופן מקרי לקבוצת טיפול ולקבוצת ביקורת .בהמשך ,הם חילקו כל אחת מקבוצות אלו לשתי קבוצות .באחת מהן המשתתפים ענו לשאלונים בתחילת המחקר ( )test-preובסופו ( ,)test-postובאחרת המשתתפים התבקשו לענות רק בסוף המחקר .בכך יצרו החוקרים ארבע קבוצות שאיפשרו לבחון את השפעות המדידה של כישורי חיים בחלק הראשון של המחקר ,לפני שהפעילו את ההתערבות. החוקרים מדווחים על כך שההשוואות שערכו הצביעו על כך שלמדידה הראשונה ( )pre-testלא הייתה השפעה על התוצאות ,ולעומת זאת לתוכנית ההתערבות הייתה השפעה על חלק מהמשתנים התלויים שנבדקו (כגון היכולת לבקש עזרה במקרה הצורך ולפתור בעיות). מערך גורמי ()Factorial design במערך מחקר ניסויי ניתן לבחון יותר מהשערה סיבתית אחת .כך למשל, במחקר שנערך על ידי קוק ועמיתיו ( & Cook, Frye, Slemrod, Lyon, Renshaw, )Zhang, 2015ביקשו החוקרים לבחון את יעילותן של שתי שיטות התערבות אלטרנטיביות לקידום מניעת התנהגות מסוכנת בקרב תלמידים ,תוכנית הנקראת ) Positive Behavioral Interventions and Supports (PBISוכן תוכנית לקידום ) .Social Emotional Learning (SELבמחקר הם הקצו תלמידים באופן אקראי לאחת מארבע קבוצות :אלו שקיבלו תוכנית ,PBISאלו שקיבלו ,SELאלו שיקבלו את שתי התוכניות ( ,)COMBOוכן קבוצת ביקורת שלא קיבלו התייחסות מעבר למקובל. במחקר זה נמצא שלשתי תוכניות ההתערבות היו תוצאות חיוביות שעלו על אלו של קבוצת הביקורת ,אך התוצאות החיוביות ביותר התקבלו בקרב הקבוצה שקיבלה את שתי התוכניות גם יחד (.)COMBO ככלל אפשר לבחון באמצעות מערך מחקר ניסויי בו-זמנית מספר גדול של שאלות סיבתיות .בדוגמה הקודמת בחנו השערות לגבי שני משתנים בלתי תלויים ( PBISו )SEL -שלכל אחד יש שני ערכים (האם הטיפול ניתן -כן ,לא) .בדוגמה זו, מספר התאים (קרי ,מספר הקבוצות) שלהם אנו זקוקים הוא .4 = 22 = 2X2אם היינו מוסיפים משתנה נוסף שגם לו שני ערכים ,היינו זקוקים ל8 = 23 = 2X2X2 - תאים כדי לבחון את ההשערות הסיבתיות הנוגעות לכל אחת מההתערבויות ולכל אחד מצירופי ההתערבויות .ניתן לראות שככל שנרצה להוסיף עוד גורמים לבחינה של השפעותיהם ,נצטרך להוסיף עוד קבוצות ומספר הקבוצות הוא מכפלה של מספר הערכים שיש לכל משתנה .בדוגמה של 10משתנים ולכל אחד מהם 3ערכים ,מספר התאים המאפשר לענות על שאלות המחקר הנוגעות לכל אחד מהמשתנים בנפרד
ולכל הצירופים האפשריים ביניהם הוא .310זהו מספר רב מאוד של תאים (.)59,049 במחקרים המבקשים להתמודד עם מורכבות זו מקובל לדגום רק חלק מהתאים כדי שייצגו את כל השאר (למעוניינים בהעמקה בנושא זה מומלץ לעיין ב – .( Montgomery, 2013 מערכי מחקר בין-משתתפים ותוך-משתתפים (within-subject and between- )subject כדי לבחון השערות סיבתיות אנחנו יכולים לנקוט בשתי דרכים .האחת ,להשוות בין קבוצות ,שכל אחת מהן נחשפה לערך אחר של המשתנה הבלתי תלוי .לדוגמה, כדי לבחון השפעה של תסכול ,העמידו החוקרים קבוצה אחת בפני מצב של המתנה מתסכלת ואת הקבוצה האחרת לא העמידו במצב זה של תסכול .ובדוגמה אחרת, כדי לבחון האם מידע על מין המועמד למשרה משפיע על מי שמחליטים על קבלה לעבודה ,אפשר לתת לקבוצת מחליטים אחת קורות חיים של מועמד ולקבוצת מחליטים אחרת לתת קורות חיים זהים ,אך של מועמדת .ההבדל בין קבוצות המחליטים יהיה הבסיס לבחינת ההשערה על השפעת מין המועמד .מערכים אלו מכונים מערכים בין-משתתפים (.)between subjects designs ניתן לפעול גם בדרך אחרת :במקום לחשוף כל אחת משתי קבוצות לערך אחד של המשתנה הבלתי תלוי ,ניתן לחשוף קבוצה אחת של משתתפים למספר ערכים של המשתנה הבלתי תלוי .לדוגמה ,ניתן לבחון את ההבדלים בין מצב שהמשתתף נחשף למצב של תסכול למצב שבו אותו משתתף לא נחשף לתסכול .וכן ,ניתן להציג בפני אותו מחליט שני תיאורים זהים של קורות חיים :האחד מתייחס למועמד והאחר למועמדת ,ולבקש שיחליט באשר להתאמה לעבודה. לכל אחת מקבוצות מערכים אלו יש יתרונות וחסרונות שיש לשקלל אותם בהחלטה על התאמתם למחקר מסוים שבכוונתנו לערוך .למערכים תוך-משתתפים יש שני יתרונות בולטים :האחד -קל וזול יותר לבצע מחקר על קבוצה אחת של משתתפים מאשר על שתי קבוצות או יותר .השני -כשבוחנים קבוצה אחת בשני מצבים שונים ,אנו מקטינים את החשש שהבדלים בין קבוצות אחראים להבדלים בתוצאות ,שהרי יש לנו רק קבוצה אחת המגיבה לשני מצבים. אולם ,למערכים הבוחנים את אותו משתתף ביותר ממצב אחד יש מגבלות הנובעות מהאפשרות שחשיפה לערך אחד של המשתנה הבלתי תלוי תשפיע על התוצאות של החשיפה לערך אחר של המשתנה הבלתי תלוי ,למשל ,עקב למידה או עייפות .בדוגמה של החלטות על סמך קורות חיים ,המשתתף שענה על קורות חיים של מועמד גבר עשוי לעשות מאמץ להיות עקבי ואולי להראות שאינו מוטה כלפי נשים (או גברים) ולהחליט על קורות חיים של מועמדת בדרך אחרת ממה שהיה עונה לולא נחשף לקורות חיים דומים של מועמד .חלק מקושי זה ניתן לנטרל על ידי כך שמציגים את קורות החיים של גברים ושל נשים בסדר מקרי כך שחלק מהמשתתפים נחשף קודם לקורות חיים של גבר ואחר כך לאלו של אישה ,וחלק אחר מקבל את קורות החיים בסדר הפוך .אולם ,אין בכך כדי למנוע לחלוטין השפעות על
תוצאות המחקר הנובעות מכך שהמשתתף נחשף ליותר מערך אחד של המשתנה הבלתי תלוי. נדגים את הבחירה בין מערך 'תוך-משתתפים' למערך 'בין-משתתפים' באמצעות שני מחקרים שבחנו קבלת החלטות ברווחת הילד .במחקר אחד הכינו החוקרים תיאורי מקרים ( )vignettesשל ילדים בסיכון .תיאורים אלו היו מבוססים על צירופים של שלושה מאפיינים של הילד ומשפחתו :מידת הסיכון האובייקטיבי שבו נמצא הילד (סיכון גבוה ,סיכון לא ברור ,סיכון נמוך) ,מצב כלכלי של המשפחה (בינוני-גבוה ,נמוך) והמוצא העדתי שאליו שייכת המשפחה (מזרחי ,אשכנזי) .צירוף זה יוצר 12תיאורים שונים ( .(2X2X3החוקרים נתנו לכל אחד מאנשי המקצוע שמונה תיאורים (שנבחרו באופן מקרי מתוך ה ,12 -והוצגו בסדר מקרי) ,ביקשו מהמשתתף להעריך את מידת הסיכון לילד בכל אחד מהתיאורים ולהמליץ אם להוציאו מהבית ( .)Enosh & Bayer-Topilisky, 2014באמצעות ההשוואה בין התגובות של אותו המשתתף לתיאורי המקרים השונים ניתן היה ללמוד שמשתתפים נטו להעריך את הסיכון כגבוה יותר ולהמליץ על הוצאה מהבית במקרים שבהם נאמר שהמצב הכלכלי של הילד היה נמוך ,יותר מאשר כשקראו תיאור מקרה שבו המצב הכלכלי היה טוב יותר .כמו כן ,כאשר המשתתפים העריכו תיאורי מקרים שבהם רמת הסיכון האובייקטיבי הייתה לא ברורה ,הם נטו להעריך ילדים ממשפחות מרקע מזרחי כנמצאים בסיכון גבוה יותר בהשוואה להערכות שלהם לגבי ילדים ממשפחות מרקע אשכנזי. מכיוון שבמחקר זה כל אחד מהמשתתפים ענה על שמונה תיאורי מקרים שונים, הרי 106המשתתפים ענו ביחד על כ 848-תיאורי מקרים .לעומת זאת ,במחקר בין לאומי על קבלת החלטות במקרים של ילדים בסיכון ()Benbenishty et al., 2015 בחנו החוקרים את ההשפעה של שני מאפיינים של תיאור המקרה :נכונות אימו של הילד להשמה חוץ ביתית (מסכימה ,מתנגדת) ,והרצון של הילד לשוב לביתו (מבקש להישאר באומנה ,מבקש לחזור לביתו) .במחקר זה הם יצרו ארבעה תיאורי מקרים שבהם הופיעו כל הצירופים האפשריים של שני המאפיינים שנבדקו ,ולכל אחד מהמשתתפים הם נתנו רק אחד מארבעת תיאורי המקרים .כאן היה צורך במדגם גדול יותר 200 :משתתפים 50 ,משתתפים לכל אחד מארבעת תיאורי המקרה .ובכל זאת ,העוצמה של מחקר זה הייתה קטנה יותר משל המחקר שהיה תוך-משתתפים משום שעל כל תיאור מקרה היו רק 50מעריכים .עם זאת ,היתרונות במערך זה היו: העובדה שלא היה חשש שהמשתתפים הושפעו בהערכותיהם מהתגובות שהם נתנו על תיאורי מקרים אחרים ,וכן ,משום שענו רק על תיאור מקרה אחד ,ניתן היה להציג להם שאלות רבות יותר על השיפוטים וההערכות שלהם על מקרה יחיד זה ,מאשר מספר השאלות שניתן להציג למשתתפים שהגיבו על שמונה תיאורי מקרה. ^^##433בדיקת טפלול במערכי מחקר ניסויים ()manipulation check בחלק הקודם הצגנו סידרה של מערכי מחקר ניסויים שבכל אחד מהם מפעיל החוקר משתנה בלתי תלוי ,כדי לבדוק אם יש לו השפעה סיבתית .במחקרים שבהם החוקרים מנסים לבדוק גורם סיבתי באמצעות מניפולציה (טפלול) ,עליהם להוכיח שהמהלך שבו נקטו אומנם הצליח להפעיל את המשתנה שהיה חשוב להם .לדוגמה, במחקר שבו רצו החוקרים לבחון את ההשפעה של תסכול על נכונות להתנהגות
סיכונית ( )risk takingהם ביקשו להשפיע על מידת התסכול של המשתתפים בקבוצת המחקר בדרך הבאה :עוזר המחקר הודיע למשתתף שאינו מוצא את המחשב הנייד הנדרש למחקר ועל המשתתף להמתין בחדר במשך 15דקות לבד ללא מעש .מדי חמש דקות עוזר המחקר יצר קשר עם המשתתף כדי לעדכן אותו על מצב החיפוש (אך גם כדי לוודא שהמשתתף לא מעסיק את עצמו בדרך כלשהיא, נרדם או שהגיע לרמות תסכול וכעס שיגרמו לו לעזוב את הניסוי). כדי לבחון אם אומנם הטפלול עלה יפה ,החוקרים השוו בין קבוצת המחקר וקבוצת הביקורת על 'מדד תסכול' בכלי למדידת רגשות ומצבי רוח ( PANAS, .)Watson, Clark, & Tellegen, 1988הבדיקה הראתה הבדלים משמעותיים בין רמת התסכול של המשתתפים בקבוצה המחקר לבין הרמה בקרב מי שלא נאלצו להמתין לתחילת הניסוי .בכך הוכיחו החוקרים שהטפלול אומנם השפיע. בדוגמה אחרת ,רצו החוקרים לבדוק כיצד מאפיינים של שתיית אלכוהול (כגון מספר הכוסות של משקה שצורך המשתתף) מושפעים מהידיעה על אחוז האלכוהול ומספר הקלוריות במנת משקה ( .)Maynard et al., 2018כדי לבחון שאלה זו, החוקרים בצעו מניפולציה ,לחלק מהמשתתפים הגישו משקה שעליו הופיע מידע על אחוז האלכוהול ומספר הקלוריות ,ואחרים קיבלו את אותו משקה ,אך ללא המידע. התברר שלא נמצאו הבדלים בין הקבוצות במאפייני השתייה שלהם .בבדיקה שערכו, נמצא שלמעשה ,למרות שהחוקרים חשבו שהם בוחנים עד כמה מידע על כמות הקלוריות או אלכוהול משפיע על מאפייני השתייה ,המשתתפים כלל לא שמו לב למידע ולא כללו אותו בתהליך ההחלטה שלהם לגבי איזו כמות לשתות .במקרה כזה, לא ניתן לומר האם הידיעה על אחוז האלכוהול ומספר הקלוריות משפיעה על השתייה ,משום שהטפלול ,הכללת המידע על בקבוק המשקה ,לא היה יעיל, ולמשתתפים בשתי הקבוצות היה מידע זהה על אחוז האלכוהול ומספר הקלוריות. חוקרים המבקשים לדעת כיצד מידע על המשקה האלכוהולי משפיע על דפוסי הצריכה של המשקה ,צריכים למצוא דרך שונה ויעילה יותר להצגת המידע מאשר המידע המופיע על תווית הבקבוק ,כדי להבטיח שהמשתתפים יהיו מודעים למידע משמעותי זה. ^^##434מערכי מחקר דמויי-ניסוי ((quasi-experimental לב המערך הניסויי הוא ההקצאה המקרית לקבוצת מחקר ולקבוצת ביקורת. לעיתים ,מסיבות מעשיות ואתיות ,אין אפשרות לבצע הקצאה מקרית .לדוגמה ,אם אנו רוצים לבחון את ההשלכות ארוכות הטווח של מעבר ממגורים בשכונה בעלת מיצב חברתי כלכלי נמוך למגורים בשכונה בעלת מיצב חברתי-כלכלי גבוה יותר ,לא נוכל לכוון באופן מקרי לגרום לחלק מהתושבים לשנות מקום מגורים ולחלק אחר להישאר בשכונה .אם נרצה לדעת אם שהות בפנימיות חינוכיות תורמת לקידום ההשכלה של החניכים ,לא נוכל לחייב קבוצת ילדים לעבור לפנימייה חינוכית ולמנוע זאת מקבוצה אחרת שהוקצתה באופן מקרי לקבוצת ביקורת .למרות קושי זה, חוקרים רבים מבקשים להגיע למערך מחקר שהוא ,ככל שניתן ,דומה למערך המחקר הניסויי .לשם כך פותחו מערכי מחקר דמויי ניסוי .יש סוגים שונים של מערכי
מחקר כאלה ואנו נדון במערכים מרכזיים (המעוניינים לבחון את הספרות על מערכים נוספים מומלץ לעיין בין היתר ב.)Campbell & Stanley, 2015; Thyer, 2012 - ^^##435קבוצות ביקורת לא שקולות ()nonequivalent control groups הרעיון בקבוצת מערכים הוא ליצור שתי קבוצות (או מספר רב יותר של קבוצות, במחקרים מורכבים יותר) דומות ככל שניתן ,בקבוצה אחת מפעילים התערבות (או מניפולציה ניסויית) והקבוצה האחרת משמשת כקבוצת ביקורת .כך למשל ,אם חוקר מפעיל התערבות בעשרה בתי ספר מסוימים ,הוא יחפש בתי ספר דומים בעלי מאפיינים שהוא חושב שעשויים להשפיע על ההתערבות .בדרך זו הוא מנסה להפחית את הסכנות לתוקף פנימי הנובעות מההבדלים בין קבוצת הטיפול לקבוצת הביקורת .ברור שככל שתהליך ההתאמה בין שתי הקבוצות שלם יותר ,ההתמודדות עם הסכנות לתוקף הפנימי יעילה יותר .עם זאת ,מכיוון שאין הקצאה מקרית ,לא ניתן לדעת אם תהליך זה אכן הביא לדמיון הרצוי בין הקבוצות. נזכיר כאן כי אנו משווים את קבוצת המחקר ואת קבוצת הביקורת על הפער שבין 'לפני' ל'אחרי' ( )pre-postבין שתי הקבוצות ולא על המשתנה התלוי בסוף התהליך ( )post – testולכן אנו מנטרלים חלק מההבדלים המשמעותיים בנקודות הפתיחה שבין שתי הקבוצות ( .)Difference in Differences, DIDלדוגמה ,חוקרת שרצתה לבחון את ההשפעה של טיולים בטבע על רמת שביעות הרצון מהחיים של זקנים בבתי אבות .כדי להתמודד עם סוגיות אתיות ומעשיות ,היא העדיפה להפעיל את ההתערבות ב – 15בתי אבות .לשם כך היא בחרה בתי אבות שבהם תפעיל את ההתערבות ולכל אחד מהם חיפשה בית אבות דומה לו במאפיינים כגון מצב חברתי- כלכלי של הדיירים ,מיקום ,גודל וכדומה .לאחר תהליך בניית קבוצת הביקורת בחנה החוקרת את רמת שביעות הרצון מהחיים בקרב הזקנים בשתי הקבוצות של בתי האבות לפני שהעבירה את ההתערבות ולאחר שהפעילה את ההתערבות .זאת, משום שייתכן ששביעות הרצון מהחיים בקבוצת הביקורת הייתה נמוכה כבר בתחילת המחקר משל הזקנים בבתי האבות שקיבלו את ההתערבות (אולי מכיוון שההנהלה אינה מעוניינת ברווחתם ,ולכן גם לא מיהרה להשתתף במחקר כקבוצת התערבות). לכן ניתן לצפות שגם בסוף המחקר תהייה רמת שביעות הרצון שלהם נמוכה יותר משל מי שקיבלו את ההתערבות ,בלי קשר לעובדה שקבוצת המחקר קיבלה התערבות .משום כך ,ההשוואה נעשית רק בין הפער של 'לפני' (ההתערבות) ל'אחרי' ההתערבות ,פער המנטרל את ההבדלים בתחילת הדרך. עם זאת ,ניטרול ההבדלים בין המשתתפים בשתי הקבוצות בתחילת הדרך ,אינו פותר בהכרח את כל הקשיים הנובעים מההבדלים שבין שתי הקבוצות .שיטה זו אינה מביאה בחשבון שייתכן שבקרב קבוצת הביקורת נצפתה נסיגה ברמת שביעות הרצון (עקב הנסיבות המיוחדות של בתי האבות בקבוצת הביקורת) עוד לפני ההשתתפות במחקר ,בעוד שבקבוצת המחקר לא הייתה צפויה נסיגה כזו (השפעת הבחירה הדיפרנציאלית ,סלקציה) .וכך ,במערך זה ייתכן שההבדלים שנראה
בעוצמת השינויים שחלו בשתי הקבוצות ,אינם משקפים רק את ההתערבות ,אלא גם גורמים סיבתיים אחרים (כגון היסטוריה שונה). הקצאה לקבוצות לפי זיווג לעיתים לחוקרים אין אפשרות להקצאה מקרית מלאה לקבוצת מחקר ולקבוצת ביקורת ועליהם להסתפק בשליטה חלקית על תהליך ההקצאה .במקרים כאלה מקובל להחליט על משתנים מרכזיים ,שיש לגביהם ידע מוקדם לכך שיכולה להיות להם השפעה גדולה על התוצאות ,ולנסות לוודא שמול כל משתתף בקבוצת המחקר יהיה משתתף בקבוצת הביקורת הדומה לו במאפיינים אלו .לעיתים מדובר בתהליך פשוט של זיווג על סמך משתנה אחד .לדוגמה ,במחקר שבחן את ההשפעה של שני מכשירים מיוחדים שפותחו לטיפול בדום נשימה ( )apneaאצל ילדים ,החוקרים הפנו ילד לאחת משתי קבוצות המחקר ובמקביל ילד הדומה לו בגיל לקבוצת הביקורת ( .)Huang, Hsu, Guilleminault, & Chuang, 2019במקרים אחרים תהליך הזיווג עשוי להיות מורכב יותר ולכלול מאפיינים רבים יותר לזיווג .התקשינו למצוא בספרות המחקרית דוגמאות שבהן תהליכי ההקצאה הראשונית לקבוצת המחקר והביקורת הסתמכו על זיווג .לעומת זאת ,ניתן למצוא דוגמאות רבות של התאמה וזיווג בדיעבד ,כשקבוצת המחקר כבר ידועה. התאמה וזיווג בדיעבד ()Matching לעיתים ,קבוצת המחקר מוגדרת מראש ואנו רוצים לדעת אם שייכות לקבוצה זו היא האחראית (הגורם הסיבתי) לתוצאות מסוימות .לדוגמה ,אנו מבקשים לדעת אם שהות במשפחת אומנה ,מגורים במקום מסוים או השתתפות במסגרת לימודים מסוימת הם האחראים לתוצאות שיתקבלו בהמשך כגון רמת השכלה ,השתתפות במעשים עבריינים או תחושת סיפוק בחיים .מטרתנו במערך המחקר היא למצוא בעבור המשתתפים בקבוצות מחקר אלו אנשים אחרים ,ששונים במאפיינים אלו (לא שהו במשפחת אומנה ,לא גרו במקום זה וכדומה) ,אך דומים בכל המאפיינים האחרים .אם נצליח למצוא משתתפים בקבוצה הביקורת שהם דומים לחלוטין למי שבקבוצת המחקר ,מלבד הגורם שאנו רוצים לבחון את השפעותיו ,הרי נגיע למערך מחקר יעיל. דרך אפשרית היא לחפש קבוצה הדומה ככל האפשר לקבוצת המחקר ,ושונה ממנה רק (או כמעט ורק) במשתנה הבלתי תלוי שאת השפעתו רוצים לבדוק. לדוגמה ,כדי לבחון את ההשפעות של הוצאת ילד מבית הוריו ,בחרה החוקרת כקבוצת ביקורת ילדים שהגיעו לוועדות תכנון טיפול לשם דיון על הוצאתם מהבית והוחלט שלא יוצאו מהבית .החוקרת הצביעה על כך שקבוצת הביקורת הייתה דומה במאפיינים רבים לקבוצת המחקר ,מלבד שיעור גבוה יותר של פגיעות פסיכולוגיות בקרב מי שהוצאו מהבית .בהמשך ,בחרה החוקרת כקבוצת ביקורת נוספת את הילדים ש אומנם הוחלט להוציאם מבית הוריהם ,אך מסיבות טכניות שונות החלטה זו לא יושמה וילדים אלו נותרו בבית הוריהם .לדעת החוקרת ,קבוצה זו דומה ככל שניתן לילדים בקבוצת המחקר שהוצאו מבית הוריהם (.)Davidson-Arad, 2005 החוקרת מדווחת שמעקב מחקרי הצביע על כך שמצבם של מי שהוצאו מביתם היה טוב יותר מאשר של קבוצת הביקורת של מי שהוחלט להוציאם אך הם לא הוצאו.
עקב העובדה שלא ניתן היה לערוך מחקר במערך ניסויי ,אלא רק ניסויי למחצה, ומתוך הבנה שלמרות הדמיון בין קבוצת המחקר לקבוצת הביקורת ,לא ניתן להגיע למסקנה שההבדל היחיד בין הקבוצות הוא עצם ההוצאה מהבית ,יש לנקוט משנה זהירות בהסקת מסקנות סיבתיות על בסיס קבוצת ביקורת זו. בדוגמה אחרת ,קבוצת חוקרים בארצות הברית רצתה לבחון אם תוכנית שפיתחו כדי לסייע למשפחות של יוצאי צבא לטפל בבן משפחתם הפצוע ,תורמת לשיפור תוצאות הטיפול בפצוע ,כגון הפחתת מספר ביקורי החירום בחדרי מיון ( .)Van Houtven et al., 2019בקבוצת המחקר השתתפו פצועים שמשפחתם התקבלה לתוכנית והם זכו לסיוע ,וקבוצת הביקורת הייתה של פצועים שמשפחותיהם פנו לקבלת הסיוע אך נדחו ,בעיקר מסיבות אדמיניסטרטיביות של חוסר זכאות (לדוגמה ,אם הפציעה לא הייתה במסגרת שירות פעיל) .החוקרים הניחו כי קבוצת ביקורת זו דומה במאפייניה לקבוצת המחקר של מי שקיבלו את הסיוע, ולכן יש מקום להשוואה .ממצאי המחקר באשר לתוצאות לאחר הטיפול הראו שלא היו הבדלים בין הקבוצות במספר הפניות לחדרי מיון ,אך קבוצת המחקר קיבלה טיפולים רפואיים אחרים רבים יותר במידה משמעותית מאשר קבוצת הביקורת. החוקרים חשבו שתוצאה זו מראה שהתוכנית מגבירה את הנגישות של הפצועים ובני משפחותיהם לטיפול רפואי .גם כאן יש להיזהר מהסקה חד משמעית שהּוכחה ההשערה הסיבתית באשר להשפעת תוכנית הסיוע. זיווג על פי מידת ההתאמה ()Propensity Score Matching, PSM דרך אחרת ליצירת קבוצת ביקורת היא לנסות למצוא לכל משתתף בקבוצת המחקר בן-זוג הדומה לו ,בתהליך התאמה ,או זיווג ( .)matchingיש שיטות זיווג שהן אינטואיטיביות יותר ופורמליות פחות ,ובהן אנו מחפשים לכל משתתף במחקר מישהו הדומה לו במספר מאפיינים מצומצם ומקצים אותו לקבוצת הביקורת (כגון מין, גיל ,השכלה) .לדוגמה ,במחקר על השפעות של שימוש באופייטים לשיכוך כאבים כרוניים על תפקודן המיני של נשים ,החוקרים יזווגו בעבור כל חולה שקיבלה אופייטים לשיכוך כאבים (קבוצת המחקר) חולה אחרת הדומה לה בגיל ובמאפייני בעיית הכאב שלה לקבוצת הביקורת. במשך השנים פותחו שיטות סטטיסטיות שונות כדי להביא לזיווגים יעילים ככל האפשר .קבוצה אחת של שיטות מכונה 'זיווג על פי מידת ההתאמה' Propensity ) .Score Matching (PSMנניח שהאחראי במשרד הרווחה על שיקום אסירים מבקש לבחון האם תוכנית השיקום של אסירים בקהילה אומנם הביאה לתוצאות טובות יותר (למשל ,פחות מעורבות בעבריינות ,רכישת השכלה וכדומה) מאלו שהיו מתקבלות אילו לא השתתפו בתוכנית .מטרתו תהייה למצוא קבוצת ביקורת מתאימה לאסירים לשעבר שהשתתפו בתוכנית השיקום .ברור לחוקר ,שאם ישווה בין אסירים שהשתתפו בתוכנית לאסירים שלא השתתפו בתוכנית הוא עלול להשוות 'מין בשאינו מינו' ,משום שלאסירים שהשתתפו בתוכנית יש מאפיינים המייחדים אותם מכלל
האסירים .עליו למצוא לכן דרך להתאים למי שהשתתף בתוכנית אסיר אחר הדומה לו בכל מלבד בהשתתפות בתוכנית. תהליך ההתאמה ב PSM -מבוסס על הצעדים הבאים .בשלב הראשון נשאלת השאלה – מה מבחין בין האסירים שהשתתפו בתוכנית השיקום ובין שאר האסירים לשעבר .בניתוח הסטטיסטי כל משתני הרקע הידועים על האסירים הם המשתנים הבלתי תלויים ,והמשתנה \"האסיר השתתף בתוכנית השיקום\" (כן/לא) ,הוא המשתנה התלוי .תוצאות הניתוח היא משוואה שבה נכללים כל משתני הרקע שהשתתפו בניתוח ולצידם המשקל שיש להם ביכולת להבחין בין שתי הקבוצות (כלומר עד כמה כל אחד ממשתני הרקע מנבא את הסיכוי להשתתף או לא להשתתף בתוכנית השיקום) .וכך ,אם אסירים שהשתתפו בשיקום שונים מאוד ברמת ההשכלה שלהם מאלה שלא השתתפו בתוכנית ,הרי להשכלה יהיה משקל רב בנוסחה זו המבחינה בשתי הקבוצות .מנגד ,אם מספר השנים בכלא אינו מבחין בין שתי הקבוצות ,למשתנה זה יהיה משקל נמוך בנוסחה .כעת אנו מחשבים ציון באמצעות נוסחה זו לכל האסירים לשעבר (מי שהשתתפו ומי שלא השתתפו בתוכנית השיקום). ציון זה מכונה ציון הנטייה (להשתייך לקבוצת המחקר).Propensity Score - כמובן שהאסירים שהשתתפו בקבוצת השיקום יקבלו ציונים גבוהים יותר מאשר מי שלא השתתפו בקבוצה זו ,משום שהנוסחה נקבעה כדי להבחין באופן המיטבי בין שתי הקבוצות .עם זאת ,לא כל המשתתפים בקבוצת השיקום יקבלו אותו ציון .חלקם 'אופייניים' יותר לקבוצת השיקום ,וחלקם פחות .בדומה ,גם האסירים שלא השתתפו בקבוצת השיקום מקבלים ציונים שונים ,בהתאם למידת הדמיון שלהם לקבוצת המשתתפים בתוכנית השיקום .לדוגמה ,ייתכן שאסיר שהתאים לתוכנית השיקום ואף הוזמן אליה ,לא השתתף בתוכנית עקב נסיבות מקריות .הציון שיקבל על פי הנוסחה יהיה גבוה ודומה לזה של אסירים לשעבר שהשתתפו בתוכנית. השלב הבא הוא שלב הזיווג .אנו מחפשים לכל אסיר שהשתתף בקבוצת השיקום אסיר לשעבר אשר 'ציון הנטייה' שלו דומה לו ביותר .בכך אנו מזווגים כל משתתף בקבוצת המחקר למשתתף בקבוצת הביקורת הדומה לו ביותר ,על סמך המאפיינים הידועים לנו ושהוכנסו לנוסחה .תהליך זה אינו יכול לזווג על סמך מאפיינים שלא ידועים לנו ושלא נכנסו לנוסחה ,ובכך כמובן טמונה הסכנה לתוקף הפנימי .אם גורם מרכזי שהבחין בין שתי הקבוצות הוא תמיכת בת הזוג ,וגורם זה לא הובא בחשבון על ידנו בעת תהליך הזיווג ,ייתכן שחלק משמעותי מההבדלים בתוצאות נובע מתמיכת בת הזוג ,ולא מתוכנית השיקום( .למתעניינים בפרטים נוספים על שיטה זו מומלץ לעיין ב.)Guo & Fraser, 2010 - מקרה-בקרה ()Case-Control במחקרים בתחום הרפואה ובריאות הציבור נעשה לעיתים קרובות שימוש בשיטות דומות של זיווג .זאת ,כאשר ידוע לנו שלמשתתף מסוים יש בעיה רפואית (הוא מהווה את 'המקרה' )case ,ואנו מחפשים עבורו משתתף הדומה לו במידה הרבה ביותר ,מלבד העובדה שאין לו בעיה רפואית זו (והוא משמש ביקורת- .)controlנהוג לכנות מערכים מסוג זה .Case-Controlלדוגמה ,בשנת 2016 הייתה באנגליה התפרצות של הרעלת מזון ( .)E. Coliכדי להתחקות אחר המקור
להתפרצות זו זיהו החוקרים מקומות שבהם הגישו סלט ושם הופיעו מקרים של מחלה (זה היה ה .)caseלכל מקום שזוהה ,מצאו החוקרים בעזרת Google ,Mapsשלושה מקומות קרובים שבהם מגישים סלט ,אך בהם לא זוהו מקרים של התפרצות המחלה .מקומות אלו היוו את קבוצת הבקרה בעבור כל אחד מהמקומות שבהם זוהתה הרעלת מזון .ההשערה הייתה שהמקור לסלט הנגוע הוא ספק מסוים. במסגרת הבדיקה נשאל כל אחד מהמקומות ,הן אלו שבהם התפרצה המחלה והן המקומות שהיוו ביקורת ,מה המקור לירקות של הסלט שהגישו (לעיתים עבודת הבלשות התחקתה אחר עקבות של ספקי משנה אחדים עד שהגיעו למקור). לסקרנים באשר לתוצאות ,בניתוח נמצא שהסיכוי שמקום הארחה שקנה מוצרים מהיצרן 'החשוד' יגיש סלט שגרם למחלה הוא פי 7.7מהסיכוי של מקום שקנה את המוצרים מיצרנים אחרים ( .)Gobin et al., 2018המסקנה הייתה שנם הוכח שהספק החשוד הוא אחראי להרעלת המזון. ^^##436מחקרי אורך לבחינת השערה סיבתית אנו נדון בהרחבה במערכי מחקר אורכיים בהמשך ,וכאן נבקש רק להדגיש בקצרה שני מערכים שנועדו להתמודד עם שאלות סיבתיות. סדרות עתיות עם הפרעה )(Interrupted Time-Series קבוצה זו של מערכים דמויי-ניסוי מורכבת ממערכי אורך שבהם אין שתי קבוצות כי אם קבוצת המחקר משמשת גם כקבוצת הביקורת .במערך זה ,נערכות בקרב המשתתפים במחקר מספר מדידות על המשתנה התלוי ,עוד לפני שהמשתנה הבלתי תלוי (הגורם הסיבתי ,ההתערבות) הופעל .בשלב זה ,הקבוצה היא קבוצת ביקורת .בהמשך ,מופעל המשתנה הבלתי תלוי ,ואז נערכות מדידות נוספות על המשתנה התלוי .בשלב זה ,הקבוצה היא קבוצת המחקר .למערך זה קוראים Interrupted time seriesמשום שההתערבות 'מפריעה' לרצף של המערך האורכי. במערך זה ,ניתן לזהות דפוס של המשתנה התלוי שלפני הפעלת ההתערבות (זמן הביקורת) ולהשוות אותו עם הדפוס שאחרי הפעלת ההתערבות (לאחר 'ההפרעה'). את ההבדלים בין הדפוסים משייכים להכנסת הגורם הסיבתי. במערכים אלו משתמשים פעמים רבות כשמפעילים התערבות רחבת היקף ,כמו שינוי בחקיקה או במדיניות ,ומבקשים לבחון את השלכותיה .לדוגמה ,בקנדה הייתה דאגה ציבורית ממה שנראה כהיקף בלתי סביר של מתן תרופות פסיכיאטריות אנטי פסיכוטיות ( )antipsychotic drugsלזקנים בבתי אבות .בעקבות סדרת כתבות בעיתונים הוחלט לפרסם את שיעור מתן התרופות הפסיכיאטריות בכל אחד מבתי האבות .שאלת המחקר הייתה האם יש לחשיפת המידע לציבור ( Public )Reportingהשפעה על שיעור מתן התרופות .במערך המחקר ,נבחנו השיעורים של מתן התרופות בשנים שקדמו לכתבות בעיתון ולהכנסת חובת הפרסום והושוו לתקופה שלאחר פרסום הכתבות והכנסת השינוי בחובת הדיווח והפרסום על מתן התרופות .מהממצאים עלה שניתן היה לראות ירידה עקבית ולאורך זמן במתן תרופות אלו שהחלה מיד לאחר פרסום הכתבות .אולם ,לא ניתן לראות שינוי במגמת
ירידה זו עם הכנסת השינוי במדיניות של פרסום שיעורי מתן התרופות ( Ivers, .)Taljaard, Giannakeas, Reis, Williams, & Bronskill, 2019 סוג זה של מערך אינו מאפשר לענות באופן מלא על סכנות לתוקף כמו היסטוריה .כך למשל ,ייתכן שבתקופה זו התרחשו אירועים אחרים ,כגון מגפת סמים בארצות הברית ,שהם האחראים לשינויים לאורך זמן ,ולאו דווקא הכתבות בנושא או השינוי במדיניות .ובכל זאת ,מערכים אלו נחשבים יעילים בבדיקת ההשפעה של שינויים הנעשים בהיקף נרחב .אם בעקבות חקיקה על איסור עישון במקומות ציבוריים ניתן לראות ירידה משמעותית במספר המקרים של מחלת הסרטן עקב עישון פאסיבי ,המסקנה שהחקיקה עזרה להקטנת ממדי המחלה היא סבירה .ככל שהממצאים בתקופה שלפני הפעלת ההתערבות היו עקביים ,וככל שהממצאים שבתקופה שאחרי ההתערבות היו עקביים ושונים במידה גדולה יותר מהממצאים שבתקופה שלפני ההתערבות ,העדות לכך שההתערבות הייתה גורם סיבתי לשינוי היא חזקה ומשכנעת יותר. סדרות עתיות צולבות ()cross-lagged panel design אלו הם מערכי מחקר מורכבים שמטרתם המרכזית היא לבחון האם למשתנה א' יש השפעה סיבתית על משתנה ב' או אולי כיוון הסיבתיות הוא הפוך ומשתנה ב' הוא גורם סיבתי למשתנה א' .במערך זה ,שני המשתנים נמדדים בה-בעת בשתי נקודות זמן שונות לפחות (לעיתים הם נמדדים ביותר משתי נקודות זמן) .המערך נקרא צולב מכיוון שנערכת בדיקה צולבת בין שני המשתנים בשתי נקודות הזמן :נבחן המתאם בין משתנה א' ,כפי שנמדד בנקודת הזמן הראשונה ,ובין משתנה ב' ,כפי שנמדד בנקודת הזמן השנייה .בדומה ,נבחן המתאם בין משתנה ב' ,כפי שנמדד בנקודת הזמן הראשונה ,למשתנה א' ,כפי שנמדד בנקודת הזמן השנייה .ההשוואה בין שני המתאמים עשויה ללמד אותנו מי המשתנה הסיבתי .הניתוח הסטטיסטי הוא מורכב, באופן פשטני ניתן לומר כי אם הקשר שבין משתנה א' בנקודת הזמן הראשונה למשתנה ב' בנקודת הזמן השנייה הוא חזק יותר מהקשר שבין המשתנה ב' כפי שנמדד בנקודת הזמן הראשונה למשתנה א' כפי שנמדד בנקודת הזמן השנייה ,יש בכך עדות לכך שמשתנה א' הוא הגורם הסיבתי למשתנה ב' ,ולא להיפך. אפשר להתבונן במחקר שבו ההשערות היו שאקלים בית ספרי ואלימות בין תלמידים משפיעים על הישגים לימודיים ( & Benbenishty, Astor, Roziner, .)Warbel, 2016החוקרים ניתחו נתונים על אקלים בית ספרי ,אלימות והישגים
לימודיים שהתקבלו מאותם בתי ספר באמצעות שלושה סקרים שנערכו בהפרש של שנתיים זה מזה. איור 10.1 דוגמה לממצאים במחקר עם מערך של סדרות עתיות צולבות cross-lagged panel האיור מציג את תמצית הממצאים שהתקבלו בניתוח הסטטיסטי .נדגיש ,זהו רק תיאור חלקי של הממצאים ושל פרשנותם ונועד להדגים את הרעיונות המרכזיים במערכים אלו .הקווים המחברים בין העיגולים מציינים את הקשרים שבין המשתנים. הקווים המקווקוים המחברים בין העיגולים מציינים שמקדם הקשר בין שני העיגולים הוא נמוך .מהתרשים ניתן לראות שהקווים המחברים בין אלימות בנקודת הזמן הראשונה ( )T1להישגים בנקודת הזמן השנייה ( )T2מראים שהקשר הוא חלש .כך גם הקשר בין אלימות בנקודת הזמן השנייה ( )T2להישגים בנקודת הזמן השלישית ( .)T3לעומת זאת ,ניתן לראות שהישגים בנקודת הזמן הראשונה קשורים לאלימות בנקודת הזמן השנייה וכך גם ההישגים בנקודת הזמן השנייה קשורים לאלימות בנקודת הזמן השלישית .דפוס זה מרמז על כך שבעוד שאין סימנים שאלימות משפיעה על הישגים ,יש סימנים לכך שההישגים בלימודים הם המשפיעים על רמות האלימות בבית הספר .בדומה ,ניתן לראות שאין עדות שאקלים משפיע על הישגים, אך יש סימנים לכך שהישגים בנקודת זמן אחת משפיעים על כך שהאקלים יהיה טוב יותר בנקודת הזמן השנייה .ממצאים אלו היו בניגוד להשערות החוקרים ,וחייבו אותם להציע דרכי חשיבה חדשות על היחסים הסיבתיים בין משתני המחקר. בחלק זה דנו במערכי מחקר שנועדו לענות על השערות סיבתיות .בנוסף, הקדשנו בהמשך פרק נפרד לעיסוק בהשערות סיבתיות באשר לתוצאות התערבויות (פרק .)11הסיבה היא החשיבות ההולכת וגוברת הניתנת בתחומים כמו חינוך, עבודה סוציאלית ,קרימינולוגיה וסיעוד למחקרים הבוחנים עד כמה התערבויות הן יעילות בהשגת תוצאות רצויות ( .)Evidence Based Programsבחלק הבא של הפרק הנוכחי נעסוק במערכי מחקר המתמודדים עם שאלות של קשר. ^^##437מערכי מחקר מתאמיים לבחינת שאלות תיאוריות והשערות על קשר בפרקים קודמים הבחנו בין שאלות תיאוריות להשערות על קשר בין משתנים. בשאלות תיאוריות אנו יכולים לשאול 'איזה חלק של האוכלוסייה מחוסן מפני מחלת
החצבת?' 'מה שיעור תלמידי התיכון שלהם מחשבות אובדניות?' 'מה שיעור החזרה לשימוש בסמים בקרב בוגרי תוכניות התערבות לגמילה מסמים?' באופן מעשי, מחקרים המציגים שאלות תיאוריות מעין אלו נוהגים לשלב השערות ושאלות גם על קשר בין תופעות אלו למאפיינים אחרים כגון 'האם שיעורי החיסון מפני חצבת שונים בין יהודים לערבים? בין חילונים ,לדתיים ולחרדים?'' ,האם יש קשר בין מחשבות אובדניות של תלמידי תיכון לבין הגיל שלהם? למינם? לנטייתם המינית?' וכן' ,האם בוגרי תוכניות התערבות לגמילה מסמים משכילים חוזרים פחות לשימוש בסמים מאשר מי שאינם משכילים?' משום ששאלות תיאוריות ושאלות של קשר נבחנות באותם מחקרים ,נדון במשולב במערכי מחקר העוסקים בשאלות תיאוריות ובהשערות על קשר. ^^##438מערכים מתאמיים ()correlational design במערכים מתאמיים החוקרים בוחנים השערות על קשרים בין משתנים ועל הבדלים בין קבוצות באמצעות איסוף נתונים על כל אחד ממשתני המחקר בקרב כלל משתתפי המחקר בנקודת זמן אחת .במחקרים אלה החוקרים אינם מתפעלים משתנים אלא צופים בהם ומודדים אותם בלבד ,לכן הם נקראים גם מחקרים תצפיתיים ( .)observational researchיש להדגיש שלעיתים קרובות המדידה אינה נעשית באמצעות תצפית ,אך הביטוי מחקר תצפיתי נועד לבדל אותו ממחקר ניסויי שבו החוקר מתפעל משתנה. אחד השימושים המקובלים ביותר במערך זה הוא בסקרים .במחקרים אלו עשה שימוש בדיווח עצמי על סדרה של משתנים .עורכי הסקר יכולים לבדוק קשרים בין דיווחים שונים שהתקבלו מאותם משתתפים .לדוגמה ,בחינת הקשר בין שביעות הרצון שלהם ממצבם הכלכלי למפלגה שבעבורה יצביעו בבחירות הקרובות .המערך מאפשר גם להשוות בין קבוצות של משיבים באותו הסקר .לדוגמה ,השוואה של מצבם הכלכלי של מצביעי ש\"ס למצבם הכלכלי של מצביעי מר\"צ. דוגמה נוספת למערך מחקר מתאמי הוא ניתוח של קבוצת תיקים המכילים נתונים .כך למשל ,בוחנים חוקרים את התיקים הרפואיים של מאושפזים בבית החולים ובוחנים את הקשרים בין המאפיינים השונים שלהם וכן משווים בין קבוצות שונות של מאושפזים .כך לדוגמה בחנו חוקרים תיעוד של תלמידים לתואר שני בסיעוד שהתנהל בצורה מקוונת ברשת ) .)Serembus, & Riccio, 2019הם אספו מידע על שורה ארוכה של משתנים לכל משתתף ,ובחנו את המתאמים בין מדדים שהצביעו על מעורבות בלימודים ( )engagementולבין הישגיהם בלימודים ,כולל ציונים והגשת עבודות בזמן .המערך המתאמי אפשר להם גם לבחון את ההבדלים בהישגים בין נשים לגברים ,וכן לבדוק את הקשר שבין גיל הסטודנט להישגיו בתוכנית. במחקרים מתאמיים שבמרכזם עומדת ההשוואה בין קבוצות ,עשויים החוקרים לדגום דגימה שכבתית כדי להבטיח ייצוגיות של הקבוצות שבהן יש להם עניין. לדוגמה ,חוקרים המבקשים להשוות השתלבות בעבודה של בוגרי אוניברסיטאות מול בוגרי מכללות יערכו דגימה שכבתית של שתי הקבוצות וישוו ביניהן ברמת ההשתלבות בעבודה .ובדוגמה אחרת ,במחקר שביקש לבחון הבדלים בין גברים
לנשים ברמת החרדה בעקבות אירוע לבבי ,השוו החוקרים בין נשים לגברים שאושפזו במחלקה הקרדיולוגית בבית החולים בסדרה של משתנים ובהם חרדה, דיכאון וכן מאפיינים רפואיים שהופיעו ברשומות בית החולים ( & AbuRuz, .)MasaDeh, 2017 נדגים את המערך המתאמי באמצעות לוח המציג את הממצאים שנאספו על ארבעה משתתפים במחקר פיקטיבי על הקשר בין עמדות והתנהגויות פוליטיות ובין דפוסי הצבעה .כפי שניתן לראות ,בעבור כל משתתף נאסף מידע על כל משתני המחקר. לוח 10.1 לוח המדגים ממצאי סקר ארץ עמדה לגבי התנהגות -התנהגות גיל משתתף מין נסיגה השתתפות -הצבעה לידה דויד ז דינה נ מהשטחים 1בהפגנות עבור וואליד ז דניאלה נ פוליטיות 2מפלגה מפלגה א 5 25ישראל 1 מפלגה א 2 33רוסיה 2 מפלגה ב 1 44ישראל 10 מפלגה ג 3 26ישראל 7 = 1 1נגד = 10בעד = 1 2אף פעם = 5לעיתים תכופות במקביל לבחינת השערות על קשרים בין משתנים ,מערך מחקר מסוג זה מאפשר לענות על שאלות של השוואה בין קבוצות .בדוגמה שלמעלה אפשר לבחון הבדלים בין קבוצות (לפי מין ,לפי ארץ לידה) ,וכן קשרים בין משתנים ,כגון בין עמדה כלפי נסיגה לבין ההשתתפות בהפגנות .לעיתים קרובות מערך מחקר זה מאפשר להשוות בין קבוצות 'בדיעבד' – כלומר ,החלוקה לקבוצות אינה מתבצעת בעת הדגימה (כמו בדוגמה של דגימה שכבתית) אלא לאחר איסוף הנתונים .למשל, להשוות בין מאפייני הרקע של מצביעי מפלגה א' למצביעי מפלגה ב' .מכיוון שלא היה ידוע מראש מי מצביע לאיזו מפלגה ,ההשוואה בין הקבוצות נעשית בדיעבד ,לאחר שקיבלנו את תשובות המשתתפים באשר לאיזו מפלגה הצביעו. ישנן מספר סוגיות הרלוונטיות במיוחד למערכים מתאמיים. משתנים המגיעים מאותו המקור ( )same sourceלעומת משתנים המתקבלים ממספר מקורות במערכי מחקר מתאמיים אוספים החוקרים את כל המידע בפרק זמן אחד. אולם ,חשוב לתת על הדעת על כך שאיסוף נתונים באותו פרק זמן אין משמעותו איסוף נתונים ממקור יחיד .למחקרים המבוססים על מקור יחיד של נתונים ,כגון
סידרה של שאלונים למילוי עצמי ,יש מגבלה משמעותית משום שלא ברור אם המקור למתאמים שנמצאו הוא הקשר האמיתי בין משתנים או אולי משום שכל הנתונים מגיעים מאותו המקור .לדוגמה ,כשתלמיד עונה על שאלון למילוי עצמי ומתבקש להשיב על סדרה של שאלות על יחסו ללימודים ,צפוי שהתשובות על השאלות השונות יהיו מתואמות זו עם זו וכן עם הערכת התלמיד את הישגיו האקדמיים .זאת, משום שמצופה שהתלמיד יענה באופן עקבי על סדרת השאלות ותלמיד המתאר יחס רציני ללימודים עשוי גם לתאר הישגים המשקפים את יחסו הרציני .במקרה מעין זה לא ברור אם הקשר שאנו רואים נובע מקשר אמיתי בין התופעות ,או משום כך שהתלמיד המספק את המידע מנסה לשמור על עקביות. המחקר על הקשר בין היחס ללימודים ובין ההישגים הופך למשכנע יותר אם המדידה של הישגי התלמיד תיעשה גם באמצעי אחר ובלתי תלוי בעמדות התלמידים (למשל ,ציון הניתן על ידי מורים על מבחני הישגים ,או הערכת מורה את הישגי התלמיד) .במערך מעין זה ,מתאם בין שני משתנים הנמדדים באמצעים שונים משכנע יותר ממתאם בין שני משתנים שנמדדו באותו האמצעי. שליטה סטטיסטית ( )statistical controlבמערכים מתאמיים כפי שראינו בדיון על מערכי מחקר ניסויים ,כדי להגיע למסקנות סיבתיות תקפות ,חוקרים שולטים על הדרך שבה מתנהל המחקר באמצעות הכלים של תפעול המשתנה הבלתי תלוי והקצאה מקרית לקבוצת מחקר ולקבוצת ביקורת .לסוג כזה של שליטה ניתן לקרוא שליטה באמצעות המערך ( .)design controlלעומת זאת, במערכי מחקר מתאמיים השליטה של החוקרים על מערך המחקר מצומצמת בהרבה .כדי לענות על שאלות מחקר מורכבות החוקרים משתמשים בשליטה סטטיסטית ( .)statistical controlבחלקים הבאים נבהיר נושא זה. נתבונן בדוגמה שבה חוקר שואף להראות שבני נוער בסיכון המשתתפים בתוכנית חינוכית המופעלת על ידי שוטרים משנים את עמדותיהם לגבי המשטרה. החוקר מתכוון למדוד עמדות של בני הנוער כלפי המשטרה לפני התוכנית ולאחריה ולבדוק עד כמה העמדות של מי שהשתתפו בתוכנית הפכו לחיוביות יותר .אילו יכול היה ,החוקר היה מעדיף לשלוט בדרך ביצוע המחקר כך שיוכל לענות על השאלה הסיבתית באמצעות הקצאה מקרית לקבוצת מחקר ולקבוצת ביקורת ובדרך זו להגיע למסקנה תקפה באשר להשפעת התוכנית .אם הקצאה מקרית לא הייתה אפשרית, החוקר היה מבקש לתכנן מערך מחקר דמוי-ניסוי ,שבו היה יוצר קבוצת ביקורת דומה ככל שניתן לקבוצת המחקר המקבלת את התוכנית החינוכית .אך מה באשר לחוקר שהמערך כבר נקבע מראש ואין לו שליטה עליו? לדוגמה ,חניכים שכבר התקבלו לתוכנית החינוכית ,ונקבעו מספר פנימיות שחניכיהם יהוו קבוצת ביקורת? כאן החוקר עומד בפני מערך מחקר מתאמי המשווה בין שתי קבוצות :קבוצת החניכים המשתתפת בתוכנית החינוכית וקבוצה אחרת של חניכים .החוקר יכול להשוות בין עמדותיהן של שתי הקבוצות לפני סיום התוכנית החינוכית ומיד לאחריה,
ולקבוע האם קבוצת המשתתפים בתוכנית בשיתוף המשטרה מפגינים שינוי חיובי יותר בעמדות כלפי המשטרה מאשר החניכים שלא השתתפו. החוקר ער לכך שאילו רצה להגיע למסקנה סיבתית ,היה נתקל באיומים לתוקף פנימי ,וביניהם האיום המרכזי של טענת הסלקציה הדיפרנציאלית .כלומר ,הגורם האפשרי לשינוי העמדות הגדול יותר בקרב המשתפים הוא העמדה הראשונית של המשתתפים בנוגע לרשויות החוק .ובאופן מפורט יותר ,ייתכן שהשינוי שחל בעקבות ההשתתפות בהתערבות ,משקף את העובדה שלבני הנוער שבחרו להשתתף בתוכנית הייתה מראש עמדה חיובית כלפי המשטרה ועמדה זו היא שגרמה לשינויים משמעותיים בעמדותיהם .כמו כן העובדה שעמדותיהם בסוף התהליך הן חיוביות, אינה נובעת מההשתתפות ,אלא מהעמדות המוקדמות .במקרה זה ניתן לומר שהעמדות המוקדמות הן 'משתנה מתערב' ,המקשה עלינו לראות את הקשר שבין ההתערבות ובין העמדות שנצפו בסופה של ההתערבות. בתנאים שבהם לחוקר אין שליטה על המערך ,שליטה שתאפשר לו 'לנטרל' את האפשרות שהמשתנה המתערב של עמדות מוקדמות כלפי המשטרה הוא זה שאחראי להבדלים בין מי שקיבלו התערבות למי שלא קיבלו (ולא ההתערבות עצמה) ,החוקר עשוי להחליט 'לשלוט' במשתנה המתערב באמצעים סטטיסטיים. מבלי להיכנס לדרך החישוב ,הרעיון הוא שאנו פועלים על ידי כך שאנו משווים בין קבוצות הדומות בערך שלהם במשתנה המתערב .כדי לפשט ,הבה נניח שניתן לחלק את בני הנוער לשתי קבוצות – בעלי עמדה חיובית מוקדמת כלפי המשטרה ובעלי עמדה שלילית .כדי 'לנטרל' את ההשפעה של העמדות המוקדמות ,החוקר עורך שתי השוואות במקביל – הראשונה ,האם יש הבדל בעמדות בסוף התהליך בין מי שהשתתפו בתוכנית למי שלא השתתפו רק בקרב קבוצת בני הנוער שהגיעו עם עמדות חיוביות ,והשנייה ,האם יש הבדל בעמדות בסוף התהליך בין מי שהשתתפו בתוכנית למי שלא השתתפו ,רק בקרב מי שהגיעו עם עמדות שליליות .היתרון בפיצול השאלה הוא שכעת ,כשאנו בוחנים הבדלים בין מי שהשתתף בתוכנית למי שלא השתתף בתוכנית ,ההשוואה נערכת בקרב בני נוער שלהם אותה עמדה מוקדמת כלפי משטרה .נניח שבשתי הקבוצות ,גם אלו שהגיעו עם עמדות חיוביות וגם אלו שהגיעו עם עמדות שליליות ,נמצא פער בין מי שהשתתפו בתוכנית ובין מי שלא השתתפו .במקרה זה ,הטענה ,שהתוצאה נובעת מכך שחניכים הגיעו לתוכנית עם עמדות שונות ומכאן נובעים ההבדלים בסוף התוכנית ,כבר לא תהייה תקפה ,כי אנו משווים רק בני נוער אשר מראש הייתה להם עמדה מוקדמת דומה .נבהיר עם זאת ,ששליטה זו על משתנה אחד אינה מהווה הוכחה תקפה לקשר סיבתי בין השתתפות בתוכנית לשינוי בעמדות ,שהרי ייתכן שיש גורמים נוספים שלא בדקנו, כמו אופי המפגשים עם המשטרה בעבר .אם טענה זו עולה ,חשוב להמשיך ולבדוק אותה באופן סטטיסטי (למשל ,על ידי שליטה סטטיסטית על המשתנה של מספר עברות קודמות) .ברור עם זאת ,שתמיד נהיה מוגבלים על ידי הנתונים שיש בידינו ואפשר שיהיו טענות אחרות שלא נוכל לבדוק .אלו הן מגבלות השליטה הסטטיסטית. חשוב לציין ,שייתכן שלאחר הפיצול לשתי קבוצות ,ההשוואה בין מי שהשתתפו בתוכנית למי שלא השתתפו תגלה שהפערים ביניהם נעלמו .במקרה זה ,נבין ש אומנם ,העמדות הקודמות (שאותן הצלחנו לנטרל באמצעות השליטה הסטטיסטית)
היו אחראיות להבדלים בין מי שהשתתפו בתוכנית למי שלא .כלומר ,באמצעות השליטה הסטטיסטית נוכל להגיע למסקנה חד משמעית שאין קשר סיבתי בין השתתפות בתוכנית לשינוי עמדות ,אך כאמור ,אם ההבדלים יישארו לאחר השליטה הסטטיסטית לא נוכל להגיע למסקנה החד משמעית ההפוכה ,שיש קשר סיבתי. נסכם חלק זה ונאמר ,שלשליטה סטטיסטית יש יתרונות רבים משום שהיא מאפשרת לנו לבחון מספר רב של השערות על משתנים מתערבים אפשריים ,כל עוד מדדנו אותם בתהליך איסוף הנתונים .עם זאת ,ברור שלשליטה סטטיסטית יש גם מגבלות .העיקרית שבהן היא שאיננו יכולים להיות בטוחים ש אומנם בדקנו את כל המשתנים המתערבים האפשריים .גם חוקרים ,שמראש חשבו על משתנים מתערבים רבים ,כללו אותם במחקרם ,שולטים עליהם באופן סטטיסטי וכך מנטרלים את השפעתם המתערבת ,ערים לעובדה שיש משתנים שלא נתנו עליהם את הדעת, שעלולים להתערב בקשר שבין המשתנה הבלתי תלוי לתלוי ובכך מעמידים בספק את הטענה שהקשר בין המשתנה התלוי לבלתי תלוי הוא קשר סיבתי .משום כך, חוקרים המשתמשים במערך מחקר מתאמי אינם נוהגים לטעון טענות סיבתיות ,גם כאשר הם מבצעים ניתוחים סטטיסטיים המאפשרים להם לנטרל משתנים מתערבים. ^^##439מערכי מחקר לבחינת השערות הקשורות לזמן בפרק קודם הצגנו דוגמאות להשערות הקשורות בזמן .אלו השערות שבהן המשתנה הבלתי תלוי הוא על ציר הזמן -גיל ,שנה ,משך הזמן שעבר מנקודת זמן מסוימת וכדומה .לדוגמא :האם ככל שהילדים שוהים זמן רב יותר בפנימייה ,הדימוי העצמי שלהם עולה? האם יש קשר בין משך הזמן שעבר מהטראומה ובין עוצמת הסימפטומים? האם מידת ההצלחה בהשקעות כלכליות רבה יותר ככל שיש ניסיון עשיר יותר בהשקעות? האם ככל שאסיר שוהה זמן רב יותר בכלא התנהגותו תוקפנית פחות? יש דרכים אחדות ומערכי מחקר כדי לענות על שאלות הקשורות בזמן. ^^##440מבט רטרוספקטיבי אנו יכולים לשאול אנשים על המצב בעבר .נניח שאנו רוצים לבחון כיצד התנהגות של אסיר קשורה למשך השהות שלו בכלא .ניתן לבקש מאיש מקצוע בכלא להעריך ,במבט לאחור ,מה היה אופייה של התנהגותו של אסיר בשלוש נקודות זמן: בעת כניסתו לכלא ,כעבור חצי שנה ולקראת השחרור .מערך זה של מבט רטרוספקטיבי נחשב כבעייתי מאוד משום שידוע שהזיכרון עלול לתעתע .במקרים רבים ,משתתפים לא זוכרים את העבר באופן מדויק ,ורבים נוטים לראות את העבר דרך המשקפיים של ההווה או לבנות 'נרטיב' (סיפור) המושפע אומנם מהעבר ,אך גם ממקורות אחרים .משום כך ,ההתייחסות למערך זה צריכה להיות חשדנית ,וניתן להתייחס אליו כתקפה רק אם שאלת המחקר משתנה ל' :כיצד המשתתף מתאר תופעות שהתרחשו בעבר'. עם זאת ,יש מצבים שבהם ניתן לערוך מחקר שיש לו נקודת מבט רטרוספקטיבית על נתונים שנאספו בעבר .כך למשל ,ניתן להשוות בין קבוצות של מי שסיימו תוכנית בוגר ולבחון ,בדיעבד ,השערות על ההבדלים במסלולי חיים בין אלו שלא המשיכו ללמוד לאלו שהמשיכו לתואר שני ולתואר שלישי .בהשערות אלו
המשתנים הבלתי תלויים עשויים לכלול מידע על העבר ,שמתועד באופן בלתי תלוי (ואינו תלוי בזיכרון של המשתתף) ,כמו השכלת הורים ,ציוני לימודים בתיכון ,מאפייני שירות צבאי וכדומה. ^^##441מערך מחקר רוחבי -חתך – cross sectional במערך זה אנו משווים בין משתתפים הנמצאים בנקודות שונות על ציר הזמן הרלוונטי למחקר .לדוגמה ,השוואה בין קבוצת אנשים אשר חוו טראומה לפני זמן קצר לעומת קבוצת אנשים אשר חוו טראומה לפני שנה .ובדוגמה אחרת ,בחינת כל האסירים השוהים באגף מסוים והשוואה ביניהם לפי משך הזמן שבו כל אחד מהם שוהה באגף .למערך מחקר רוחבי יש יתרון בכך שאפשר לבצע מחקר המקיף משכי זמן ארוכים תוך פרק זמן קצר .וכך ,אנו יכולים לבחון את כל האסירים השוהים בכלא ביום מסוים ,ולקבל רצף זמן של משך שהות בכלא ,מיום אחד בכלא ועד לעשרים שנה ויותר .כל זאת ,בתהליך מדידה המתבצע בתקופת זמן קצרה. החיסרון של דרך מדידה זו הוא שההבדלים בין האסירים השוהים תקופות שונות בכלא עשויים לנבוע ממקורות שונים ולאו דווקא ממשך זמן השהות ,שהוא נושא המחקר .למשל ,אם בעבר היה מקובל לכלוא אנשים שעישנו קנביס באופן מזדמן ,וכעת נכלאים רק מי שסוחרים בסמים ,הרי ההשוואה בין מי שהיו בכלא הרבה זמן לאלו שהם פחות זמן ,היא גם השוואה בין שתי קבוצות באוכלוסייה ('המשתמשים' ו'הסוחרים') השונות זו מזו בהיבטים רבים אחרים ,מלבד משך הזמן במאסר .מערך מחקר מעין זה עשוי לצייר תמונה ראשונית של הקשר בין משך הזמן ובין התופעה המעניינת אותנו ,כל עוד אנו ערים למגבלותיו. ^^##442מחקרי אורך ()longitudinal אם אנו מבקשים לצמצם את הגורמים ,נוסף למשך הזמן ,המשפיעים על המשתנה התלוי ,אנו עשויים לבחור באחד מהסוגים השונים של מחקרי האורך. המשותף למחקרים אלו שהם מבצעים מדידות חוזרות לאורך זמן .ההבדלים ביניהם נעוצים בעיקר בשאלה האם המדידה היא על אותם נבדקים בכל נקודות הזמן או שבנקודות הזמן השונות נמדדים משתתפים שונים. מערך מחקר אורכי ()panel study במערך זה ,החוקרים מלווים את אותם משתתפים לאורך זמן .לדוגמא :מודדים את רמות הדיכאון של ילד אשר הגיע לפנימייה ,מיד עם הגיעו ,ובהמשך ,כל שישה חודשים ,עד לסיום שהותו בפנימייה .כך ניתן לראות רצף של מדידות ולבחון שינוי לאורך זמן לכל אחד מהילדים .במערך זה ,ההשוואה המרכזית היא של הילד עם עצמו בכל נקודת זמן. נבחן מערך זה מול מערך חתך המודד בנקודת זמן אחת את רמת הדיכאון של כל אחד מהילדים בפנימייה ומחשב את הקשר בין משך הזמן שהילד שוהה בפנימייה ובין רמת הדיכאון שלו .שוו בנפשכם שבמשך השנים חלו שינויים משמעותיים באופי הילדים המגיעים לפנימייה .בעוד שבעבר הגיעו ילדים רבים עם בעיות דיכאון ,בשנים האחרונות יש נטייה לקבל ילדים עם בעיות של התנהגות מוחצנת ולא דיכאון .אם נעשה שימוש במחקר רוחבי ,נשווה ילדים שנמצאים בפנימייה זמן קצר (שהם ילדים עם סיכוי נמוך לחוות דיכאון) לילדים שנמצאים בפנימייה זמן רב (כלומר ,נכנסו
לפנימייה עוד בימים שהיה מקובל לקבל ילדים עם בעיות דיכאון) .בהשוואה זו אנו עלולים להגיע למסקנה שמי ששוהה זמן רב יותר בפנימייה נוטה לעלות ברמות הדיכאון .לעומת זאת ,אם נשתמש במערך אורכי ונעקוב אחר כל ילד הנכנס לפנימייה מיומו הראשון ,ההשוואה תהייה תמיד לילד זה עצמו ,ובכך 'ננטרל' את ההשפעה של רמת הדיכאון הראשונית שעמה הגיע ,ונזהה את השינויים שחלים עם השהות בפנימייה. כדי להימנע מחולשות של מערכים רוחביים ,חוקרים מעדיפים בדרך כלל מערכים אורכיים על מערכים רוחביים .אולם למערכי אורך יש מחיר .ראשית, המשאבים הנדרשים למדוד את אותו משתתף פעמים אחדות הם גדולים בהשוואה למשאבים הנדרשים למדידה במקביל של משתתפים אחדים ,ושנית ,משך הזמן הנדרש כדי להקיף פרקי זמן ארוכים גדול בהרבה במחקרי אורך בהשוואה למחקר חתך רוחבי .חוקר המבקש להשוות מצב של אסירים שנידונו למאסר רב-שנים בכלא והם בשנתם הראשונה לעומת מי שנמצאים בכלא עשרים שנה ויותר ,יצטרך להקדיש עשרות שנים למחקר אורך מעין זה .כמו כן ,במקרים רבים נוצרת בעיה אתית שכן קשה לשמור על אנונימיות של משתתף ולאחר מכן לאתרו שוב ושוב. קושי נוסף במערך אורכי ,שבו עוקבים אחר אותם המשתתפים במשך פרק זמן משמעותי ,נובע מהצורך להגיע לאותו המשתתף פעמים מספר לאורך זמן .במקרים רבים קשה לאתר את אותו המשתתף לאורך זמן ,וכן קשה לשכנעו להמשיך ולהשתתף במחקר .מחקרי אורך נתקלים לכן בבעיה משמעותית של נשירה של משתתפים שנטלו חלק בחלקים קודמים של המחקר אך אינם ממשיכים להיות חלק מהמחקר .נשירה זו מעוררות שאלות באשר להבדלים בין מי שניתן היה לאתרם שוב ושוב והם הסכימו להשתתף במחקר לאורך זמן ,ובין אלו 'שנעלמו' ולא ניתן היה לאתרם או שהעדיפו לא להשתתף במחקר לאחר שהשתתפו בו בתחילת הדרך. אם הנשירה מפוזרת באופן שווה בין קבוצות שונות שבמדגם ,ואינה קשורה באופן משמעותי למאפיין כלשהו של המשתתפים (נשירה מקרית) ,היא יוצרת קושי בכך שהיא מקטינה את המדגם ובכך מחלישה את עוצמתו ,נושא שעמדנו עליו בפרק שדן במדגם .אולם ,אם הנשירה היא דיפרנציאלית ,קרי יש קבוצות מסוימות במדגם שהנשירה בהן היא גדולה באופן חריג ,הרי אנו נתקלים בקושי להכליל את תוצאות המחקר לכלל האוכלוסייה ,שכן קבוצות שהנשירה בהן רבה יותר אינן מיוצגות בממצאי המחקר .זו סוגיית התוקף החיצוני ,שעליה נעמוד בהמשך ביתר פירוט ,וכאן נציין אותה בהקשר המיוחד של מחקרי אורך בלבד. לדוגמה ,במחקר שעקב אחרי בוגרי פנימיות חינוכיות ,עלה החשש שבקרב מי שקשה היה לאתרם ,או שבחרו שלא להשתתף בהמשך המחקר גם לאחר שנתנו את הסכמתם הראשונית ,היה שיעור גבוה במיוחד של חניכים ממוצא אתיופי (זעירא ובנבנישתי .)2008 ,מצב זה מפחית את התוקף החיצוני של המחקר משום שייתכן שהמחקר מתמקד בתת קבוצה של בוגרי הפנימיות בלבד ,אלו שאינם ממוצא
אתיופי ,ולא ניתן להכליל את ממצאיו לכלל החניכים ,שחלק גדול מהם נולדו באתיופיה ,או שהוריהם עלו מארץ זו. בדומה ,קשה יותר היה לאתר את המשתתפים הבלתי יציבים שעוברים ממקום עבודה אחד למשנהו וממקום מגורים אחד לאחר ,מאשר את המשתתפים היציבים שלא החליפו מקום מגורים ועבודה .כמו כן יש נטייה של אלו שהגיעו להישגים גבוהים להסכים ולהשתתף שוב ושוב במחקר אורך ,בהשוואה למי שחשים שאין להם במה להתגאות ,ויעדיפו להפסיק את השתתפותם במחקר ,כדי לא לענות לשאלות על מצבם. לכן ,חוקר המזהה נשירה משמעותית לאורך זמן ,צריך להכיר בעובדה שייתכן שמחקרו מתמקד רק בתת קבוצה מהאוכלוסייה שבה יש לו עניין .אחת הדרכים לעמוד על סוגיה זו ,ולו באופן חלקי ,היא לבדוק אם יש קשר בין הנכונות להשתתף במחקר לאורך זמן ובין מאפייני רקע הידועים לחוקר .כך לדוגמה ,יכול חוקר לבחון האם מי שידווחו על קשיים בחיי הנישואין בנקודת זמן אחת ייטו להשתתף פחות בהמשך המחקר על זוגיות ואינטימיות ,בהשוואה למי שידווחו על שביעות רצון רבה מחיי הנישואין. למרות הקשיים הכרוכים בביצוע מחקרי אורך ,ואולי דווקא בעטיים ,יש גופי מחקר גדולים ומדינות המשקיעים מאמץ רב במחקרי אורך רחבי-היקף הבוחנים מדגמים גדולים ולאורך זמן רב .לדוגמה ,במספר מדינות יש סקרי אורך ארוכי טווח: • –National Child Development Study- NCDSסקר בבריטניה המקיף 17,000איש מאנגליה ,סקוטלנד ווילס שכולם נולדו באותו השבוע בשנת .1958 • - National Longitudinal Survey of Youth - NLSYסקר בארצות הברית שבשנת 1979ערך את הראיונות הראשונים עם קרוב ל 13,000 -מרואיינים בגילים 22 – 14ומאז ראיין כ10,000 - משתתפים 27פעמים. • – The German Socio-Economic Panel – SOEPסקר בגרמניה שמאז 1984מראיין כ 30,000 -משתתפים כל שנה. סקר משקי הבית הבריטי ( )BHPSבוחן מדגם מייצג של 5,500משקי בית ובהם 10,300משתתפים ,החל מ 1991-ועד היום .כל המשתתפים מרואיינים כל שנה באמצעות סידרה של שאלונים מובנים ,על תחומי חיים שונים .כמקובל בסקרים מדינתיים מעין אלו ,הסקר מכיל שאלונים אחדים החוזרים על עצמם מדי שנה, ושאלונים אחרים הניתנים מדי פעם ,כך שניתן להרחיב את מעגל הנושאים הנכלל במחקר זה .הנתונים נאגרים במאגר מידע אשר נגיש לחוקרים בעולם כולו העומדים בכללים מסוימים. בשנת 2012החלה הלשכה המרכזית לסטטיקה בישראל לערוך מחקר אורך שבו משתתף מדגם מייצג וקבוע (המתוכנן ל 5,000-משתתפים) כל שנה .במסגרת סקר אורך זה מוצגות לאותם המשתתפים קבוצת שאלות החוזרת על עצמה מדי שנה ,כגון שאלות על הרכב משק הבית ,דיור ,הכנסה ,השכלה ועוד .כמו כן ,בכל שנה מוצגות שאלות נוספות בנושאים שונים .לדוגמה ,בשנת 2017נוספו שאלות
להורים לילדים שלומדים בבית הספר בנושאים כגון :שיעורי בית ,שיעורים פרטיים, ציפיות של הורים לרמת השכלה עתידית של הילד וציפיות הורים מציונים. בזכות הייצוגיות וטווח הזמן הארוך שבהם נעשה מעקב אחר כל משתתף ,יש למחקרי אורך מדינתיים מעין אלו יתרונות רבים .חוקרים רבים יכולים להשתמש בנתונים הנאגרים בהם .כך למשל ,יאפ ועמיתיו ))Yap, Anusic, & Lucas, 2012 מראים כיצד ניתן לנצל מערכי אורך אלו כדי להציג השערות שונות על שינויים החלים לאורך זמן ברמות הרווחה הסובייקטיבית .מערכים אלו מאפשרים לראות איזה חלק משביעות הרצון מהחיים בנקודות זמן שונות בחיים משקף נטייה אישיותית ,איזה חלק משקף אירועי חיים משמעותיים שחלו אצל האדם (למשל ,נישואין ,לידת תינוק, פטירה של הורים ,אבטלה) ,ומה הם החלקים בשביעות הרצון בנקודה מסוימת בחיים שהם תגובה לאירועים זמניים ומשתנים במהירות ,כגון שינויים במצב הרוח הלאומי .כל זאת ,על ידי שימוש במודלים סטטיסטיים העורכים השוואות בשביעות הרצון מהחיים לאורך זמן ,הניתוח כולל מידע על האירועים השונים (כגון נישואין), ונקודת הזמן שבה התרחשו. יש לזכור עם זאת ,שכמו לכל מערך מחקר ,גם למערך זה יש מגבלות .אחת המגבלות היא ,שככל שעובר הזמן ,המדגם שנבחר לפני זמן רב כבר אינו מייצג את האוכלוסייה הנוכחית .כך למשל ,מדגם שהיה מייצג לפני 30שנה בקליפורניה יהיה רחוק מלהיות מייצג את המדינה שבה חל מהפך דמוגרפי עם ההגירה העצומה ממדינות מרכז ודרום אמריקה ששינתה את ההרכב הדמוגרפי של מדינה זו .סביר להניח שגם מדגם שנבחר ב 2012-בישראל ,ייאבד מהייצוגיות שלו עם הזמן ,עם השינויים הדמוגרפיים באוכלוסייה. מחקרי עוקבה ()cohort מחקרי עוקבה הם סוג מסוים של מחקר אורך המתמקדים במעקב לאורך זמן אחר אותם המשתתפים שחולקים מאפיינים דומים או שחוו אירועי חיים משמעותיים בפרק זמן מוגבל .למשל ,משתתפים שנולדו בשנה מסוימת (,)birth cohort משתתפים שהשתתפו באותו מבצע צבאי או כל מי שהחל לימודיו באותו מחזור לימודים באוניברסיטה .במערך זה אנו שולטים במאפייני נקודת זמן 'הפתיחה'. לדוגמה ,במחקר שנערך בשבדיה עקבו אחר מעל ל 700,000 -נשים לאחר הלידה הראשונה שלהם ,ובחנו את הקשר בין סימפטומים דיכאוניים כפי שדווחו לפני הלידה ובין דיכאון אחר לידה עד לשנה לאחר הלידה .מהמחקר ניתן היה ללמוד שהסיכון של נשים עם דיכאון לפני הלידה לחוות דיכאון אחר לידה היה מעל פי 21מנשים שלא היה להם דיכאון (.)Silverman et al., 2016 מחקרי אורך משולבים ()cross-sequential במחקרי אורך מסוג עוקבה ניתן לשלב מספר שנתונים ( .)cross sequentialכך למשל ,במחקר שנערך על בוגרי פנימיות חינוכיות אנו עוקבים אחר חמישה עשר
שנתונים עוקבים של חניכים בכפרי נוער .מערך מחקר זה מאפשר לבחון מספר רב של סוגיות .בין היתר ניתן לשאול: א .מה השינויים שחלו במצבם הכלכלי של בני אותו המחזור (למשל ,ילידי ,)1985עם העלייה בגיל. ב .מה ההבדלים במצבם הכלכלי של משתתפים בני 25בשנה הנוכחית בהשוואה למי שהיו בני 25לפני עשר שנים? ג .האם קצב השינויים במצב הכלכלי עם העלייה בגיל דומה או שונה בקרב מי שנולדו בעשור האחרון בהשוואה למי שנולדו בעשור הקודם? ד .האם הפערים בין המצב הכלכלי של בוגרי פנימיות חינוכיות לזה של קבוצת השוואה הולכים וקטנים עם העלייה בגיל? כלומר ,האם הפער במצב הכלכלי בין שתי הקבוצות כשהן בגיל 21קטן יותר מהפער במצבם הכלכלי כשהם בגיל ?30 ה .האם הפערים במצב הכלכלי בגיל 25בין בוגרי הפנימיות החינוכיות לבני קבוצת ההשוואה הולכים וקטנים עם השנים? כלומר ,האם הפערים בין המצב הכלכלי של בוגרי הפנימיות לקבוצת ההשוואה בגילאי 25שנמדדו בשנת 2000 גדולים יותר מאשר הפערים במצב הכלכלי של בוגרי פנימיות וקבוצת ההשוואה בגילאי 25בשנת ?2015 מחקרי אורך על מדגמים בלתי תלויים – מחקרי חתך חוזרים במחקרי אורך ( )panelשאותם תיארנו קודם ,אנו עוקבים אחר אותם המשתתפים לאורך זמן .אחת הדרכים הנוספות לזיהוי שינויים לאורך זמן היא לערוך מחקרים המבוססים על מערך שבו אנו דוגמים מדגם מדי תקופת זמן ומשווים בין המדגמים שנאספו בנקודות הזמן השונות ,כל מדגם מכיל משתתפים אחרים. לדוגמה ,הרשות הארצית למחקר ולהערכה בחינוך (הראמ\"ה) עורכת מחקר ניטור אלימות ואקלים שבו היא דוגמת כל שנתיים מדגם מייצג של בתי ספר ותלמידים ומעבירה שאלונים הנוגעים להיבטים שונים של אקלים חברתי ואלימות בבית הספר. באמצעות מערך זה ניתן לעקוב לאורך השנים אחר רמות האלימות בבתי הספר ולזהות שינויים בסוגיות שונות ,לאורך זמן ((cms.education.gov.il/EducationCMS/Units/Rama/OdotRama/Odot.ht .mמכיוון שאין כאן מעקב אחר אותם התלמידים לאורך השנים ,מחקרים אלו אינם מאפשרים לעקוב אחר שינויים במצבם של תלמידים מסוימים ,אלא לזהות שינויים המתרחשים בכלל המערכת. מחקרים דומים נערכים כדי לעקוב אחר עמדות הציבור בנושאים שונים לאורך זמן .לדוגמה ,מרכז גוטמן לחקר דעת קהל ומדיניות ,הפועל כיום במסגרת המכון הישראלי לדמוקרטיה ,עורך סקרי דעת קהל בנושאים מסוימים במשך שנים רבות, וכך ניתן לזהות שינויים לאורך זמן בעמדות הציבור הישראלי ולבחון כיצד שינויים אלו עשויים להיות מוסברים באמצעות אירועים שקרו בזמן עריכת הסקר .לדוגמה ,מדד הדמוקרטיה הישראלית בוחן שאלות דומות מאז 2003ומאפשר לראות שינויים לאורך זמן במדדים שונים ,שחלקם (כגון ,מדד הקפדה על זכויות אזרח) ניתנים להשוואה עם מדינות אחרות בעולם .בחלק של דעות הציבור על מצב המדינה נשאלו המשיבים בכל הסקרים לאורך השנים מה לדעתם 'המצב של ישראל כיום באופן
כללי?' ניתן לראות שבעוד שבשנת 2003שיעור המשיבים 'רע מאוד' היה 38.5% ובשנת 2004היה ,30.6%הרי בשנת 2016היה 10.7%ובשנת 2017ירד ל- ( 7.8%הרמן ,כהן ,הלר ,לזר-שואף ועומר.(2017 , תרגילים לפרק 10 פרק 11 מחקרי התערבות ^^##443מבוא בספר זה אנו מייחסים חשיבות מיוחדת למחקרי התערבות ( intervention .)researchמחקרי התערבות הם מחקרים הבוחנים שאלה סיבתית :האם התערבות מסוימת גורמת לשינויים אצל המשתתפים בכיוון המצופה על ידי מפתחי ההתערבות .ההתערבויות הן בתחומים רבים ומגוונים ,כגון פסיכולוגיה ,חינוך, עבודה סוציאלית ,קרימינולוגיה ,סיעוד ובריאות הציבור .למחקרים אלו חשיבות מיוחדת משום שבעשורים האחרונים יש נטייה גוברת והולכת לבסס החלטות באשר לפרקטיקה מקצועית ולמדיניות על ממצאי מחקרים המצביעים על דרכי פעולה שהוכחו כיעילות (.)Evidence Based Practice, Evidence Based Policy מחקרי התערבות מציגים השערות סיבתיות על השפעתן של התערבויות ומשתמשים במערכי מחקר ניסויים וניסויים למחצה כדי לבחון השערות אלו .בפרקים הקודמים עסקנו בהשערות סיבתיות ובמערכי מחקר הרלוונטיים להשערות אלו. בפרק זה נשען על מה שנאמר בפרקים הקודמים ונתמקד בסוגיות מרכזיות בדיון על מחקרי התערבות. ^^##444סכנות לתוקף הפנימי הרלוונטיות במיוחד למחקרי התערבות מחקרי התערבות ,הבוחנים את ההשפעה הסיבתית של טיפולים ותוכניות התערבות פסיכולוגיות ,חברתיות ,רפואיות ואחרות ,חשופים לסכנות לתוקף פנימי המשותפות לכל המחקרים הבוחנים השערות סיבתיות .נוסף על כך ,יש סכנות הרלוונטיות במיוחד למחקרי התערבות. במחקרים הבוחנים את השפעותיהן של התערבויות מקובל להשוות משתתפים שנוטלים חלק בהתערבות למשתתפים שמקבלים התערבות אחרת או שאינם מקבלים התערבות כלל .השוואות אלו מבוססות על ההנחה שהקבוצות שונות זו מזו בחשיפה להתערבות הנבחנת ומשום כך יש משמעות להשוואה בין הקבוצות .אולם, נמצא שלא תמיד הנחה זו מבוססת ,ויש סכנות לתוקף הפנימי הנובעות מהעובדה שיש 'זיהום' ( )contaminationהמטשטש את ההבדלים בין מי שקיבלו את ההתערבות למי שלכאורה ,לא קיבלו את אותה ההתערבות ( Rubin & Babbie, .)2010לזיהום זה יש מספר פנים. לעיתים יש חשש שגם משתתפים הנמצאים לכאורה בקבוצה שאינה מקבלת התערבות נחשפים ,בדרכים שונות ,להתערבות עצמה .תופעה זו נקראת זליגה ( .)diffusion of interventionלדוגמה ,במחקר שנערך בנורבגיה החוקרים בחנו את ההשפעה של התערבות להפחתת אלימות ( Aggression Replacement
)Trainingעל קבוצת בני נוער בהשוואה לקבוצה שלא קיבלה את ההתערבות ( .)Gundersen, & Svatda, 2010אולם ,בהערכת תהליך המחקר זיהו החוקרים שהייתה זליגה של ההתערבות משום שחלק מהמטפלים הפעילו את ההתערבות גם על בני נוער שלא היו אמורים לקבל את ההתערבות ,וכן משום שבני הנוער בקבוצת הביקורת נחשפו לשינויים בהתנהגות של המשתתפים שכן קיבלו את ההתערבות, ולחשיפה זו היו כנראה השפעות חיוביות .ייתכן שמבחינת בני הנוער במחקר הייתה להתערבות השפעה מבורכת אך מבחינה מחקרית הייתה כאן בעיה של תוקף פנימי, כיוון ששתי הקבוצות נחשפו ברמה מסוימת להתערבות הטיפולית. יש גם עדויות לכך שבמהלך מחקרים על התערבויות אנשי מקצוע מנסים באופן לא פורמאלי לפצות את המשתתפים שאינם אמורים לקבל את ההתערבות .מכיוון שאנשי מקצוע אלו מאמינים שההתערבות עשויה לתרום ,הם מפצים על כך שהיא אינה ניתנת ,על ידי מאמצים גדולים יותר בעבודתם עם המשתתפים בקבוצת הביקורת .בספרות המקצועית תופעה זו נקראת השוואה מפצה ( compensatory .)equalization לעיתים יש חשש שאלו שאינם מקבלים את ההתערבות עלולים להתמרמר ולכעוס על כך שאינם מקבלים את ההתערבות ולהגיב בדרך שתפגע בתהליך המחקרי .כלומר ,משתתף היודע שיש אחרים המקבלים תשומת לב מחקרית ואולי גם התערבות בעלת ערך ,והוא עצמו שייך לקבוצת ביקורת שאינה מקבלת כל התייחסות ,עלול להגיב שלא בדרך 'הרגילה' ,כפי שהיה נוהג ללא קבלת ההתערבות, אלא דווקא בדרך שמשקפת את הכעס וההתמרמרות .וכך ,קשה להפריד בין התוצאות הנובעות מקבלת ההתערבות ואי קבלת ההתערבות ובין התוצאות שמקורן בתחושות הכעס וההתמרמרות. לעיתים החשש הוא שבמקום שהמשתתפים בקבוצת הביקורת יתמרמרו על כך שאינם מקבלים ההתערבות ,הם יגיבו בהתרסה – 'למרות שאנו לא זוכים לקבל את ההתערבות ,אנחנו נראה להם שגם בלי ההתערבות אנו יכולים להגיע לתוצאות טובות אלו '.תופעה זו מכונה בספרות תחרות מפצה (.)compensatory rivalry נציין ,שלמרות שבספרות יש התייחסות לתופעות כאלו של התמרמרות ותחרות מפצה כסכנות לתוקף הפנימי של מחקרי התערבות (למשלConrad, Conrad, & , ,)Walcott-McQuigg, 1991; Fraser, Richman, Galinsky, & Day 2009לא מצאנו מחקרים אמפיריים שבחנו תופעות אלו. ^^##445מערכי מחקר לבחינת תוצאות התערבות :מחקרים ניסויים מבוקרים ()Randomized Control Trials, RCT כזכור ,מערכים ניסויים נועדו לבחון את השפעתם של גורמים סיבתיים שונים .מחקרי התערבות בוחנים את ההשפעה של תוכניות חברתיות וחינוכיות ,טיפולים פסיכולוגיים ותרופתיים .כך למשל ,נערכים מחקרים הבאים להציג נושאים שונים ובהם :תרופות מביאות לשיפור במצבם של חולים ,התערבויות פסיכו-סוציאליות מעלות את רמת הרווחה של המטופלים ,תוכניות לקידום תעסוקה משפרות את המצב הכלכלי של קבוצות באוכלוסייה ,תוכניות חינוכיות מקדמות הישגים בבית
הספר ודוגמאות רבות אחרות .בכל המחקרים האלה המטרה היא להוכיח כי להתערבות יש השפעה סיבתית על משתנה תלוי שבו יש לנו עניין. בהקשר זה של בדיקת ההשפעה של התערבויות מקובל לקרוא למערך המחקר הניסויי הקלסי שהצגנו בפרק קודם' ,ניסוי מקרי מבוקר' – Randomized ) .Controlled Trial (RCTה ,RCT -שבו יש הקצאה מקרית לקבוצת מחקר שבה מופעלת ההתערבות באופן יזום על ידי החוקר ולקבוצת ביקורת שבה ההתערבות אינה מופעלת ,נחשב למערך בעל התקפות הפנימית הגבוהה ביותר והמתאים ביותר לבחינת השערות סיבתיות על השפעת התערבויות ( .)Gold Standardבפרק הקודם דנו בהיבטים שונים של מערכים ניסויים .כאן אנו מבקשים לדון בסוגיות שהן אופייניות במיוחד למחקרים ניסויים הבוחנים השפעה של התערבויות. ^^##446מאפייני ההתערבות התערבות ברמת היחיד או ברמת האשכול ( Cluster Randomized )Trial לעיתים קרובות יש לנו עניין בהשפעות של התערבות על יחידים ,כמו במחקרים על תרופות שנועדו להפחית לחץ דם ובמחקרים על התערבויות שנועדו להפחית אכילה כפייתית .במחקרים אלו יחידת הדגימה והניתוח הם יחידים .מערכי המחקר שהצגנו קודם עסקו בעיקר במצבים אלו .במחקרים אחרים ,ההתערבויות מכוונות לקבוצות ,לאשכולות של יחידים .למשל ,הגברת התאורה ברחוב כדרך להגביר את תחושת הביטחון של התושבים .מעצם טבעה ,זו התערבות שנועדה לקבוצות של תושבים המתגוררים באותה שכונה .משום כך ,אומנם נרצה לבחון את תחושת הביטחון של כל תושב ,אך את התשובות להשערות המחקר נקבל כשנתייחס לכלל התושבים בשכונות שבהן התאורה שופרה בהשוואה לכלל התושבים בשכונות שבהן לא היה שיפור בתאורה. דוגמה אחרת הן התערבויות בית ספריות שנועדו לקדם התנהגות אמפתית בקרב תלמידים .היעד הוא אומנם לקדם התנהגות אמפתית של כל אחד מהתלמידים המקבל את ההתערבות ,אך בפועל ,מכיוון שאנו מעבירים את ההתערבות בכל בית הספר ,בית הספר הופך להיות אשכול תלמידים ,שאת הממצאים שהתקבלו בו יש להשוות לבתי ספר אחרים שבהם לא הייתה התערבות. במקרים אלו של ניסויים ברמת האשכול ,תהליכי ביצוע המחקר ועיבוד הנתונים מביאים בחשבון שכל התלמידים קיבלו את אותה ההתערבות ,וההשוואה נערכת בין כל התלמידים בבתי ספר שקיבלו את ההתערבות ובין קבוצת ביקורת של כל התלמידים בקבוצת הביקורת של בתי ספר שבהם לא הופעלה ההתערבות .למערך זה קוראים ניסוי מבוקר ברמת האשכול (.)Cluster Randomized Trial לדוגמה ,קבוצת חוקרים בדנמרק בחנה את יעילותם של תרגילי מתיחה לשם מניעת פגיעה בגיד אכילס אצל ספורטאים ( Petersen, Thorborg, Nielsen, .)Budtz-Jørgensen & Hölmich, 2011במחקר זה הם הפעילו תוכנית אימונים מיוחדת ( )Eccentric trainingבקרב 23קבוצות כדורגל של חובבים ( 461שחקנים) ועקבו אחר 481שחקנים ב 27 -קבוצות אחרות ,שלא הפעילו את התוכנית .הם זיהו שבעוד שבקבוצות שקיבלו את התוכנית היו 15פגיעות בגיד אכילס ,הרי בקבוצות
שלא קיבלו את התוכנית המיוחדת היו 52אירועים כאלה .מהניתוח הסטטיסטי הסיקו החוקרים שיש בכך עדות מספקת ליעילות תוכנית האימונים במניעת פגיעה בגיד. מידת היישום ( )implementationוהנאמנות למקור ( )fidelityשל ההתערבות הטיפולית בכל מחקר התערבות יש פרוטוקול מפורט באשר לדרך שבה יש ליישם את ההתערבות .פרוטוקול זה קובע מי יעביר את ההתערבות ,באילו תנאים ,כמה פעמים ,באיזו תכיפות ,משך הזמן שבו יימשך הטיפול ועוד .כך למשל ,הפרוטוקול של תוכנית להנחלת מיומנויות רגשיות-חברתיות בקרב ילדי הגן עשוי לפרט שההתערבות תיעשה על ידי גננת שהוכשרה לכך בקורס הכנה מיוחד ומרוכז בן שלושה ימים ,כמו כן הגננת משתתפת אחת לשבועיים לפחות בהדרכה .התוכנית עצמה מורכבת מ 24-מפגשים שבועיים ,כל אחד נמשך כ 30-דקות ,ובכל מפגש כלול מרכיב הסבר לילדים על מיומנויות מסוימת ,משחק להנחלת המיומנות ,וישיבה במעגל ילדים לאחר הפעילות ,כדי לשתף ברגשות .חוקרים המפעילים תוכנית התערבות מעין זו ערים לכך שלעיתים תכופות יש פער בין מה שהפרוטוקול דורש ובין מה שמתרחש בפועל .כך למשל ,לעיתים קשה להבטיח שהגננת תשתתף בהדרכה ,עקב נסיבות שונות כגון מחלת ילדים ,אירועים שונים או נסיבות לא צפויות. משום כך ,מקובל לתעד את המידה שבה כל מרכיבי התוכנית יושמו בפועל, והאם הדרך שבה היא יושמה הייתה נאמנה למקור ,שאותו רצו לבדוק .כפי שנראה בהמשך ,מקורם של חלק מההסברים לשונות בתוצאות שהתקבלו בגנים שהשתתפו בתוכנית ,נעוץ במידה שבה הם יושמו 'לפי הפרוטוקול' .כך למשל ,בהקניית מיומנויות רגשיות-חברתיות לתלמידים יש עדויות מחקריות המצביעות על כך שכאשר היישום קרוב יותר למקור המפורט בפרוטוקול מבחינת כמות ההתערבויות ()dosage ומאפייניהן ,התוצאות טובות יותר ( & Durlak, Weissberg, Dymnicki, Taylor, .)Schellinger, 2011 התערבות בפועל וכוונה לטפל ()Intention to Treat – ITT במחקרי התערבות מקובל שכל המשתתפים בקבוצת המחקר מקבלים את ההתערבות .עם זאת ,יש מצבים שבהם החוקרים יכולים להציע התערבות ,אך אינם יכולים לחייב את המשתתפים לקבל אותה ,ובמקרים אחרים אפילו אינם יודעים אם המשתתפים בחרו להשתתף בהתערבות .במקרים אלו ,כל מי שהופנה לקבוצת המחקר והוצע לו טיפול ,נחשב כמי שקיבל טיפול .מערכים אלו מכונים 'כוונה לטפל' ( .)Intention to Treat, ITTאחת הסיבות להתייחסות לכל מי שהוקצו לקבוצת הטיפול כאילו קיבלו טיפול ,היא כדי להימנע ממצב שבו נבחן רק את אלו שקיבלו טיפול בפועל ,ובכך למעשה נתעלם מהעובדה שרק תת קבוצה נכנסה לטיפול, וקבוצה זו למעשה שונה מהקבוצה המקורית ,ובכך פוגמת בתהליך ההקצאה המקרית ומונעת השוואה תקפה עם קבוצת הביקורת .כך למשל ,חוקרים ביקשו לבחון את השפעתה של תרופה מסוימת ( ,(metforminעל הופעת סרטן בקרב חולי סוכרת .המחקר השווה בין אלו שלא קיבלו מרשם לתרופה ,ובין אלו שניתנה להם
התוויה לתרופה זו ,מבלי להתייחס לשאלה אם הם אכן נטלו את התרופה ( Tsilidis .)et al., 2014 ^^##447קבוצות ביקורת כזכור ,מערכי מחקר ניסויים על התערבויות מבוססים על השוואה בין הקבוצה שמקבלת את ההתערבות ובין קבוצה דומה לה ,קבוצת ביקורת ,שאינה מקבלת את ההתערבות .את ההבדלים בין הקבוצות אנו משייכים להשפעת ההתערבות .לכן יש לקבוצת הביקורת חשיבות גדולה כי היא מאפשרת לזהות את השפעות ההתערבות. בניסויים קליניים מבוקרים יש סוגים שונים של קבוצות ביקורת .הסוגים השונים נועדו לסייע לענות לשאלות המחקר ,ובה-בעת להתמודד עם סוגיות אתיות הנובעות מכך שיש משתתפים שאינם מקבלים את ההתערבות ומכך שהחוקרים והמשתתפים מקווים שהיא יעילה ותביא לתוצאות טובות. קבוצת ביקורת ללא טיפול ()No treatment במערך זה מגייסים משתתפים שאינם מקבלים כל טיפול .במסגרת השתתפותם במחקר הם נבדקים במקביל לקבוצת ההתערבות ,לפני שהטיפול ניתן לקבוצת המחקר ולאחריו .כאשר להתערבות עשויות להיות השפעות חיוביות בתחום חשוב כגון ריפוי מחלה ,אי קבלת הטיפול מהווה קושי אתי .יש המגיבים לטענה זו באמירה הנכונה ,שאילו היינו בטוחים שההתערבות הנבדקת היא יעילה ,לא היינו זקוקים למחקר וניתן היה לתת את ההתערבות לכולם .ובכל זאת ,כפי שנראה בדוגמאות בהמשך ,במקרים רבים נעשה מאמץ למנוע את הפגיעה לכאורה במי שנכללים בקבוצת הביקורת. נציין כי מלבד האפשרות לפגיעה אתית ,יש חשש שלמשתתפים שהוקצו לקבוצה זו לא יהיה עניין להשתתף במחקר והם לא יסכימו להמשיך ולענות על שאלות החוקרים או להסכים לבדיקות רפואיות ,כשאינם רואים בכך תועלת אישית כלשהי .כך למשל ,דיווחו חוקרים שפיתחו תרופה עבור בעיה רפואית (מפרצת בטנית באבי העורקים) שרבים מהמשתתפים ( (60% - 27%שהסכימו להשתתף במחקר והוקצו באופן מקרי לקבוצת ביקורת (שלא טופלה מלבד השתתפות בסריקות אולטרה-סאונד תקופתיות) ,הפסיקו את השתתפותם במחקר לאחר שבועות אחדים, בטרם הסתיים המחקר (.)Buckley, Rutherford, Diethrich, & Buckley, 2010 נשירה זו פוגמת בצורה משמעותית בסיכויי המחקר לבחון באופן יעיל את תוצאות הטיפול. קבוצת ביקורת בהמתנה Delayed (Waitlist) Control אחת הדרכים להתמודד עם הקושי האתי של קבוצת ביקורת ללא טיפול וגם לעודד את המשתתפים לשתף פעולה עם החוקרים היא להציע למשתתפים שהוקצו לקבוצת הביקורת את אותו הטיפול הניתן לקבוצת המחקר ,אך בהשהיה. המשתתפים בקבוצה יקבלו את הטיפול רק אחרי שימסרו מידע לאחר שקבוצת הטיפול סיימה לקבל טיפול .לדוגמה ,במחקר על התערבות קוגניטיבית עם חולי פרקינסון ,הקצו החוקרים את המשתתפים לשתי קבוצות ,האחת קיבלה טיפול והאחרת שימשה כקבוצת ביקורת .החוקרים בחנו את מאפייני הזיכרון של שתי הקבוצות לפני מתן ההתערבות ,ואחר כך בתום מתן ההתערבות לקבוצת המחקר.
לאחר שהחוקרים סיימו למדוד את מצבם של המשתתפים בקבוצת הביקורת והשוו אותם למצבם של המשתתפים בקבוצת המחקר ,הם הפנו את המשתתפים בקבוצת הביקורת לקבלת טיפול ( .)Valdés et al., 2017יש לציין שאלו המקבלים את הטיפול לאחר ההשהיה לא נבדקים לאחר קבלת הטיפול. קבוצת ביקורת פלצבו ( (placebo כאשר נמצא הבדלים בתוצאות בין שתי הקבוצות נוכל להסיק כי הטיפול אחראי להבדל בתוצאות .אולם ,יש עדויות רבות לכך שבטיפול יש שני מרכיבים לפחות. מרכיב אחד הוא המיוחד להתערבות המסוימת (למשל ,ההשפעה של החומר הכימי המופיע בתרופה) הנקרא הגורם הספציפי או האפקטיבי ()effective ingredient והשני משותף לכל ההתערבויות הטיפוליות ואינו ספציפי להתערבות שאותה אנו בוחנים ,ולכן נקרא ' .'non-specific ingredientמרכיב זה נובע בין היתר מההשפעה החיובית שיש לציפיות ולתקווה של מטופלים שהטיפול יסייע להם ומהברית הטיפולית שנכרתת בינם ובין המטפל או הרופא. תופעה זו נקראת ברפואה אפקט הפלצבו ( .)placeboאפקט זה משמעו שלעצם הציפייה ,התקווה והאמונה שטיפול יביא להטבה ,יש השפעה חיובית. ברפואה ידוע שבמקרים מסוימים מתן תרופת-דמה לחולים מסייעת לשיפור מצבם, גם כשאין בה שום מרכיב רפואי .חלק מתופעה זו נובע מתהליכים המתרחשים אצל החולה המפתח ציפיות ותקווה לשיפור ,וחלק אחר נובע מהאינטראקציה בין הרופא המשדר ביטחון ובין החולה הקולט מסר שמצבו עומד להשתפר. כל מי שמציע התערבות מבקש לבחון ולהוכיח שהמרכיבים הספציפיים של התוכנית שלו הם האחראים לתוצאות חיוביות ,מעל ומעבר להשפעות החיוביות של המרכיבים הלא ספציפיים .אם אינו יכול לעשות זאת ,תישאל השאלה מדוע לאמץ דווקא את תוכנית ההתערבות המסוימת ולא תוכניות אחרות המבוססות על המרכיבים הלא ספציפיים .וכך ,החוקר המבקש לבחון את ההשפעה של תוכנית להגברת ַק ְשיבות ( ,)mindfulnessחייב להביא בחשבון ,שאם יראה שלמורים שהשתתפו בתוכנית יש יכולת גבוהה יותר להתמודד עם דחק בהשוואה למורים שהוקצו באופן מקרי לקבוצת ביקורת ,הוא יצטרך לענות לשאלה האם התוצאה החיובית היא פרי התוכנית המוצלחת שהוא פיתח או שלמעשה כל התערבות ,גם כזו שבאופן תיאורטי לא הייתה אמורה לשפר יכולת התמודדות (\"תרופת דמה\") ,הייתה מביאה לתוצאות דומות .בחירת קבוצת הביקורת המתאימה תאפשר לתת מענה לשאלה זו. הדרך שבה ניתן לבדוק (ולשלול) את האפשרות שתוצאות חיוביות משקפות רק את ההשפעה של גורמים לא ספציפיים היא על ידי שימוש בקבוצות ביקורת שמקבלות גרסה מסוימת של התערבות .כלומר ,להעמיד מול הקבוצה שמקבלת את ההתערבות (קרי ,מקבלת גם גורמים ספציפיים וגם גורמים לא ספציפיים) קבוצת ביקורת הדומה לקבוצת ההתערבות במרכיבים הלא-ספציפיים אך אינה מכילה את
המרכיבים הספציפיים שהם בלב ההתערבות הנבחנת .ההבדלים שבין הקבוצות ישקפו את התרומה של הגורמים הספציפיים ,מעל ומעבר לגורמים הלא ספציפיים. ברפואה מקובל ל'נטרל' את ההשפעה של הגורמים הלא ספציפיים (כגון הציפיות המוקדמות להטבה ,האמונה במטפל והתגובה לתשומת הלב של המטפל), באמצעות מתן תרופה שידוע שאין לה השפעה מיטיבה (למשל ,כדור ובו כמות קטנה של סוכר ,או תמיסה של מים מזוקקים) למטופלים בקבוצה אחת ,ואת התרופה שרוצים לבדוק את השפעתה לקבוצה אחרת .המחקר מתנהל בדרך המבטיחה שהמשתתפים אינם יודעים אם הם מקבלים תרופה אמיתית או תרופת דמה ,כך שהציפיות והתגובות ה'לא ספציפיות' יהיו דומות בשתי קבוצות המשתתפים .ייתרה מזו ,ברפואה מקובל שגם הרופא או האחות הנותנים את התרופה אינם יודעים אם הם נותנים תרופה אמיתית או תרופת דמה .הרופא מקבל תרופה שלה מספר קוד ואינו יודע אם מדובר בתרופה הנבחנת או בפלצבו .רק מי שמנתח את הממצאים מכיר את הקודים ויודע לזהות מי קיבל את התרופה האמיתית ומי קיבל את תרופת הדמה .למהלך כזה קוראים 'סמיון כפול' ) – )double blindכלומר גם המשתתף וגם הרופא אינם יודעים להבחין בין התרופה לבין הפלצבו .הסמיון הכפול נועד למנוע מצב שבו הרופא היודע מהי התרופה האמיתית ישדר לחולה את ציפיותיו להחלמה, השונות מהמסרים שהוא משדר כשהוא יודע שהחולה מקבל טיפול דמה. בתחום המחקר הרפואי פותחו טכניקות שונות כדי ליצור קבוצת ביקורת המנטרלת במידה מיטבית את ההיבטים הלא ספציפיים של התערבות .מחקרים רבים השתמשו בפרוצדורות המכונות ,sham proceduresביטוי שמשמעותו שמדובר בפרוצדורות לא אמיתיות שמקורן בהטעייה .במחקרים מעין אלו החוקרים יודעים מה הפרוצדורה האמיתית ומה הפלצבו והם מנסים להטעות את החולים בקבוצת הביקורת ,כדי שיאמינו שהם מקבלים טיפול אמיתי .לדוגמה ,חולי לב שהיו בקבוצת הביקורת של ניתוח לב הכולל שימוש בלייזר ,שהו בחדר ניתוח שאליו הובא מכשיר הלייזר והרופאים דיברו ביניהם על הפרוצדורה של הניתוח לפני שהחולים הורדמו ,כך שהמשתתפים היו בטוחים שהם מקבלים את הטיפול האמיתי .לחולים שהיו בקבוצת ביקורת לניתוח אורתרוסקופי בברך בוצע חתך בברך במקום שבו הניתוח היה אמור להיעשות על ידי הרופאים ,שנהגו כפי שהם נוהגים בכל ניתוח, כולל רחיצת הידיים ,אך הניתוח לא בוצע .בקבוצות ביקורת של בחינת תוצאות של דיקור סיני ,נעשה דיקור לכאורה במקומות שהם ליד המקומות הרלוונטיים לדיקור. זאת כדי לדמות את התהליך שאותו עברו המשתתפים בקבוצת הביקורת לתהליך שעברו המשתתפים בקבוצת המחקר (ראו סקירה אצל Miller, & Kaptchuk, .)2004יש דיונים ביקורתיים רבים על האתיקה של פרוצדורות אלו שנועדו להטעות את המשתתפים ,לעיתים אף מבלי להכין אותם לכך שייתכן שהם ייטלו חלק בקבוצת ביקורת שלא תקבל את הפרוצדורה הרפואית (ראו סקירה שיטתית בנושא זה אצל .)Jonas et al., 2015 בניסויים במדעי החברה קשה לתת טיפול המיועד להיות פלצבו ולשמור על 'סמיון כפול' .כאלטרנטיבה ,ניתן להשתמש בקבוצות ביקורת שונות .כדי לשכנע שהמרכיבים הספציפיים של תוכנית הם אלו שהשפיעו ולא המרכיבים הלא ספציפיים המשותפים לכל התערבות ,משתמשים לעיתים בקבוצת ביקורת המקבלת 'טיפול'
שהחוקרים חושבים שלא אמורה להיות לו השפעה ממשית ,מלבד עצם ההשתתפות בהתערבות ('דמוי-טיפול' ,המקביל לפלצבו) .כך למשל ,קבוצת חוקרים ביקשה לבדוק תוכנית המבוססת על טיפול עצמי בדיכאון באמצעות האינטרנט (Internet- .)based self-management intervention for depression or dysthymia לקבוצת הביקורת הם הציעו טיפול עצמי של הרפיה הדרגתית של שרירים ( .)Progressive muscle relaxationבדברי ההסבר המופיעים במאמר המדעי אומרים החוקרים שמחקרים קודמים הצביעו על כך שחולים הסובלים מדיכאון נוטים לדרג התערבות זו כמסייעת להם אך נמצא במחקרים שלהתערבות זו אפקט חלש בהפחתת דיכאון ושניתן לצפות לאפקט חלש אף יותר במחקרם ,משום שהטיפול יינתן באופן לא אישי וללא תמיכת מטפל .בכך מראים החוקרים שהמשתתפים בקבוצת ההשוואה יקבלו טיפול שאינו צפוי להיות אפקטיבי ,אך הציפיות שלהם מהטיפול עשויות להיות דומות לאלו המקבלים את הטיפול (.)Oheler et al., 2019 כעת ההשוואה בין קבוצת הטיפול וקבוצת הביקורת אמורה לתת מידע על המרכיבים הספציפיים של ההתערבות להפחתת דיכאון ,כי אנו מאמינים ששתי הקבוצות קיבלו את המרכיבים הלא ספציפיים המשותפים להתערבויות באשר הן ,ורק קבוצת הניסוי קיבלה את המרכיב הספציפי של תוכנית ההתערבות. קבוצת ביקורת 'טיפול כרגיל' ()Treatment as Usual- TAU כאמור ,להחלטה לתת לחלק מהמשתתפים התערבות שאנו חושבים שהיא לא יעילה ,יש השלכות אתיות ,הנובעות ממניעת טיפול .אחת הדרכים להתגבר על קושי זה היא להשוות בין קבוצת טיפול המקבלת את הטיפול שאנו מבקשים לבדוק וקבוצת ביקורת המקבלת את הטיפול המקובל .בכך איננו מונעים טיפול וגם גורמים לכך ששתי הקבוצות חשופות לאותם מרכיבים לא ספציפיים .פרזר ועמיתיו אף מדגישים שיש חשיבות ש'הטיפול הרגיל' יהיה טיפול שכבר נבחן בעבר והוכיח את יעילותו ( .)evidence based practices, Fraser et al., 2009בכך גם מתייחסים לקושי האתי וגם מעמידים בפני ההתערבות המוצעת רף גבוה יותר ,בכך שעליה להוכיח שהיא יעילה יותר מהתערבויות המקובלות כיום. ^^##448מספר המדידות ועיתויין בכל מערך ניסויי מבוקר יש לפחות שתי מדידות :לפני הפעלת הגורם הסיבתי ולאחר ההפעלה .במחקרים על התערבות יש חשיבות מיוחדת לבחינה של מספר המדידות של המשתנים התלויים והעיתוי שלהם .כאשר בוחנים באופן ביקורתי תוצאות של התערבות יש להבחין בין תוצאות בטווח הקצר לתוצאות בטווח הארוך יותר .ולכן ,מחקרי התערבות רבים אינם מסתפקים במדידה של התוצאות מיד בתום ההתערבות ,אלא חוזרים ומודדים כעבור זמן .לדוגמה ,במחקר על טכניקות לשיפור הוראת המתמטיקה באמצעות מחשב לוח ( )tabletבחנו החוקרים את הישגי התלמידים מיד עם סיום התוכנית ,כעבור ששה חודשים מסיום התוכנית ופעם נוספת ששה חודשים מאוחר יותר ( .)Hassler, Klingberg, & Ghaderi, 2018בדוגמה אחרת ,החוקרים פיתחו התערבות לסייע לפונים עם הפרעה דו-קוטבית .במחקר הם הגדירו שישה חודשים מתחילת הטיפול כסיום הטיפול ( ,)endpointוקבעו מדידה אחת לפני תחילת הטיפול ,אחת שלושה חודשים לפני סיום הטיפול ,מדידה אחת בסיום הטיפול וארבע נקודות מדידה נוספות (בהפרש של שלושה חודשים זו מזו).
התקשינו למצוא בספרות מדידות של תוצאות שנעשו זמן רב לאחר סיום הטיפול (ראו דוגמה למעקב אחר שנתיים ב – .)Sourander et al., 2018 ^^##449הבנת השונות בתוצאות ההתערבות באמצעות ניסוי ניתן לראות אם התוצאות שהתקבלו בקבוצת המחקר שונות מאלו שהתקבלו בקבוצת הביקורת .בדרך כלל מקובל להשוות בין הממוצע שהתקבל בקבוצה אחת מול הממוצע שהתקבל בקבוצה האחרת .אולם ,התברר שבמחקרים רבים יש שונות רבה בתוצאות שהתקבלו בעבור המשתתפים השונים בקבוצת המחקר .יש עניין רב בשאלה מהו מקור השונות .ככל שנבין טוב יותר כיצד זה שחלק מהמשתתפים הצליח להיעזר בטיפול ושיפר את מצבו וחלק אחר לא התקדם בהשגת מטרות הטיפול (ואולי אף חלה נסיגה במצבו) ,כך נוכל לשפר את תכני ההתערבות ואת דרכי הפעלתה. חלק מההסבר לשונות בתוצאות היא השונות במאפייני המשתתפים .כך למשל, ייתכן שהתערבות מסוימת פועלת בצורה יעילה יותר בקרב גברים בהשוואה לנשים, בקרב צעירים בהשוואה למבוגרים ,או בקרב משתתפים שלהם היסטוריה ארוכה של דיכאון בהשוואה למי שסובל מדיכאון זמן קצר יותר .בדיקה של הקשר בין מאפייני המשתתפים לתוצאות ההתערבות עשויה לסייע לכוון בעתיד את ההתערבות בעיקר לקבוצות שהמחקר הראה שהן מגיבות טוב יותר להתערבות .כמו כן ,מפתחי ההתערבות עשויים להחליט על שינויים במרכיבי ההתערבות כדי להתאימה לקבוצות משתתפים שלא זכו ליהנות ממנה ,כמו קבוצות אחרות .כך למשל ,מפתחי התערבות להדרכת הורים בקידום יכולות קוגניטיביות אצל ילדים שגילו במחקר קודם שההתערבות הייתה יעילה פחות בקרב הורים משכילים פחות ,עשויים לשנות חלק מחומרי ההדרכה כדי שיהיו נגישים יותר לאנשים שלהם השכלה פורמלית נמוכה. חלק אחר מההסבר לשונות בתוצאות נובע מהדרכים שבהן התוכנית מיושמת. כך למשל ,ייתכן שכאשר משתתפים קיבלו פחות מפגשים טיפוליים מהמתוכנן או שמשך כל מפגש היה קצר מדי או שהמפגשים נוהלו על ידי אנשי מקצוע שלא קיבלו הדרכה מספקת ,התוצאות היו פחות טובות .כדי להבין כיצד השונות בדרכי היישום של ההתערבות משפיעה על שונות בתוצאות ,חשוב לתעד את הדרכים שבהן ההתערבות מועברת למשתתפים השונים .נושא זה מופיע בספרות המחקרית כדרישה לבדיקת מידת הנאמנות של יישום של ההתערבות ( implementation .)fidelity checkבמחקרי RCTמקובל כיום לבחון ולתעד את תהליכי ההתערבות. לדוגמה ,בהמשך ,נבחנות התוצאות של כל משתתף מול התיעוד של מאפייני ההתערבות שאותה קיבל בפועל .במקרים שבהם מתברר שהשונות בתוצאות מוסברת בכך שהטיפול מביא לתוצאות טובות כאשר הוא מופעל באופן מיטבי, מפתחי ההתערבות עשויים לעמוד על כך שחייבים לבצע את התוכנית 'לפי הפרוטוקול' ,או להכניס בה שינויים ,כך שתהייה רגישה פחות לחריגה מהפרוטוקול. לדוגמה ,אם נמצא שהטיפול הביא לתוצאות טובות יותר כאשר הוא הועבר על ידי אנשי מקצוע מנוסים ,החוקרים ומפתחי התוכנית עשויים לדרוש שהתוכנית תופעל
רק על ידי אנשי מקצוע מנוסים או להכין חומרי הדרכה מפורטים יותר ,כך שגם מטפלים מנוסים פחות יצליחו להביא לתוצאות חיוביות. ^^##450בדיקת תיאוריית השינוי הבחירה בהתערבויות ספציפית כדי להשיג תוצאות מסוימות אינה מקרית. התערבויות מבוססות על תיאוריית שינוי ( ,)theory of changeתיאוריה המתארת את המנגנון ( )mechanismהמחבר בין ההתערבות לבין התוצאה המצופה .כך למשל ,תיאוריית השינוי של מפתח של תוכנית להדרכת הורים המיועדת לקדם מיומנויות רגשיות-חברתיות של ילדיהם ,מצפה שהדרכת ההורים תביא לשינויים בדרכים שבהן הם מגיבים לילדיהם ,ושינויים אלו יביאו לקידום המיומנויות של הילדים .אם החוקר עורך ניסוי המראה שילדים שהוריהם השתתפו בתוכנית ההדרכה מפגינים שיפור במיומנויות במידה רבה יותר מאשר ילדים שהוריהם לא השתתפו בהדרכה ,הוא יודע שההתערבות השיגה את מטרתה .הוא אינו יודע כיצד. כדי לבחון האם תיאוריית השינוי שלו היא נכונה ,הוא יכול לערוך ניתוחים סטטיסטיים נוספים כדי לבחון את תיאוריית השינוי .במקרה הנוכחי ,חוקרים מישראל בחנו את ההשערה ששינויים בהתנהגות ההורים היו הגורם המתווך שקשר בין הדרכת ההורים בתוכנית ההתערבות לבין המיומנויות הרגשיות-חברתיות של ילדיהם. ואמנם ,הממצאים תמכו בתיאוריית שינוי זו (.)Elizur, Somech, & Vinokur, 2017 חשוב כמובן לזכור שחוקרים המבקשים לבחון את תיאוריית השינוי שלהם אינם יכולים להסתפק רק במדידת ההתערבות ותוצאותיה .עליהם לכלול במחקרם מדידה של אותם משתנים שהם חושבים שהם המשתנים המתווכים את הקשרים שבין ההתערבות לבין תוצאותיה .מדידה זו תאפשר בחינה אמפירית של השערותיהם על מנגנוני השינוי. ^^##451דיווח על מחקרים של ניסויים מבוקרים ()RCT לתוצאות של מחקרי התערבות עשויות להיות השלכות חשובות .כך למשל, בעקבות ממצאים של ניסויים מבוקרים עשויות הרשויות לבחור להכניס תרופה או פרוצדורה רפואית לסל התרופות או להפעיל תוכנית חברתית יקרה בקנה מידה גדול. משום כך ,יש חשיבות גדולה לדיווח על מחקרי התערבות בדרך המבטיחה את הפירוט והשקיפות המירבים ,כדי להבטיח שימוש נאות בממצאי מחקרים אלו ,ולמנוע הטיות הנובעות מדיווח חסר ,או מגמתי .משום כך ,הוצאו הנחיות על ידי ארגון הידוע בשם .Consolidated Standards of Reporting Trials (CONSORT) -הנחיות אלו מופיעות כרשימה של 25פריטים ( .)checklistעל החוקר המבקש לדווח על ממצאי מחקרו לבחון האם הדיווח עומד בדרישות של כל אחד מהפריטים. הדרישות מתייחסות לכל מרכיבי הדיווח :שם המחקר והתקציר ,מבוא ,שיטות (כולל התייחסות למערך ,משתתפים ,דגימה ,מדידת תוצאות) ,דרכי ההקצאה המקרית ,תוצאות ,דיון והיבטים נוספים ,כגון מקורות המימון .בכל פריט מפורטת הדרישה מהחוקר כיצד עליו לדווח .לדוגמה ,על החוקר לפרט האם וכיצד הביאו לכך
שהמשתתפים היו 'עיוורים' למאפייני המחקר ובאילו תהליכים נעשתה ההקצאה מקרית. כמו כן ,מפרטות הדרישות את הצורך בתרשים זרימה שבו על החוקר להציג את מבנה תהליך הדגימה .בין היתר ,החוקר נדרש לציין כמה מהמשתתפים הפוטנציאליים לא נכללו במחקר משום שאינם עומדים בקריטריונים להכללה ,או משום שלמרות שהם עומדים בקריטריונים הם מסרבים להשתתף במחקר ,כמה הוקצו לקבוצת המחקר וכמה לקבוצת הביקורת ,כמה נשרו ,וכמה לא נשרו אך הוצאו מהניתוח (למשל ,משום שמידע רב חסר עליהם). פרק 12 תוקף חיצוני ^^##452מבוא בפרק 10עסקנו בסוגיות של תוקף פנימי של מערכי מחקר שנועדו לענות על שאלות סיבתיות .הדגש היה על המידה שבה מערך המחקר מאפשר להוכיח את הטענה הסיבתית .בפרק זה נעסוק בסוגיות של תוקף חיצוני המתייחסות למידה שבה ניתן להכליל את ממצאי המחקר .כאן ניתן לראות שני ממדים שונים .ממד אחד מתייחס לשאלה האם מדגם המשתתפים שעליו מבוסס המחקר מאפשר לנו להכליל את הממצאים לקבוצות אחרות .הממד האחר מתייחס לשאלה האם התוצאות שהתקבלו במסגרת המחקר ניתנות להכללה גם למקומות ,למצבים ולזמנים אחרים. לכן ,כשאנו בוחנים תוקף חיצוני של מחקר ,אנו שואלים שתי שאלות עוקבות :א. האם משתתפי המחקר מהווים מדגם מייצג של האוכלוסייה שאליה אנו מתכוונים להכליל את הממצאים .ב .האם הדרך שבה נוהל המחקר מאפשרת לנו להכליל את תוצאותיו גם למצבים אחרים ,שהמחקר מתכוון להכליל לגביהם .מקובל להתייחס לשאלה זו של ההכללה להקשרים אחרים מזה שבו נערך המחקר כשאלת התוקף האקולוגי (.)ecological validity בפרק 9עסקנו באופן מפורט בשאלות הנוגעות למידת הייצוגיות של מדגמים. בפרק הנוכחי נתמקד בעיקר בשאלות הרלוונטיות באופן מיוחד למערכי מחקר ניסויים ולמחקרי התערבות שהצגנו בפרקים הקודמים. ^^##453תוקף חיצוני ב'מחקרי מעבדה' סוגיות של דגימת משתתפים לעיתים נדירות בלבד מבוססים מחקרי מעבדה על דגימה מייצגת של משתתפים .לדוגמה ,חלק ניכר מהמחקרים בפסיכולוגיה בוצעו על סטודנטים בתוכניות בוגר בפסיכולוגיה ,המחויבים ,כחלק מתהליך הכשרתם ,להשתתף במחקרים אחדים הנערכים במחלקתם .מחקרים רבים אחרים נערכו על סטודנטים במחלקות אחרות ,כגון מינהל עסקים וכלכלה .גם מחקרים שהיוו אבני דרך בפיתוח תיאוריות פסיכולוגיות ,כמו הניסויים המפורסמים של מיליגרם על צייתנות ( )Milgram, 1963והניסוי של זימברדו על התנהגות בכלא ( Zimbardo, Maslach, ,)& Haney, 2000התבססו על סטודנטים שהיו מוכנים להשתתף במחקר שנערך
על ידי חוקרים באוניברסיטה .ברור לכן ,שרוב רובם של מחקרי המעבדה אינם עומדים בקריטריונים של תוקף חיצוני מבחינת הייצוגיות של מדגם המשתתפים ,ויש לנקוט זהירות רבה בהכללה לאוכלוסיות אחרות ,שאינן של סטודנטים המוכנים או המחויבים להשתתף במחקר. חשוב לציין ,שהערכה זו אינה מצומצמת למחקרים הנערכים בחדר ייעודי במרתף של אוניברסיטה .מחקרים ניסויים רבים אחרים אינם נערכים דווקא במקום פיזי שניתן לקרוא לו 'מעבדה' ,ופונים גם לאוכלוסיות אחרות שאינן של סטודנטים. לדוגמה ,במחקר בין לאומי על שיפוט וקבלת החלטות בעניינם של ילדים בסיכון, המשתתפים בניסוי ,שבחן כיצד מידע על מאפייני המקרה משפיעים על ההחלטות, היו אנשי מקצוע בתחום רווחת הילד .המשתתפים נטלו חלק בניסוי ממרחק ,בעיקר באמצעות דואר אלקטרוני ותוכנת מחשב ( .)Benbenishty et al., 2015גם בדוגמה זו ,המשתתפים לא היו מדגם מייצג של האוכלוסייה והחוקרים נסמכו על מדגמי נוחות .אכן ,גם בניסויים מעין אלו ,שאינם מוגבלים לסטודנטים באוניברסיטאות ,נדיר מאוד לפגוש תהליך של דגימה מייצגת של אוכלוסייה ,כצעד מקדים לניסוי .המסקנה מחלק זה היא שיש לנקוט זהירות בניסיון להכליל ממחקרים שאינם מבוססים על מדגמים מייצגים. תוקף אקולוגי ( )ecological validityשל מחקרי מעבדה האתגר המרכזי שעמו מתמודדים מערכי מחקר ניסויים הוא השמירה על התוקף הפנימי שלהם .לכן ,נעשים מאמצים רבים לשלוט בסיטואציה של הניסוי ולתפעל את המשתנה הבלתי תלוי בדרכים המבטיחות שלא יהיו טענות לתוקף הפנימי .מאמצים אלו גורמים לא פעם לסיטואציות מלאכותיות .וכך ,יש מתח בין הניסיון לשלוט בסיטואציה לצורכי תוקף פנימי ובין הרצון להבטיח תוקף חיצוני .ואכן, התוקף החיצוני של רוב רובם של הניסויים בתנאי מעבדה הוא בעייתי ,לא רק עקב הדגימה הלא מייצגת ,אלא גם משום שקשה להכליל מתנאי המעבדה לחיים שמחוץ למעבדה .אומנם ,חוקרים המבצעים ניסויים במעבדה מנסים ליצור תנאים הדומים ככל האפשר לתנאים שמחוץ למעבדה .אולם מסיבות רבות ,הם מוגבלים עקב שיקולים מעשיים ואתיים .לדוגמה ,קשה ליצור במעבדה תנאים מפחידים כדי לדמות סיטואציות טראומטיות ,קשה לתת תגמולים כספיים בעלי משמעות ,קשה לדמות במעבדה יחסים בין אישיים משמעותיים (לטוב ולרע) וכן הלאה. אחת הדוגמאות לכך שהרצון להגביר תוקף פנימי עלול לפגום בתוקף האקולוגי הם מחקרים הבוחנים את 'דילמת האסיר' .לדילמה זו יש נוסחים שונים אך בסיס הסיפור הוא שני אנשים שביצעו יחד מעשה פשע ונתפסו .החוקרים פונים לכל אחד מהם בנפרד ומציעים לו עסקה .בעסקה זו ,אם האסיר ילשין ראשון על חברו הוא לא ייענש ,אך חברו ייענש באופן חמור ,אם הוא לא ילשין ,אך חברו ילשין עליו ,הוא זה שייענש באופן חמור ,אם שניהם יודו ,יקבלו עונש מופחת ואם שניהם לא יודו ,שניהם ישוחררו ללא עונש .ניתן לראות מצבי חיים רבים המשקפים דילמות מעין אלו. האם מחקרי מעבדה היוצרים סיטואציות המדמות דילמות אסיר יכולות ליצור תנאים הדומים לתנאי חיים אמיתיים ,כך שניתן יהיה להכליל מהממצאים המתקבלים במעבדה להתנהגות בחיים שמחוץ למעבדה? נראה שבמקרים לא מעטים התשובה
היא שיש ספק רב אם ניתן לבצע הכללה ממצבים מלאכותיים שנוצרו במעבדה למצבי חיים רגילים .ו אומנם ,בנגרט ( )Bungret, 2003סוקר מספר רב של חוקרים ומחקרים המצביעים על המרחק הניכר בין מחקרי דילמת האסיר בניסויים פסיכולוגיים למצבי חיים אמיתיים. ובדומה ,הצגנו בחלק אחר מחקר ניסויי על קבלת החלטות על ילדים בסיכון, המבוסס על תגובה לתיאור מקרה המוצג כטקסט והנתון להחלטה של משתתף שאינו מעורב רגשית ושאינו נוטל כל סיכון בהחלטתו .האם ניתן להניח שמה שהשפיע על מקבל החלטות בתנאים מחקריים אלו ,ישפיע עליו גם בבואו לדון במקרה אמיתי של ילד והוריו ,בשר ודם המופיעים במשרדו ,ושהחלטתו יכולה להכריע את גורלם? סביר להניח שלא .משום כך ,יש להיזהר בהכללות מניסויים כאלה למצבי חיים אמיתיים. על אף האזהרות על מגבלות בתוקף האקולוגי של מחקרי מעבדה ,חשוב לציין שיש חוקרים הטוענים שהמגבלות אומנם כבדות-משקל אך במידה פחותה ממה שניתן לחשוב .יש הטוענים שדווקא התנאים המלאכותיים במעבדה הם המתאימים ביותר כדי לענות לשאלות התיאורטיות ,ונושא ההכללה רלוונטי פחות .לדוגמה ,מוק ( (Mook, 1983טוען בין היתר שלעיתים המטרה היא לא להכליל ,והשאלה היא לא 'מה קורה בדרך כלל' אלא דווקא 'מה יכול לקרות' ,וכן שלעיתים הניסוי במעבדה מצליח להראות שלמרות העובדה שהתנאים במעבדה הם לא טבעיים ,עדיין מתרחשת תופעה מסוימת. בהתאם לכך ,אנדרסון ובושמן ( (Anderson, & Bushman, 1997הצביעו על כך שיש ממצאים על התנהגות תוקפנית שהתקבלו במעבדה ובהמשך התברר שגם כששאלות אלו נבחנו בתנאי חיים אמיתיים הממצאים היו דומים .לדוגמה ,הבדלים בין גברים לנשים שנמצאו במעבדה התקבלו גם במחקרים במצבי חיים רגילים. דוגמה אחרת הם משתנים מצביים המעוררים התנהגות תוקפנית ,כגון פרובוקציה, שנמצאה מעוררת תוקפנות הן בניסויי מעבדה והן בתצפיות במצבי חיים טבעיים. לסיכום חלק זה ניתן לומר שיש להעריך בביקורתיות את התוקף החיצוני של מחקרים ,הן את המידה שבה ניתן להכליל לקבוצות שונות והן עד כמה ניתן להכליל למצבים אחרים מאלו שבהם נערך המחקר .עם זאת ,נראה שאין להסיק באופן מידי שלמחקרים הנערכים בשדה יש תוקף חיצוני ולמחקרי מעבדה יש קושי בתוקף החיצוני .יש לבחון את מטרות המחקר ,האם הוא מכוון להכללה רחבה ,וכן את המידה שבה תנאי המחקר גורמים לקושי משמעותי בהכללה להקשרים אחרים. ^^##454תוקף חיצוני במחקרי התערבות כמו במחקרים ניסויים אחרים ,ניתן לזהות ברבים ממחקרי ההתערבות את המגבלות של תהליכי הבחירה של המשתתפים ,המביאים לכך שהמדגמים אינם מייצגים .ייתרה מזו ,ניתן גם לראות ברבים ממחקרי התערבות קושי בהפעלת התערבות בנסיבות מלאכותיות ,שקשה לשחזר אחר כך בתנאי חיים אמיתיים. חלק מהקשיים בתוקף חיצוני נובעים מתהליכי הבחירה במשתתפי המחקר. לעיתים קרובות ,הבחירה במשתתפים אינה מקרית ואינה בשליטה מלאה של החוקר .יש מחסומים לא מעטים לנכונות להשתתף במחקר התערבות ,ולכן סביר
שלמי שנכלל במחקר יש מאפיינים שעשויים להיות ייחודיים ,ויהיה קשה להכליל מהם לכלל האוכלוסייה הרלוונטית .לדוגמה ,חוקרים המבקשים לערוך מחקר על התערבות בבית ספר ,לא יבחרו למחקר שלהם בתי ספר שבהם המנהל מתנגד להשתתפות במחקר או שמידת חוסר היעילות וחוסר הארגון בבית הספר הם בולטים כל כך שקשה להניח שניתן יהיה ליישם את ההתערבות באופן מסודר .החוקרים יבחרו בתי ספר שבהם יתקבלו בסבר פנים יפות וניתן יהיה לבצע את המחקר בצורה סבירה. זהו מהלך הגיוני שכן תנאי פתיחה אלו חשובים לצורכי הבדיקה אם ההתערבות יעילה .אין טעם להיכנס לבית ספר שבו ,למרות השקעה רבה של משאבים ,לא ניתן יהיה לבחון את ההתערבות משום שהמנהל יתנגד להפעלתה בבית ספרו .אולם ,בה בעת ,בחירה מוקפדת זו על המקום שבו תיבחן ההתערבות ,מקטינה את התוקף החיצוני של המחקר .לא ניתן לטעון שההתערבות ,שנמצאה יעילה בבתי הספר הייחודיים שבהם היא נבחנה ,ניתנת להכללה לבתי ספר אחרים .שהרי ,רבים מבתי הספר האחרים דומים דווקא לאלו שמהם נמנעו החוקרים מלהיכנס ,ולא לבתי הספר שבהם בחרו החוקרים כדי לבחון את ההתערבות. חלק אחר התורם לבעיות בתוקף האקולוגי הם המאפיינים הייחודיים של הניסוי. חוקרת המבקשת להוכיח שהתערבות מסוימת היא יעילה ,תשקיע מאמצים רבים כדי שההתערבות תופעל בדרך המיטבית .וכך ,תבחר החוקרת את המטפלים הטובים ביותר שתוכל להרשות לעצמה בתקציב המחקר ,ותעניק להם את התנאים הסביבתיים הטובים ביותר להתערבות (כגון הפחתת עומס המטופלים ,הדרכה צמודה ,תשלום הוגן) .בכך היא נותנת להתערבות 'הזדמנות' טובה להוכיח את עצמה .אך ,בה בעת ,השקעה זו בהתערבות הופכת אותה לייחודית ,כי במקרים רבים אין תנאים כאלה בשטח ,ובכך היא מקטינה את התוקף החיצוני (האקולוגי) של ממצאי המחקר .התערבות שהופעלה בתנאים אופטימליים והצליחה להביא תוצאות טובות ,עלולה להיכשל בתנאים 'רגילים' .שאלת התוקף החיצוני לכן היא ,האם ניתן להניח שהטיפול הזה יהיה יעיל ,גם בתנאים שהמטפלים אינם מומחים ,אינם מקבלים הדרכה מסודרת על טיפול זה והלחצים של מקום העבודה אינם מאפשרים להם פני ֵות רגשית להעמיק בטיפול ,מעבר למה שהם עושים בדרך כלל. מחקרי יעילות ( )efficacyומועילות ()effectiveness חוקרים העוסקים במחקר על התערבויות ערים למתח הקיים בין הרצון לאפשר תנאים אופטימליים לבחינת התערבות לבין החשש מתוקף אקולוגי נמוך .אחת הדרכים להתמודד עם המעבר מתנאי ניסוי לתנאים טבעיים יותר ,היא עריכת שני סוגי מחקרי התערבות .בצעד הראשון נערכים מחקרי יעילות ( .)efficacyמטרת מחקרים אלו היא לבחון אם ההתערבות מביאה לתוצאות חיוביות בתנאים אופטימליים .אם ההתערבות עברה מבחן זה ,עוברים לשלב השני ובו מחקרי מועילות ( ,)effectivenessשבהם נבחנת ההתערבות בתנאים קרובים יותר לתנאים שבהם היא תופעל במציאות ( .)Fraser, Richman, Galinsky, & Day, 2009כך למשל ברפואה ,מחקרי היעילות מתבצעים פעמים רבות במחלקות בבתי חולים, שבהן השליטה על תנאי ההתערבות היא טובה ,ורק בהמשך ,מחקרי המועילות מתרחשים גם במרפאות בקהילה ,שבהן התנאים מבוקרים פחות ודומים יותר
לנסיבות שבהם תופעל ההתערבות בהמשך .יש טענות רבות בספרות שמעט מדי מחקרים עוברים משלב בדיקת היעילות לשלב שבו נבחנת ההתערבות בתנאי אמת, ולכן גם רבות מההתערבויות שהוכחו כיעילות בתנאי מעבדה אינן מוכיחות את עצמן כשהן מועברות לשטח (.)Glasgow, Lichtenstein, & Marcus, 2003 הידע המחקרי המצטבר מצביע על כך שמתברר שקשה מאוד ליישם בשטח ( )implementationהתערבויות שהוכיחו עצמן בניסויים ,קשה לקיים את היישום לאורך זמן ( ,)sustainabilityוקשה במיוחד להרחיב ולהגדיל את היקף היישום לסדרי גודל רחבים יותר ( .)scalabilityוכך ,גם אם נמצא שטכניקה מסוימת להוראת מתמטיקה הוכיחה את עצמה בניסויים חינוכיים ,בתי ספר שיבקשו ליישם אותה בשטח עלולים לגלות שקשה ליישם ולקיים אותה מחוץ לבתי הספר ששימשו כמעבדת ניסויים ,והיכולת להפיץ אותה למספר רב של בתי ספר או להפוך אותה לשיטה המקובלת בכל בתי הספר ,היא מוגבלת .נושאים אלו הם מחוץ למסגרת הספר הנוכחי ולמעוניינים להעמיק בסוגיות אלו מומלץ לעיין בBauer, - .Damschroder, Hagedorn, Smith, & Kilbourne, 2015 ^^##455דוגמאות למחקרי התערבות בעלי תוקף חיצוני גבוה לסיום ,לאחר שעמדנו על הקשיים הקיימים בתוקף חיצוני של תוכניות התערבות ,יש מקום להביא גם דוגמאות מוצלחות .בחלק מהמקרים ,בעיקר במחקרים על התערבויות חברתיות רחבות היקף ,ניתן למצוא מחקרי התערבות הכוללים דגימה הסתברותית של המשתתפים ,הקצאה מקרית לקבוצות מחקר וביקורת והפעלה של ההתערבות בתנאים רגילים ,ובכך מגדילים בצורה משמעותית את התוקף החיצוני שלהם. בדרך כלל תוכניות חברתיות מעין אלו מיושמות באופן הדרגתי ובשלבים הראשונים יש תהליכי בדיקה הנעשים רק על חלק מהאוכלוסייה .במקרים מעין אלו ניתן לבצע דגימה מקרית ומייצגת מתוך אוכלוסיית היעד ולהפעיל את התוכנית רק על חלק מהאוכלוסייה שנבחר ,ללמוד על תוצאותיה ,וכך ניתן יהיה להכליל את הלקחים שיופקו מהתוכנית על כלל האוכלוסייה הרלוונטית .לכשעצמן ,תוכניות אלו מהוות ניסוי חברתי הנלמד בקפידה כדי להעריך האם יש מקום להרחיב את המעגל ולהביא ליישום לכלל האוכלוסייה. כך לדוגמה ,פותחה התערבות חברתית שבה המדינה מעניקה סכומי כסף לחיסכון אישי עבור כל ילד ) ,Child Development Accounts (CDAsהניתנים בתנאים מועדפים (כגון בריבית גבוהה מהמקובל) .בעת פיתוח תוכנית זו ניתן היה לבצע מחקרים חברתיים רחבי היקף .במדינת אוקלהומה בארצות הברית למשל נבחר מדגם מקרי ומייצג של כל הילדים שנולדו בשנה מסוימת .מתוך מדגם מייצג זה הוקצתה באופן מקרי קבוצה של ילדים לקבוצת ההתערבות ,שבה הוריהם קיבלו מהמדינה מענק בדמות חשבון חיסכון ללימודים גבוהים ,וקבוצת ביקורת שקיבלה רק את התגמולים הרגילים שמקבלות משפחות במדינה .בהמשך ראיינו החוקרים את האימהות של כל הילדים במחקר והשוו את דיווחי האימהות על ההתפתחות החברתית-רגשית של הילדים בקבוצת ההתערבות לדיווחים שהתקבלו מראיונות עם האימהות שמשפחתן הייתה שייכת לקבוצת הביקורת (Huang, Kim, Sherraden,
.)& Clancy, 2017למעוניינים נציין שהממצאים הצביעו על הבדלים מובהקים בהתפתחות הרגשית-חברתית של ילדים שמשפחתם קיבלה את המענקים. דוגמה אחרת היא מחקר שנערך כדי לבדוק איזה סוג מסרים משפיע יותר על התנהגויות הקשורות לבריאות הציבור .במסגרת המחקר נבחר מדגם מקרי ומייצג של משתתפים והם הוקצו בצורה מקרית לשתי קבוצות .לקבוצה אחת הוצג סרט המציג מידע על הימנעות מהידבקות במגפת שפעת (,)Influenza pandemic ולקבוצה האחרת הוצג אותו המידע בדרך של הצגת טקסט .לממצאים המראים שהמסר המילולי היה יעיל יותר ,יש תוקף פנימי גבוה בזכות ההקצאה המקרית לשתי הקבוצות ותוקף חיצוני גבוה הנובע הן מהעובדה שמדובר במדגם מייצג והן מכך שדרך הצגת המסרים נעשתה בדרכים מקובלות להצגת מסרים אלו ,כך שנסיבות המחקר המבוקר היו דומות למצבי החיים הרגילים שאליהם רצו החוקרים להכליל את המסקנות מהממצאים. ניתן לסכם ולומר שיש אתגרים משמעותיים בהשגת תוקף חיצוני גבוה במחקרים ניסויים רבים .עם זאת ,בנסיבות מסוימות ניתן ליצור תנאים המגבירים את התוקף החיצוני הן באמצעות דגימה מייצגת והן על ידי יצירת תנאי מחקר הדומים לתנאים מחוץ למחקר. פרק 13 היבטים אתיים במחקר מבוא כל חוקר וחוקרת המבקשים לבצע מחקר ולפרסמו חייבים לתת את דעתם על ההיבטים האתיים של פעילותם המחקרית .בעשורים האחרונים יש הקפדה גוברת והולכת על עמידה בדרישות האתיות בתהליך ביצוע המחקר ובעת פרסומו לציבור. לפרק זה שני חלקים :הראשון עוסק בהרחבה בדרישות האתיות מחוקרים המערבים בני אנוש במחקרם .החלק השני עומד על עקרונות אתיים הנוגעים לציפיות מחוקרים בכל האמור ליושרה שלהם כלפי הציבור וכלפי עמיתיהם .בין היתר נעמוד על סגיות של יושרה בניהול מחקר ,ניגודי עניינים ואתיקה בתהליכי פרסום מדעי. ^^##457אתיקה במחקרים המערבים בני אנוש ^^##458רקע היסטורי כיום מתמקדות הדרישות האתיות מחוקרים העורכים ניסויים בבני אנוש ,בעיקר כתגובה למעשים שלא ייעשו אך לצערנו כן נעשו ונעשים על ידי אנשי מדע ,או לעיתים ככסות מדעית בלבד .משפטי נירנברג שנערכו בקיץ 1947בגרמניה מהווים קו פרשת מים בעת המודרנית בכל הקשור לביצוע מחקרים שבהם מעורבים בני אדם .במשפט הורשעו 23רופאים גרמנים בפשעים נגד האנושות עקב 'ניסויים' מזוויעים שערכו בבני אדם .מטרת הניסויים הייתה לאסוף ידע שיסייע לחיילים
הגרמנים .הניסויים גרמו לאנשים סבל נורא ,נכות קשה ומוות .בעת המשפט התברר שלמעשה אין קוד אתי מחייב שיוודא שניסויים רפואיים בבני אדם לא יגיעו להתנהגות מפלצתית כפי שהתרחשה במלחמת העולם השנייה .בעקבות המשפט עוצב הקוד האתי של נירנברג ,שכלל עשר נקודות שעליהן יש להקפיד בעת ביצוע מחקר בבני אדם. אולם ,התנהגות שאינה אתית בעליל ,לא הייתה נחלתם של הנאצים בלבד .עם השנים התברר שבמהלך המאה העשרים נערכו לא מעט מחקרים ברפואה ובפסיכולוגיה שבהם החוקרים לא שמרו כראוי על טובת הנחקרים ופרטיותם והנחקרים שותפו במחקרים למעשה מבלי שהסכימו לכך באופן מפורש .בין היתר התברר שמחקר בארצות הברית ,שנועד לבחון את התפתחות מחלת העגבת ,נערך על קוטפי כותנה שחורים בעיר טסקיגי ( (Tuskegeeבאלבמה מבלי לבקש את הסכמתם ומבלי ליידע את חולי העגבת מביניהם על מחלתם .יתרה מזו ,הניסוי החל בשנת 1932ועל אף שכבר בשנות הארבעים של המאה העשרים היה ידוע שפניצילין יכול למנוע את התפתחות המחלה ,נשמרה עובדה זו בסוד מהחולים ,כדי לא לפגוע בניסוי .פעילות זו לא נעשתה במחתרת .אפילו המרכז לבקרת מחלות בארצות הברית ( )CDC – Centers for Disease Control and Preventionגוף בעל יוקרה רבה ,אישר להמשיך את המחקר גם לאחר שהתבררו ממדי הפגיעה האתית. המחקר הופסק רק בשנת 1972עקב לחץ ציבורי שנגרם כתוצאה מפרסום הפרשה על ידי חוקר שלא הסכים לשתף פעולה עם הפגיעה האתית. חריגות אלו מהתנהגות אתית במחקר לא היו האחרונות .עם השנים התברר שבקרב ילדים פגועי נפש בבית הספר Willowbrookשבמדינת ניו יורק נערך מחקר על הידבקות בצהבת שכלל גם הדבקה מכוונת בנגיף המחלה .השתתפותם של הילדים במחקר הושגה לאחר שנאמר להוריהם כי אם הם לא יסכימו שילדיהם ישתתפו במחקר הילדים לא יטופלו .על אף שלמחקר הייתה תרומה לחקר הצהבת, רבים טוענים ששיתוף ילדים פגועים במחקר מעין זה ללא בחירה חופשית של הוריהם היא דוגמה למחקר לא אתי .בספרות יש דוגמאות נוספות למחקרים שנעשו בצורה לא אתית אשר בהם המשתתפים לא ידעו שהם משתתפים במחקר או לא ידעו מהן מטרות המחקר שבו השתתפו ומהן הסכנות הכרוכות בו (ראו דיון רחב בנושאים אלו ,לנדאו ושפלר.)Sales & Folkman, 2000 ;2007 , גם בישראל התנהלו מחקרים שלא עמדו בכללי האתיקה .כך לדוגמה ,בשנת ,2008פרסמה ועדת האתיקה של ההסתדרות הרפואית ,דוח בדיקה שנערך לפי פניית קצין רפואה ראשי על התנהלות המחקר הרפואי הידוע בשמו 'עומר '2שעסק בחיסון לגחלת (אנתרקס) ובו השתתפו 800חיילי צה\"ל ( .)http://www.armagedon.org.il/anthrax.pdfהוועדה כונסה לאחר שחשיפה בתוכנית הטלוויזיה 'עובדה' העלתה ספקות קשים באשר להתנהלות הניסוי https://www.mako.co.il/tv-ilana_dayan/2009-ef8733eb15f5e110/Article- .ac7131c05106e11004.htmהוועדה הצביעה על שורה ארוכה של כשלים אתיים חמורים בהתנהלות המחקר .בין היתר הוועדה לא שוכנעה בנושאים הבאים :האם היה מקום לעריכת הניסוי בבני אדם ,האם היה חיוני לערוך אותו דווקא על חיילים וכן האם הבחירה בחיילים כאוכלוסיית הניסוי הייתה פסולה ומגמתית וייתכן שנעשתה,
בין השאר ,מטעמי נוחות ושיקולים כלכליים .ועדת הבדיקה קבעה כי :א .הוועדה מטעם הצבא שהייתה אמורה לוודא שהמחקר מתנהל בצורה אתית כשלה בתפקידה; ב .גיוסם של המשתתפים בניסוי נעשה בניגוד לכללי היסוד של ביצוע ניסויים בבני אדם; ג .בניסוי \"עומר \"2נעשה ניצול של אוכלוסייה רגישה הנתונה למרות בהיררכיה הצבאית. במשך השנים שחלפו מאז משפטי נירנברג ,נעשו בעולם מאמצים רבים לנסח כללים אתיים לביצוע מחקרים שבהם מעורבים בני אדם (גם באתיקה של ניסויים בבעלי חיים חלו שינויים אך לא נסקור אותם כאן .ראו חוק צער בעלי חיים (ניסויים בבעלי חיים) ,התשנ\"ד ,1994-וכן https://www.health.gov.il/Services/Committee/animax/Pages/default.as .)px נוסף לקוד האתי שנקבע בעקבות משפטי נירנברג ,ניתן לזהות אבני דרך היסטוריות אחדות המסמנות את ההתפתחות שחלה בנושא זה בעולם במהלך השנים .בשנת 1964התפרסמה הצהרת הלסינקי ,המהווה אבן יסוד בבקרה על האתיקה של מחקר בעולם הרפואה ובעולמות אחרים .היא עודכנה מאז מספר פעמים אך ההצהרה הראשונית היא תשתית לחקיקה ברחבי העולם .בארצות הברית הוסדר נושא האתיקה ב 1974 -על ידי חוק המחקר הלאומי ( National Research .)Actבהמשך ,בשנת 1979פורסם דוח שהייתה לו השפעה מכריעה על קביעת כללי האתיקה במחקר – דוח בלמונט ( .)Belmontאחת ההשלכות של התפתחויות אלו הייתה יצירה של גופי בקרה המאשרים ביצועם של מחקרים .בארצות הברית גופים אלו נקראים Institutional Review Boards - IRB'sובאנגליה Research .Ethics Committees – REC'sבישראל יש כיום ועדות אתיקה בכל מוסד אקדמי ורפואי וכל חוקר המבקש לערוך מחקר בהשתתפות בני אדם חייב לקבל אישור (או פטור במקרים מסוימים) מוועדת אתיקה רלוונטית .ועדות אלו פועלות על סמך עקרונות אתיים מקובלים ,המתעדכנים עם הזמן .משום כך חשוב להכיר את הכללים שעל פיהם פועלות ועדות האתיקה הרלוונטיות. ^^##459עקרונות של אתיקה במחקר לפני שנציג עקרונות מוסכמים לאתיקה במחקר ,חיוני להבהיר שעקרונות אלו הם הנחיות לתהליכים של שיקול דעת וקבלת החלטות של המתמודדים המתבקשים לאזן בין דרישות ושיקולים שהם לעיתים מנוגדים זה לזה ,ובין מצבים שאינם תמיד חד משמעיים .כך למשל ,לא תמיד ברור אם הסיכון שהמחקר יפגע במשתתף הוא גבוה מספיק כדי למנוע ממנו להשתתף במחקר שעשוי לתרום במידה רבה לתועלת הכלל .העובדה שוועדות אתיקה מלוות חוקרים גם לאחר שהמחקר אושר ויצא לדרך, היא עדות לכך שהשיקולים האתיים במחקר הם מורכבים וכבדי משקל .הדבר נעשה כדי לסייע בחשיבה משותפת באשר להתמודדות עם החלטות מורכבות מבחינה אתית העולות במהלך המחקר. תלמידים וחוקרים יכולים להיעזר באתרים המדריכים ומסייעים להם בחשיבה על יישום עקרונות האתיקה במחקר .אתר בולט בתחום זה הוא של המועצה הבריטית למחקר חברתי-כלכלי ( – Economic and Social Research Council
,)ESRCהמנגיש לחוקרים היבטים שונים של אתיקה במחקר (.(https://esrc.ukri.org/funding/guidance-for-applicants/research-ethics/ כמו כן ,המוסד הלאומי לבריאות בארצות הברית ( – National Health Institute )NIHמפרסם עקרונות אתיים ומדריך ביישומם כגון בתחום המחקר בבריאות הנפש ( https://www.nimh.nih.gov/labs-at-nimh/scientific-director/office-of- fellowship-and-training/mandatory-trainings/ethics-training- .)resources.shtml יש ניסוחים רבים לעקרונות של אתיקה במחקר ואת מרבית העקרונות המוזכרים בספרות ניתן לקשור לשלושה רעיונות-יסוד כפי שהופיעו בדוח בלמונט: לעשות את הטוב – – Beneficenceיש לפעול לטובת המשתתפים וחובה להימנע מלפגוע בהם. כבוד – – Respectיש להתייחס בכבוד לזכויותיו ולרצונו החופשי של כל משתתף במחקר ,להחלטתו החופשית האם להשתתף במחקר .יש לכבד את המשתתף ולא להטעותו או לרמותו. צדק – – Justiceיש להבטיח חלוקה צודקת ושוויונית של היתרונות והחסרונות הנובעים מהשתתפות במחקר .אין להדיר קבוצות ממחקר ,יש לוודא שכל המשתתפים ייהנו באופן שווה מתועלות המחקר ולא לגרום לחלק מהמשתתפים להיחשף ליותר סיכונים מאשר משתתפים אחרים .בחלקים הבאים נפרט שיקולים שונים הנובעים מרעיונות יסוד אלו. ^^##45901מניעת סיכונים ועשיית הטוב כלל מפתח באתיקה של עריכת מחקר בבני אדם הוא אי פגיעה (.)do no harm במחקרים רפואיים שבהם המשתתפים מקבלים תרופות או עוברים פרוצדורות רפואיות שונות יש לרוב סיכונים רבים יותר לפגיעה במשתתפים מאשר במחקרים בחינוך ובמדעי החברה וההתנהגות .עם זאת ,כל חוקר בכל תחום חייב להעריך את הסיכונים הכרוכים במחקרו ,גם אם אלו אינם סיכונים פיזיים ,כגון תחושות חרדה, מצוקה ולחץ בקרב המשתתפים .חשוב לנסות להעריך באופן סביר את הסיכון. נתקלתי בחוקרים שהפריזו בהערכת הסיכונים וחששו מסיכון ניכר ללחץ ומצוקה גם אם השאלות התייחסו לסוגיה כגון דפוסי בילוי בקרב בני נוער (\"האם אין סיכון לבני נוער שאין להם חיי חברה פעילים והשאלה תעורר בהם חרדה ובושה עמוקה?\"). לעומתם נתקלתי בחוקרים שחשבו שראיון מעמיק עם נפגעות אונס שלושה חודשים לאחר האירוע אינו מעורר חשש לתגובות נפשיות קשות ואין צורך להיערך לקראתן. לכן ,יש להתייחס לכל מקרה לגופו ולנסות להגיע לאיזונים סבירים .היתרון בוועדות אתיקה ,מלבד היותן בלתי תלויות בחוקר (ומשום כך הן אובייקטיביות יותר) ,היא ההזדמנות לשיח עמיתים המאפשר לבחון את הסוגיות מזווית ראייה רבות ולא מנקודת מבטו של החוקר בלבד. יש להדגיש כי העובדה שהערכנו שיש סיכון למשתתפים במחקר שאנו מתכוונים לערוך אינה צריכה להוביל בהכרח למסקנה שאין לערוך את המחקר .בכל מחקר מתוכנן יש מקום להעריך אם התועלת מביצועו תעלה על הנזק הנובע מהסיכון למשתתפים .על החוקרת לוודא שהיא עשתה את המרב להקטין את הסיכון במהלך
המחקר .כך למשל ,חשוב שראיונות העלולים לגרום לריאקטיבציה של זיכרונות טראומטיים או לגרום לתגובות רגשיות קשות למשתתף ,ייערכו על ידי מראיינים בעלי ידע וניסיון שקיבלו הדרכה לפני הראיונות .כמו כן יש ללוות את המראיינים במהלך הראיונות כדי לוודא שהם מגיבים בצורה הולמת לתגובות המשתתפים (במקרים לא מעטים יש ללוותם גם אחרי ביצוע הראיונות ,כדי להגן על המראיינים עצמם מפני טראומה משנית) .יש לזכור כי גם לאחר הבהרת הסיכונים למשתתפים ומתן אפשרות להפסיק את השתתפותם בכל שלב ,חשוב לתת להם גם פרטי התקשרות עם החוקרת או מי מטעמה ,כדי לדווח על קשיים העשויים להתעורר ובמקרה הצורך לקבל הפנייה לעזרה מקצועית .על החוקרת להיות אחראית ולהמשיך במתן מענה לקושי שהתעורר בעקבות המחקר שערכה .מקובל כי במחקרים שיש בהם הערכה לסיכון כלשהו העשוי לעורר קשיים בקרב המשתתפים ,מצורף מידע ובו הפניות למקורות לעזרה נפשית במקרה הצורך .נהוג ששירותים אלו אינם כרוכים בעלות כספית למשתתפי המחקר. לכאורה ,כמעט בכל מחקר יש אפשרות שמי מהמשתתפים יחוש תחושות מצוקה עקב המשמעות האישית שיש למחקר בעבורו .ובכל זאת ,יש להשתדל להגיע להערכה סבירה ולא מופרזת לשום כיוון .טוב יעשו חוקרים המתכננים לערוך מחקר או סדרת מחקרים בתחום מסוים ,אם יבדקו בספרות אם יש עדויות אמפיריות לפגיעה במשתתפים במחקרים מעין אלו וכיצד התמודדו חוקרים בעבר עם סיכונים אלו. ^^##460הסכמה מדעת ()informed consent כחלק מהכבוד שאנו רוחשים למשתתפי המחקר ,חובה עלינו להבטיח שהם משתתפים במחקר מרצונם הטוב ועל בסיס מידע שלם וכי הם מבינים מה המשמעות שיש להשתתפותם ולכן על החוקרים לדייק בהצגת המחקר ומטרותיו בפני המשתתפים .כחלק ממתן המידע המלא על המחקר ובמטרה לאפשר הסכמה מדעת, עלינו להציג בפני המשתתפים את הנקודות הבאות: זהות ושיוך ארגוני של עורכי המחקר -זכותם של המשתתפים לדעת מי הם עורכי המחקר כדי שיחליטו אם הם מוכנים לשתף פעולה במחקר של עורכים אלה. כך למשל ,משתתף פוטנציאלי עשוי להירתע מהשתתפות במחקר הנערך על ידי גוף שמטרותיו המסחריות או הפוליטיות אינן לטעמו. מטרות המחקר ,התכנים והתהליכים -על החוקר להציג למשתתפים את מטרות המחקר האמיתיות מבלי להטעותו ולתאר בפניו את התכנים והתהליכים שבהם מעורבים המשתתפים וכן מה יתבקשו לעשות במהלך המחקר :לענות על שאלון, להשתתף בשיחה קבוצתית ,להיבחן בנושא מסוים ועוד .לעיתים יש מקום לעמעם מעט את התכנים המוצגים למשתתפים .הסיבה לכך היא כדי לא להטות את ממצאי המחקר עקב חשיפת השערות המחקר בפני המשתתפים העשויים להגיב בדרך שבה ירצו את החוקר .יש להשתמש בדרך זו במשורה ,מתוך מאמץ להביא את מרב המידע לידיעת המועמד להשתתפות. התועלות והסיכונים שבפני המשתתפים – הסכמה מודעת צריכה להיות מבוססת על החלטתו של המשתתף ליטול חלק במחקר לאחר שהבין את הסיכונים
שהוא נוטל על עצמו בהשתתפות זו .סוגיה זו בולטת יותר במחקרים רפואיים שבהם עלולים להיות סיכונים גופניים ,אך היא קיימת גם במחקרים פסיכולוגים .חוקרים צריכים להכיר באפשרות לפגיעה רגשית ולהכין את המשתתפים במחקר לאפשרות כזו .כך למשל ,אפשר לומר למשתתפים כי במחקרים דומים בעבר בדרך כלל לא דווח על קשיים עקב ההשתתפות במחקר .ניסוח אחר יכול להיות: מחקרים קודמים הצביעו על כך שיש מספר קטן של משתתפים שהראיון במסגרת המחקר עורר בהם זיכרונות לא נעימים .אם ההשתתפות במחקר הנוכחי תעורר בך זיכרונות לא נעימים ותרצה לשוחח על כך עם איש מקצוע ,אנו מפנים אותך לשירות ___ שהוא שירות חינם המסייע למי שרוצים לשוחח על קשיים רגשיים ,בין היתר עקב זיכרונות לא נעימים .במקרה הצורך ,אנא פנה לעורך המחקר בכתובת שלמטה ואנו נעשה את המרב כדי להפנות אותך לאיש מקצוע מתאים. אלטרנטיבות להשתתפות במחקר -לעיתים ,בעיקר במחקרים הבוחנים את התוצאות של התערבות (כגון התערבות פסיכולוגית) ,המשתתף עשוי להחליט לא להשתתף בהתערבות הניסיונית המוצעת על ידי החוקר .במקרה כזה על החוקר להבהיר שהאלטרנטיבה יכולה להיות המשך הטיפול הנוכחי. הדרך שבה ייעשה שימוש במידע אישי של המשתתף – על החוקר להציג בפני המשתתף מה השימוש שייעשה במידע אודותיו .זה המקום להבהיר אם המחקר יתבצע באופן אנונימי ,כיצד תישמר פרטיות המידע שהמשתתף מסר וכיצד תימנע חשיפה של מידע אישי שהמשתתף לא בחר לשתף .חלק זה כולל גם הבהרה בדבר חובותיו של החוקר לדיווח על פי החוק .כך למשל ,חוקר המראיין משתתף עלול לחשוף שהמשתתף ביצע מעשה פשע או מתכנן מעשה כזה ובמקרה כזה חלה עליו חובה לדווח או לחשוף את רשימותיו בפני רשויות החוק (ובכך לפגוע באנונימיות). דוגמה אחרת היא מחקר שבו מראיין עלול לחשוף התנהגות פוגעת של המשתתף כלפי אדם אחר ,כגון ילד או קשיש חסר ישע .ועוד דוגמה היא מידע המוביל לחשש סביר שהמשתתף מתכוון לפגוע בעצמו .החוקר עשוי לעשות מאמץ מכוון שלא לשאול על נושאים שעלולים לחשוף התנהגות כזו ,אך בכל מקרה המשתתף הפוטנציאלי חייב לדעת ,עוד לפני שנתן את הסכמתו להשתתף במחקר, שייתכן שהחוקר ייאלץ או יבחר לפגוע באנונימיות ולדווח על כך. על החוקר להתייחס לסוגיה נוספת והיא השימוש שייעשה בנתונים שיימסרו על ידי המשתתף במהלך המחקר ולאחר סיומו .החוקר צריך לשתף את המשתתף בנושאים כגון האם נתונים שהתקבלו במסגרת המחקר הנוכחי יועברו לגורם אחר; האם ישולבו למידע אחר שיש בידי החוקר על המשתתף; כמו כן ,מקובל לומר למשתתף כמה זמן יישארו הנתונים ברשות החוקר לפני שיימחקו. הדגשת הבחירה מרצון להשתתף במחקר -על החוקר להבהיר למשתתף שהשתתפותו במחקר היא וולונטרית .יתרה מזו ,עליו להדגיש שהחלטה לא להשתתף לא תפגע בו בשום צורה .כמו כן ,מקובל להבהיר שהבחירה האם
להשתתף קיימת גם לאחר ההסכמה הראשונית והמשתתף יכול לחזור בו ולהפסיק את השתתפותו במחקר בכל עת שיחפוץ ,מבלי לשאת בתוצאות שליליות כל שהן. פיצוי ,תועלת אישית ישירה מהמחקר -על החוקר להבהיר מה התמורה שהמשתתף יכול לצפות מהשתתפותו במחקר .תמורה זו עשויה להיות השתתפות בטיפול בחינם ,פיצוי בגין הוצאות כגון נסיעות או תשלום עבור המאמץ .החוקר יכול גם להבהיר למשתתף שאין מדובר בתועלת ישירה ,מלבד תחושתו שהוא תרם ליצירת ידע שיסייע לאחרים .כמו כן ,רבים מציעים למשתתפים לקבל את תקציר דוח המחקר ,כך שיוכלו לראות כיצד השתתפותם תרמה לידע המדעי ולאחרים. כאן חשוב לציין את המורכבות הכרוכה במתן פיצוי .מצד אחד ,מתן פיצוי בגין הזמן והמאמץ המושקעים בהשתתפות עשוי להיות ביטוי לכבוד שאנו רוחשים למשתתף העושה מאמץ מיוחד ולכן ראוי לפיצוי .מהצד האחר ,יש חשש שהצעת הפיצוי תהווה דרך לפתות או לשחד את המשתתף הפוטנציאלי .משתתפים שאמצעיהם דלים ,עלולים להתפתות להשתתף במחקר כדי לזכות לפיצוי ובכך למעשה הבחירה שלהם להשתתף אינה וולונטרית אלא נובעת ממניעים זרים .לכן כחלק מתהליך קבלת ההחלטות על התנהלות אתית במחקר המסוים יש לשקול את אופי הפיצוי וגודלו. פרטי קשר -מצופה שהחוקר ייתן למשתתף את פרטי הקשר שלו ,כדי שהוא יוכל לעמוד אתו בקשר אם יהיו לו שאלות או תגובות אחרות על המחקר .מידע זה חיוני במצבים שבהם יש חשש ,ולו קטן ,לתוצאות שליליות בעקבות ההשתתפות במחקר .מתן פרטי הקשר של החוקר למשתתף יסייעו לגייס עזרה ותמיכה במקרה הצורך. נביא להלן שתי דוגמאות (בקיצורים מתבקשים) להסכמה מודעת למחקרים שעסקו בהשלכות מגפת הקורונה. טופס הסכמה מדעת וירוס הקורונה :תחושות וצרכים האוניברסיטה העברית עורכת סקר בקרב הסטודנטים באשר לרגשות ,עמדות וצרכים בעידן הקורונה .נבקש ממך להשיב על שאלות העוסקות בנושאים כמו :מידת החשיפה לווירוס הקורונה ,מצב הבריאות שלך ושל משפחתך.... , מילוי השאלון יימשך בין 10ל 15דקות ההשתתפות שלך בסקר תעזור לנו להבין את הרגשות של הסטודנטים שלנו ,המחשבות והצרכים בעידן של מצב לחץ המוני לא מוכר ועל כך תודתנו . ההשתתפות בסקר היא כמובן לא חובה ,ותעשה רק אם את/ה מסכים לכך .את/ה גם יכול/ה להחליט לא לענות על חלק מהשאלות אם את/ה מרגיש/ה לא נוח לענות עליהן. השאלון הוא אנונימי וכל הנתונים המזהים שלך יישמרו חסויים .יחד עם זאת ,בתום מילוי השאלות נבקש את הסכמתך לחזור אליך בעוד מספר חודשים .רק אם תסכים ותשאיר את פרטיך ,נחזור אליך. כמו כן ,תינתן האפשרות להשאיר פרטים כדי שניתן יהיה לשוב אליך ולנסות לסייע. יכול להיות שחלק מהשאלות יגרמו לקצת קושי כי הן עוסקות בתגובות שלך למצבי לחץ. מהניסיון שלנו קושי זה הוא קצר מאד וחולף בסוף הראיון .יחד עם זאת ,בסוף השאלון מופיעה
י קושי או מצוקה בסוף/ה לפנות בחינם במידה ותרגיש/ה יכול/רשימה של מקומות אליהם את .הראיון ה גם יכול לפנות לחוקרים על פי כתובות הדוא\"ל הרשומים מטה/את .Z וY X 'פרופ, בתודה בדוגמה הבאה ניתן לראות שהחוקרים מציגים למשתתפים גם את המגבלות שלהם בשמירת .) משום ששלטונות האוניברסיטה דורשים גישה לנתונים לצורכי בקרה,האנונימיות (למשל COVID-19: Effects of a Global Stressor on Couples in the United States Investigators: This study is being conducted by Dr. A. K. R. (Principal Investigator). Why is this research being done? The aim of this study is to understand the effects of the global stressor, COVID-19, on couples living in the United States. How long will the research last? Participation is expected to last no more than 45 minutes… How many people will be studied? We expect that about 500 individuals will participate in this study. What happens if I say yes, I want to be in this research? You are free to decide whether you wish to participate in this study. If you choose to participate, we will ask you to complete a questionnaire online. We encourage you to complete the questions to the best of your ability, as there are no right or wrong answers. Additionally, we ask that you do not skip questions in the survey. Payment: Upon completion of the study, you can opt to be entered into a raffle to win one of ten $50.00 Amazon.com gift cards. Gift cards will be e-mailed to the e-mail address you provide the research assistant. What happens if I say yes, but I change my mind later? Participants can leave the research at any time, and it will not be held against them. Is there any way being in this study could be bad for me? The assessments will include self-report questionnaires. Risks involved with the questionnaires is that it may elicit emotional discomfort. Absolute confidentiality of data provided through the Internet cannot be guaranteed due to the limited protections of Internet access. Please be sure to close your browser when finished so no one will be able to see what you have been doing. … All data will be stored on a secure computer system that can only be accessed by study personnel. Will being in this study help me in any way? Data collected from this study will provide valuable information that may ultimately help mental health practitioners and physicians better understand how to help individuals cope with stress associated with COVID-19.
What happens to the information collected for the research? Efforts will be made to limit the use and disclosure of your personal information, including research study records, to people who have a need to review this information. We cannot promise complete secrecy. Organizations that may inspect and copy your information include the University board that reviews research who want to make sure the researchers are doing their jobs correctly and protecting your information and rights. Who can I talk to? If you have questions, concerns, or complaints, please contact Dr. A. K. R. (Principal Investigator): This research has been reviewed and approved by the Social Behavioral IRB. You may talk to them at (480) 965-XXXX or by email at [email protected] This page explains the nature, demands, benefits and any risk of the project. By clicking the arrow below, you agree knowingly to assume any risks involved and also acknowledge that you are 18 years or older. Remember, your participation is voluntary. You may choose not to participate or to withdraw your consent and discontinue participation at any time. In clicking the arrow below, you are not waiving any legal claims, rights, or remedies. A copy of this consent form can be sent to you upon request. I have read the CONSENT FORM above and agree with all the terms and conditions. I acknowledge that by completing the survey, I am giving permission for the investigator to use my information for research purposes. ^^תיעוד הסכמה מדעת##461 לעיתים התיעוד, יש צורך בתיעוד הסכמותיהם של המשתתפים אולם,ככלל עומד בניגוד לדרישות המחקר,ובעיקר תיעוד מפורט הכולל שם ופרטי קשר אחרים בחלק מהמקרים קיים פטור משימוש.ובעיקר הדרישה לשמירה על אנונימיות הבוחנות, תצפיות הנעשות במקום ציבורי, כך למשל.בהסכמה מדעת ובתיעוד נלווה פטורות,התנהגות יום יומית של מש תתפים לא מזוהים שאינם מוכרים לחוקר במקומות שבהם חובה להבטיח הסכמה.במקרים רבים מהדרישה להסכמה מדעת , כאשר מדובר בטפסים, בחלק מהמקרים. נמצאו פתרונות שונים לסוגיה זו,מדעת משאר חלקי,יש הנוהגים להפריד בין דף ההסכמה מדעת הכולל פרטים אישיים .התיעוד של תגובות המשתתפים במקרים אחרים שבהם חיוני לקשור בין פרטי המשתתף לתגובותיו (כגון אפשר לבנות תהליכים שבהם כל,)במחקרים שבהם ניתנת אפשרות לבקש עזרה משתתף מזוהה באמצעות קוד אישי ורשימת הקודים ופרטי המשתתף הקשורים במחקרים, לדוגמה. חסויים והגישה לרשימה זו היא לגורם מוסמך בלבד,לקוד זה ניתן לכל ילד קוד,שערכנו בקרב ילדים לאחר חשיפה למלחמות בגליל ובעוטף עזה במהלך המחקר.אישי שנרשם אצל היועצות והעובדות הסוציאליות הרלוונטיות
Search
Read the Text Version
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- 139
- 140
- 141
- 142
- 143
- 144
- 145
- 146
- 147
- 148
- 149
- 150
- 151
- 152
- 153
- 154
- 155
- 156
- 157
- 158
- 159
- 160
- 161
- 162
- 163
- 164
- 165
- 166
- 167
- 168
- 169
- 170
- 171
- 172
- 173
- 174
- 175
- 176
- 177
- 178
- 179
- 180
- 181
- 182
- 183
- 184
- 185
- 186
- 187
- 188
- 189
- 190
- 191
- 192
- 193
- 194
- 195
- 196
- 197
- 198
- 199
- 200
- 201
- 202
- 203
- 204
- 205
- 206
- 207
- 208
- 209
- 210
- 211
- 212
- 213
- 214
- 215
- 216
- 217
- 218
- 219
- 220
- 221
- 222
- 223
- 224
- 225
- 226
- 227
- 228
- 229
- 230
- 231
- 232
- 233
- 234
- 235
- 236
- 237
- 238
- 239
- 240
- 241
- 242
- 243
- 244
- 245
- 246
- 247
- 248
- 249
- 250
- 251
- 252
- 253
- 254
- 255
- 256
- 257
- 258
- 259
- 260
- 261
- 262
- 263
- 264
- 265
- 266
- 267
- 268
- 269
- 270
- 271
- 272
- 273
- 274
- 275
- 276
- 277
- 278
- 279
- 280
- 281
- 282
- 283
- 284
- 285
- 286
- 287
- 288
- 289
- 290
- 291
- 292
- 293
- 294
- 295
- 296
- 297
- 298
- 299
- 300
- 301
- 302
- 303
- 304
- 305
- 306
- 307
- 308
- 309
- 310
- 311
- 312
- 313
- 314
- 315
- 316
- 317
- 318
- 319
- 320
- 321
- 322
- 323
- 324
- 325
- 326
- 327
- 328
- 329
- 330
- 331
- 332
- 333
- 334
- 335
- 336
- 337
- 338
- 339
- 340
- 341
- 342
- 343
- 344
- 345
- 346
- 347
- 348
- 349
- 350
- 351
- 352
- 353
- 354
- 355
- 356
- 357
- 358