ความถูกต้อง (สถิติ)
ความถูกต้องคือขอบเขตที่แนวคิดข้อสรุปหรือการวัดผลได้รับการยอมรับอย่างดีและมีแนวโน้มที่จะสอดคล้องกับโลกแห่งความเป็นจริงอย่างถูกต้อง [1] [2]คำว่า "valid" มาจากภาษาละติน validus แปลว่าแข็งแรง ความถูกต้องของเครื่องมือวัดผล (ตัวอย่างเช่นการทดสอบทางการศึกษา) คือระดับที่เครื่องมือใช้วัดสิ่งที่อ้างว่าวัดได้ [3]ความถูกต้องขึ้นอยู่กับความแข็งแกร่งของการรวบรวมหลักฐานประเภทต่างๆ (เช่นความถูกต้องของใบหน้าความถูกต้องของโครงสร้าง ฯลฯ ) ที่อธิบายไว้ในรายละเอียดเพิ่มเติมด้านล่าง
ในPsychometricsความถูกต้องมีแอปพลิเคชันเฉพาะที่เรียกว่าการทดสอบความถูกต้อง : "ระดับที่หลักฐานและทฤษฎีสนับสนุนการตีความคะแนนการทดสอบ" ("ตามที่นำเสนอโดยการใช้แบบทดสอบที่เสนอ") [4]
เป็นที่ยอมรับกันโดยทั่วไปว่าแนวคิดของการอยู่กับความถูกต้องทางวิทยาศาสตร์ธรรมชาติของความเป็นจริงในแง่ของมาตรการทางสถิติและเป็นเช่นนี้เป็นญาณวิทยาและปรัชญาปัญหาเช่นเดียวกับคำถามของวัด การใช้คำในตรรกะนั้นแคบกว่าซึ่งเกี่ยวข้องกับความสัมพันธ์ระหว่างสถานที่และข้อสรุปของการโต้แย้ง ในทางตรรกะความถูกต้องหมายถึงคุณสมบัติของการโต้แย้งโดยที่ถ้าสถานที่นั้นเป็นจริงความจริงของข้อสรุปจะตามมาด้วยความจำเป็น ข้อสรุปของอาร์กิวเมนต์เป็นจริงถ้าอาร์กิวเมนต์นั้นถูกต้องซึ่งจะบอกว่าอาร์กิวเมนต์นั้นถูกต้องหรือไม่ ในทางตรงกันข้าม "ความถูกต้องทางวิทยาศาสตร์หรือทางสถิติ" ไม่ใช่ข้อเรียกร้องแบบนิรนัยที่จำเป็นต้องรักษาความจริง แต่เป็นการอ้างแบบอุปนัยที่ยังคงเป็นจริงหรือเท็จในลักษณะที่ไม่สามารถตัดสินใจได้ นี่คือเหตุผลว่าทำไม "ความถูกต้องทางวิทยาศาสตร์หรือทางสถิติ" จึงเป็นคำกล่าวอ้างที่มีคุณสมบัติว่าแข็งแกร่งหรืออ่อนแอตามธรรมชาติจึงไม่จำเป็นและไม่เป็นความจริงอย่างแน่นอน สิ่งนี้มีผลทำให้การอ้าง "ความถูกต้องทางวิทยาศาสตร์หรือทางสถิติ" เปิดกว้างต่อการตีความว่าแท้จริงแล้วข้อเท็จจริงของเรื่องนั้นหมายถึงอะไร
ความถูกต้องเป็นสิ่งสำคัญเนื่องจากสามารถช่วยกำหนดประเภทของการทดสอบที่จะใช้และช่วยให้แน่ใจว่านักวิจัยกำลังใช้วิธีการที่ไม่เพียง แต่ถูกต้องตามหลักจริยธรรมและประหยัดต้นทุนเท่านั้น แต่ยังเป็นวิธีการที่วัดความคิดหรือโครงสร้างที่เป็นปัญหาได้อย่างแท้จริง
ทดสอบความถูกต้อง
ความถูกต้อง (ความถูกต้อง)
ความถูกต้อง[5]ของการประเมินคือระดับที่ใช้วัดสิ่งที่ควรจะวัด นี่ไม่เหมือนกับความน่าเชื่อถือซึ่งเป็นขอบเขตที่การวัดให้ผลลัพธ์ที่สอดคล้องกันมาก ภายในความถูกต้องการวัดไม่จำเป็นต้องใกล้เคียงกันเสมอไปเช่นเดียวกับความน่าเชื่อถือ อย่างไรก็ตามเนื่องจากการวัดมีความน่าเชื่อถือจึงไม่จำเป็นต้องถูกต้องเสมอไป เช่นเครื่องชั่งที่ลดลง 5 ปอนด์นั้นเชื่อถือได้ แต่ไม่ถูกต้อง การทดสอบไม่สามารถใช้ได้เว้นแต่จะเชื่อถือได้ ความถูกต้องยังขึ้นอยู่กับการวัดที่วัดสิ่งที่ออกแบบมาเพื่อวัดไม่ใช่อย่างอื่นแทน [6]ความถูกต้อง (คล้ายกับความน่าเชื่อถือ) เป็นแนวคิดที่สัมพันธ์กัน ความถูกต้องไม่ใช่ความคิดทั้งหมดหรือไม่มีเลย ความถูกต้องมีหลายประเภท
สร้างความถูกต้อง
ความถูกต้องของโครงสร้างหมายถึงขอบเขตที่การดำเนินงานของโครงสร้าง (เช่นการทดสอบภาคปฏิบัติที่พัฒนาจากทฤษฎี) วัดโครงสร้างตามที่กำหนดโดยทฤษฎี มันย่อยความถูกต้องประเภทอื่น ๆ ทั้งหมด ตัวอย่างเช่นขอบเขตที่การทดสอบวัดความฉลาดเป็นคำถามเกี่ยวกับความถูกต้องของโครงสร้าง การวัดความฉลาดจะถือว่าการวัดนั้นเกี่ยวข้องกับสิ่งที่ควรเชื่อมโยงด้วย ( ความถูกต้องแบบบรรจบกัน ) ไม่เกี่ยวข้องกับสิ่งที่ไม่ควรเชื่อมโยงด้วย ( ความถูกต้องแบบแยกแยะ ) [7]
สร้างหลักฐานความถูกต้องเกี่ยวข้องกับการสนับสนุนเชิงประจักษ์และเชิงทฤษฎีสำหรับการตีความโครงสร้าง บรรทัดของหลักฐานดังกล่าวรวมถึงการวิเคราะห์ทางสถิติของโครงสร้างภายในของการทดสอบรวมถึงความสัมพันธ์ระหว่างการตอบสนองต่อรายการทดสอบที่แตกต่างกัน นอกจากนี้ยังรวมถึงความสัมพันธ์ระหว่างการทดสอบและการวัดของโครงสร้างอื่น ๆ ตามที่เข้าใจในปัจจุบันความถูกต้องของโครงสร้างไม่แตกต่างจากการสนับสนุนสำหรับทฤษฎีที่สำคัญของโครงสร้างที่การทดสอบได้รับการออกแบบมาเพื่อวัด ด้วยเหตุนี้การทดลองที่ออกแบบมาเพื่อเปิดเผยแง่มุมของบทบาทเชิงสาเหตุของโครงสร้างจึงมีส่วนช่วยในการสร้างหลักฐานความถูกต้อง [7]
ความถูกต้องของเนื้อหา
ความตรงตามเนื้อหาเป็นประเภทของความถูกต้องที่ไม่ใช่ทางสถิติซึ่งเกี่ยวข้องกับ "การตรวจสอบเนื้อหาการทดสอบอย่างเป็นระบบเพื่อพิจารณาว่าครอบคลุมตัวอย่างที่เป็นตัวแทนของโดเมนพฤติกรรมที่จะวัดหรือไม่" (Anastasi & Urbina, 1997 หน้า 114) ตัวอย่างเช่นแบบสอบถาม IQ มีรายการที่ครอบคลุมทุกด้านของความฉลาดที่กล่าวถึงในวรรณกรรมทางวิทยาศาสตร์หรือไม่?
หลักฐานความถูกต้องของเนื้อหาเกี่ยวข้องกับระดับที่เนื้อหาของการทดสอบตรงกับโดเมนเนื้อหาที่เกี่ยวข้องกับโครงสร้าง ตัวอย่างเช่นการทดสอบความสามารถในการบวกตัวเลขสองตัวควรมีช่วงของตัวเลขผสมกัน การทดสอบที่มีตัวเลขเพียงหลักเดียวหรือตัวเลขคู่จะไม่ครอบคลุมโดเมนเนื้อหาที่ดี โดยทั่วไปแล้วหลักฐานที่เกี่ยวข้องกับเนื้อหาจะเกี่ยวข้องกับผู้เชี่ยวชาญด้านเนื้อหา (SME) ที่ประเมินรายการทดสอบเทียบกับข้อกำหนดการทดสอบ ก่อนที่จะดำเนินการจัดการแบบสอบถามขั้นสุดท้ายผู้วิจัยควรศึกษาความถูกต้องของรายการเทียบกับโครงสร้างหรือตัวแปรแต่ละตัวและปรับเปลี่ยนเครื่องมือวัดตามความเห็นของ SME
การทดสอบมีความถูกต้องของเนื้อหาในตัวโดยการเลือกรายการที่จะรวมไว้อย่างรอบคอบ (Anastasi & Urbina, 1997) เลือกรายการเพื่อให้สอดคล้องกับข้อกำหนดการทดสอบซึ่งร่างขึ้นโดยการตรวจสอบโดเมนหัวเรื่องอย่างละเอียด Foxcroft, Paterson, le Roux & Herbst (2004, p. 49) [8]โปรดทราบว่าการใช้คณะผู้เชี่ยวชาญเพื่อตรวจสอบข้อกำหนดการทดสอบและการเลือกรายการจะช่วยปรับปรุงความถูกต้องของเนื้อหาของแบบทดสอบได้ ผู้เชี่ยวชาญจะสามารถตรวจสอบรายการและแสดงความคิดเห็นว่ารายการนั้นครอบคลุมตัวอย่างที่เป็นตัวแทนของโดเมนพฤติกรรมหรือไม่
เผชิญกับความถูกต้อง
ความถูกต้องของใบหน้าคือการประมาณว่าการทดสอบดูเหมือนจะวัดเกณฑ์บางอย่างได้หรือไม่ ไม่รับประกันว่าการทดสอบจะวัดปรากฏการณ์ในโดเมนนั้นจริง มาตรการอาจมีความถูกต้องสูง แต่เมื่อการทดสอบไม่ได้วัดว่าคืออะไรก็มีความตรงตามใบหน้าต่ำ อันที่จริงเมื่อการทดสอบอาจมีการแกล้งทำ (malingering) ความถูกต้องของใบหน้าที่ต่ำอาจทำให้การทดสอบถูกต้องมากขึ้น เมื่อพิจารณาว่าอาจได้รับคำตอบที่ตรงไปตรงมามากกว่าโดยมีความถูกต้องของใบหน้าที่ต่ำกว่าบางครั้งก็เป็นสิ่งสำคัญที่จะต้องทำให้ดูเหมือนว่ามีความถูกต้องของใบหน้าต่ำในขณะที่ใช้มาตรการ
ความถูกต้องของใบหน้ามีความสัมพันธ์อย่างใกล้ชิดกับความถูกต้องของเนื้อหา ในขณะที่ความถูกต้องของเนื้อหาขึ้นอยู่กับพื้นฐานทางทฤษฎีในการตั้งสมมติฐานว่าการทดสอบกำลังประเมินโดเมนทั้งหมดของเกณฑ์ที่กำหนดหรือไม่ (เช่นการประเมินทักษะการบวกจะให้ผลในการวัดทักษะทางคณิตศาสตร์ที่ดีหรือไม่ในการตอบคำถามนี้คุณต้องรู้ทักษะทางคณิตศาสตร์ประเภทต่างๆ ทักษะทางคณิตศาสตร์รวมถึง) ความถูกต้องของใบหน้าเกี่ยวข้องกับการทดสอบที่ดูเหมือนจะเป็นการวัดที่ดีหรือไม่ การตัดสินนี้มีขึ้นที่ "ใบหน้า" ของการทดสอบดังนั้นจึงสามารถตัดสินได้โดยมือสมัครเล่น
ความถูกต้องของใบหน้าเป็นจุดเริ่มต้น แต่ไม่ควรสันนิษฐานว่าอาจถูกต้องตามวัตถุประสงค์ใด ๆ เนื่องจาก "ผู้เชี่ยวชาญ" เคยคิดผิดมาก่อน - Malleus Malificarum (Hammer of Witches) ไม่ได้รับการสนับสนุนสำหรับข้อสรุปอื่นใดนอกจากตัวเอง จินตนาการถึงความสามารถของ "ผู้เชี่ยวชาญ" สองคนใน "การตรวจจับคาถา" แต่มันก็ถูกใช้เป็น "การทดสอบ" เพื่อประณามและเผาที่เสาเข็มทั้งชายและหญิงนับหมื่นในฐานะ "แม่มด" [9]
ความถูกต้องตามเกณฑ์
หลักฐานความถูกต้องตามเกณฑ์เกี่ยวข้องกับความสัมพันธ์ระหว่างการทดสอบและตัวแปรเกณฑ์ (หรือตัวแปร) ที่ใช้เป็นตัวแทนของโครงสร้าง กล่าวอีกนัยหนึ่งคือเปรียบเทียบการทดสอบกับมาตรการหรือผลลัพธ์อื่น ๆ (เกณฑ์) ที่จัดขึ้นแล้วว่าใช้ได้ ตัวอย่างเช่นการทดสอบการคัดเลือกพนักงานมักได้รับการตรวจสอบเทียบกับการวัดผลงาน (เกณฑ์) และการทดสอบ IQ มักจะได้รับการตรวจสอบเทียบกับการวัดผลการเรียน (เกณฑ์)
หากข้อมูลการทดสอบและข้อมูลเกณฑ์ถูกรวบรวมในเวลาเดียวกันสิ่งนี้เรียกว่าหลักฐานความถูกต้องพร้อมกัน หากมีการรวบรวมข้อมูลการทดสอบก่อนเพื่อทำนายข้อมูลเกณฑ์ที่รวบรวมในเวลาต่อมาข้อมูลนี้จะเรียกว่าหลักฐานความถูกต้องเชิงทำนาย
ความถูกต้องพร้อมกัน
ความถูกต้องพร้อมกันหมายถึงระดับที่การดำเนินงานมีความสัมพันธ์กับมาตรการอื่น ๆ ของโครงสร้างเดียวกันที่วัดในเวลาเดียวกัน เมื่อเปรียบเทียบการวัดกับการวัดอื่นในประเภทเดียวกันจะมีความสัมพันธ์กัน (หรือสัมพันธ์กัน) กลับไปที่ตัวอย่างการทดสอบการคัดเลือกหมายความว่าการทดสอบนั้นได้รับการจัดการให้กับพนักงานปัจจุบันแล้วจึงมีความสัมพันธ์กับคะแนนของพวกเขาในการทบทวนผลงาน
ความถูกต้องของการคาดการณ์
ความตรงเชิงคาดการณ์หมายถึงระดับที่การดำเนินงานสามารถทำนาย (หรือสัมพันธ์กับ) มาตรการอื่น ๆ ของโครงสร้างเดียวกันที่วัดได้ในบางเวลาในอนาคต อีกครั้งด้วยตัวอย่างการทดสอบการคัดเลือกหมายความว่าการทดสอบจะดำเนินการให้กับผู้สมัครผู้สมัครทุกคนได้รับการว่าจ้างผลการปฏิบัติงานของพวกเขาจะได้รับการตรวจสอบในเวลาต่อมาจากนั้นคะแนนของพวกเขาในสองมาตรการจะมีความสัมพันธ์
นอกจากนี้เมื่อการวัดทำนายความสัมพันธ์ระหว่างสิ่งที่วัดกับสิ่งอื่น คาดการณ์ว่าสิ่งอื่นจะเกิดขึ้นในอนาคตหรือไม่ ความสัมพันธ์ที่สูงระหว่างผลลัพธ์ที่คาดการณ์ไว้กับอดีตที่คาดการณ์ไว้และผลลัพธ์ที่เกิดขึ้นจริงหลังการโพสต์เป็นหลักฐานยืนยันความถูกต้องที่แข็งแกร่งที่สุด
ความถูกต้องของการทดลอง
ความถูกต้องของการออกแบบของการศึกษาวิจัยทดลองเป็นส่วนพื้นฐานของวิธีการทางวิทยาศาสตร์ , [10]และความกังวลของจริยธรรมการวิจัย หากไม่มีการออกแบบที่ถูกต้องจะไม่สามารถสรุปข้อสรุปทางวิทยาศาสตร์ที่ถูกต้องได้
ความถูกต้องของข้อสรุปทางสถิติ
ความถูกต้องของข้อสรุปทางสถิติคือระดับที่ข้อสรุปเกี่ยวกับความสัมพันธ์ระหว่างตัวแปรตามข้อมูลนั้นถูกต้องหรือ 'สมเหตุสมผล' สิ่งนี้เริ่มต้นจากการที่ข้อสรุปทางสถิติเกี่ยวกับความสัมพันธ์ของตัวแปรนั้นถูกต้องหรือไม่ แต่ตอนนี้มีความเคลื่อนไหวในการเคลื่อนไปสู่ข้อสรุปที่ 'สมเหตุสมผล' ซึ่งใช้ข้อมูลเชิงปริมาณเชิงสถิติและเชิงคุณภาพ [11]
ความถูกต้องของข้อสรุปทางสถิติเกี่ยวข้องกับการใช้ขั้นตอนการสุ่มตัวอย่างที่เพียงพอการทดสอบทางสถิติที่เหมาะสมและขั้นตอนการวัดผลที่เชื่อถือได้ [12]เนื่องจากความถูกต้องประเภทนี้เกี่ยวข้องกับความสัมพันธ์ที่พบระหว่างตัวแปรเท่านั้นความสัมพันธ์อาจเป็นเพียงความสัมพันธ์เท่านั้น
ความถูกต้องภายใน
ความถูกต้องภายในเป็นการประมาณแบบอุปนัยของระดับที่สามารถสรุปเกี่ยวกับความสัมพันธ์เชิงสาเหตุได้ (เช่นเหตุและผล) โดยพิจารณาจากมาตรการที่ใช้การตั้งค่าการวิจัยและการออกแบบการวิจัยทั้งหมด เทคนิคการทดลองที่ดีซึ่งผลของตัวแปรอิสระที่มีต่อตัวแปรตามได้รับการศึกษาภายใต้สภาวะที่มีการควบคุมสูงมักจะอนุญาตให้มีระดับความถูกต้องภายในสูงกว่าตัวอย่างเช่นการออกแบบกรณีเดียว
ตัวแปรที่ทำให้สับสนแปดชนิดสามารถรบกวนความถูกต้องภายใน (กล่าวคือด้วยความพยายามที่จะแยกความสัมพันธ์เชิงสาเหตุ):
- ประวัติเหตุการณ์เฉพาะที่เกิดขึ้นระหว่างการวัดครั้งแรกและครั้งที่สองนอกเหนือจากตัวแปรการทดลอง
- การเจริญเติบโตกระบวนการภายในผู้เข้าร่วมเป็นหน้าที่ของกาลเวลา (ไม่เฉพาะเจาะจงกับเหตุการณ์ใดเหตุการณ์หนึ่ง) เช่นอายุมากขึ้นหิวโหยเหนื่อยมากขึ้นและอื่น ๆ
- การทดสอบผลของการทำแบบทดสอบต่อคะแนนของการทดสอบครั้งที่สอง
- เครื่องมือวัดการเปลี่ยนแปลงในการสอบเทียบเครื่องมือวัดหรือการเปลี่ยนแปลงของผู้สังเกตหรือผู้จดบันทึกอาจทำให้เกิดการเปลี่ยนแปลงในการวัดที่ได้รับ
- การถดถอยทางสถิติปฏิบัติการที่กลุ่มได้รับการคัดเลือกจากคะแนนสูงสุด
- การเลือกอคติที่เกิดจากการเลือกผู้ตอบแบบสอบถามที่แตกต่างกันสำหรับกลุ่มเปรียบเทียบ
- การตายจากการทดลองหรือการสูญเสียส่วนต่างของผู้ตอบแบบสอบถามจากกลุ่มเปรียบเทียบ
- ปฏิสัมพันธ์ระหว่างการเลือก - การเจริญเติบโตฯลฯ เช่นในการออกแบบกึ่งทดลองหลายกลุ่ม
ความถูกต้องภายนอก
ความถูกต้องภายนอกเกี่ยวข้องกับขอบเขตที่ผลการศึกษา (ใช้ได้ภายใน) สามารถถือได้ว่าเป็นจริงสำหรับกรณีอื่น ๆ เช่นกับบุคคลสถานที่หรือเวลาที่แตกต่างกัน กล่าวอีกนัยหนึ่งก็คือเกี่ยวกับว่าผลการวิจัยสามารถสรุปได้อย่างถูกต้องหรือไม่ หากมีการศึกษาวิจัยเดียวกันในกรณีอื่น ๆ จะได้ผลลัพธ์เหมือนกันหรือไม่?
ปัจจัยหลักในเรื่องนี้คือตัวอย่างการศึกษา (เช่นผู้เข้าร่วมการวิจัย) เป็นตัวแทนของประชากรทั่วไปตามมิติที่เกี่ยวข้องหรือไม่ ปัจจัยอื่น ๆ ที่เป็นอันตรายต่อความถูกต้องภายนอก ได้แก่ :
- ผลการตอบสนองหรือการโต้ตอบของการทดสอบการทดสอบก่อนเรียนอาจเพิ่มคะแนนในการทดสอบหลังเรียน
- ผลกระทบปฏิสัมพันธ์ของอคติและการเลือกตัวแปรทดลอง
- ผลกระทบเชิงปฏิกิริยาของการเตรียมการทดลองซึ่งจะขัดขวางการสรุปทั่วไปเกี่ยวกับผลกระทบของตัวแปรทดลองที่มีต่อบุคคลที่สัมผัสกับมันในสภาพแวดล้อมที่ไม่ใช่การทดลอง
- การรบกวนการรักษาหลายครั้งโดยที่ผลของการรักษาก่อนหน้านี้ไม่สามารถลบล้างได้
ความถูกต้องทางนิเวศวิทยา
ความถูกต้องทางนิเวศวิทยาคือขอบเขตที่ผลการวิจัยสามารถนำไปใช้กับสถานการณ์ในชีวิตจริงที่อยู่นอกการตั้งค่าการวิจัย ปัญหานี้เกี่ยวข้องอย่างใกล้ชิดกับความถูกต้องภายนอก แต่ครอบคลุมถึงคำถามที่ว่าผลการทดลองระดับใดสะท้อนให้เห็นถึงสิ่งที่สามารถสังเกตได้ในโลกแห่งความเป็นจริง (นิเวศวิทยา = ศาสตร์แห่งปฏิสัมพันธ์ระหว่างสิ่งมีชีวิตและสิ่งแวดล้อม) เพื่อให้ถูกต้องทางนิเวศวิทยาวิธีการวัสดุและการตั้งค่าของการศึกษาจะต้องประมาณสถานการณ์ในชีวิตจริงที่อยู่ระหว่างการตรวจสอบ
ความถูกต้องทางนิเวศวิทยาส่วนหนึ่งเกี่ยวข้องกับประเด็นของการทดลองเทียบกับการสังเกต โดยทั่วไปในทางวิทยาศาสตร์มีการวิจัยอยู่สองประเภท: เชิงสังเกต (เชิงรับ) และการทดลอง (ใช้งานอยู่) จุดประสงค์ของการออกแบบการทดลองคือการทดสอบความเป็นเหตุเป็นผลเพื่อให้คุณสามารถสรุปได้ว่า A สาเหตุ B หรือ B ทำให้เกิด A แต่บางครั้งข้อ จำกัด ทางจริยธรรมและ / หรือวิธีการป้องกันไม่ให้คุณทำการทดลอง (เช่นการแยกตัวมีผลต่อการทำงานของความรู้ความเข้าใจของเด็กอย่างไร) . จากนั้นคุณยังสามารถทำการวิจัยได้ แต่ไม่ใช่สาเหตุ แต่เป็นความสัมพันธ์ คุณสามารถสรุปได้ว่า A เกิดขึ้นพร้อมกับ B เทคนิคทั้งสองมีจุดแข็งและจุดอ่อน
ความสัมพันธ์กับความถูกต้องภายใน
เมื่อมองแวบแรกความถูกต้องภายในและภายนอกดูเหมือนจะขัดแย้งกัน - เพื่อให้ได้รูปแบบการทดลองที่คุณต้องควบคุมตัวแปรรบกวนทั้งหมด นั่นคือเหตุผลที่คุณทำการทดลองในห้องปฏิบัติการบ่อยครั้ง ในขณะที่ได้รับความถูกต้องภายใน (ยกเว้นตัวแปรรบกวนโดยการรักษาให้คงที่) คุณสูญเสียความถูกต้องทางนิเวศวิทยาหรือภายนอกเนื่องจากคุณสร้างการตั้งค่าห้องปฏิบัติการเทียม ในทางกลับกันด้วยการวิจัยเชิงสังเกตคุณไม่สามารถควบคุมตัวแปรรบกวนได้ (ความถูกต้องภายในต่ำ) แต่คุณสามารถวัดได้ในสภาพแวดล้อมตามธรรมชาติ (ระบบนิเวศ) ณ สถานที่ที่พฤติกรรมปกติเกิดขึ้น อย่างไรก็ตามในการทำเช่นนั้นคุณต้องเสียสละความถูกต้องภายใน
อย่างไรก็ตามความขัดแย้งที่ชัดเจนของความถูกต้องภายในและความถูกต้องภายนอกเป็นเพียงผิวเผิน คำถามที่ว่าผลจากการศึกษาโดยเฉพาะอย่างยิ่งคุยกับคนอื่น ๆ สถานที่หรือเวลาที่เกิดขึ้นเฉพาะเมื่อหนึ่งดังต่อไปนี้กลยุทธ์การวิจัย inductivist หากเป้าหมายของการศึกษาคือการทดสอบทฤษฎีแบบนิรนัยสิ่งหนึ่งที่เกี่ยวข้องกับปัจจัยที่อาจทำลายความเข้มงวดของการศึกษานั่นคือภัยคุกคามต่อความถูกต้องภายใน กล่าวอีกนัยหนึ่งความเกี่ยวข้องของความถูกต้องภายนอกและภายในกับการศึกษาวิจัยขึ้นอยู่กับเป้าหมายของการศึกษา นอกจากนี้การกำหนดเป้าหมายการวิจัยร่วมกับข้อกังวลเกี่ยวกับความถูกต้องอาจนำไปสู่ปัญหาความถูกต้องภายในร่วมกันโดยที่ทฤษฎีสามารถอธิบายได้เฉพาะปรากฏการณ์ในการตั้งค่าห้องปฏิบัติการเทียมเท่านั้น แต่ไม่ใช่ในโลกแห่งความเป็นจริง [13] [14]
ความถูกต้องในการวินิจฉัย
ในจิตเวชมีปัญหาเฉพาะในการประเมินความถูกต้องของประเภทการวินิจฉัยด้วยตนเอง ในบริบทนี้: [15]
- ความถูกต้องของเนื้อหาอาจหมายถึงอาการและเกณฑ์การวินิจฉัย
- ความถูกต้องที่เกิดขึ้นพร้อมกันอาจถูกกำหนดโดยความสัมพันธ์หรือเครื่องหมายต่างๆและบางทียังตอบสนองต่อการรักษาด้วย
- ความถูกต้องในการทำนายอาจหมายถึงความเสถียรในการวินิจฉัยเมื่อเวลาผ่านไป
- ความถูกต้องของการเลือกปฏิบัติอาจเกี่ยวข้องกับการเบี่ยงเบนจากความผิดปกติอื่น ๆ
Robins and Guze เสนอในปี 1970 ว่าอะไรจะกลายเป็นเกณฑ์ทางการที่มีอิทธิพลในการกำหนดความถูกต้องของการวินิจฉัยทางจิตเวช พวกเขาระบุห้าเกณฑ์: [15]
- คำอธิบายทางคลินิกที่แตกต่างกัน (รวมถึงลักษณะอาการลักษณะทางประชากรและสารตกตะกอนทั่วไป)
- การศึกษาในห้องปฏิบัติการ (รวมถึงการทดสอบทางจิตวิทยารังสีวิทยาและผลการชันสูตรพลิกศพ)
- การแยกออกจากความผิดปกติอื่น ๆ (โดยใช้เกณฑ์การยกเว้น)
- การศึกษาติดตามผลที่แสดงหลักสูตรลักษณะเฉพาะ (รวมถึงหลักฐานความเสถียรในการวินิจฉัย)
- การศึกษาครอบครัวแสดงการรวมกลุ่มกันในครอบครัว
สิ่งเหล่านี้รวมอยู่ในเกณฑ์ Feighnerและเกณฑ์การวินิจฉัยการวิจัยซึ่งนับเป็นพื้นฐานของระบบการจำแนก DSM และ ICD
Kendler ในปี 1980 แตกต่างระหว่าง: [15]
- ตัวตรวจสอบความถูกต้องก่อนหน้านี้ (การรวมตัวของครอบครัวบุคลิกภาพก่อนกำหนดและปัจจัยการตกตะกอน)
- ผู้ตรวจสอบความถูกต้องพร้อมกัน (รวมถึงการทดสอบทางจิตวิทยา)
- ตัวตรวจสอบการคาดการณ์ (ความสม่ำเสมอในการวินิจฉัยเมื่อเวลาผ่านไปอัตราการกำเริบของโรคและการฟื้นตัวและการตอบสนองต่อการรักษา)
Nancy Andreasen (1995) ระบุตัวตรวจสอบความถูกต้องเพิ่มเติมหลายตัว ได้แก่อณูพันธุศาสตร์และอณูชีววิทยา , ประสาทเคมี , ประสาทวิทยา , ประสาทสรีรวิทยาและประสาทวิทยาทางปัญญา - ซึ่งทั้งหมดนี้อาจเชื่อมโยงอาการและการวินิจฉัยกับสารตั้งต้นของระบบประสาทได้ [15]
Kendell และ Jablinsky (2003) เน้นย้ำถึงความสำคัญของการแยกแยะระหว่างความถูกต้องและอรรถประโยชน์และเป็นที่ถกเถียงกันอยู่ว่าประเภทการวินิจฉัยที่กำหนดโดยกลุ่มอาการของพวกเขาควรได้รับการพิจารณาว่าถูกต้องก็ต่อเมื่อแสดงว่าเป็นหน่วยงานที่ไม่ต่อเนื่องโดยมีขอบเขตตามธรรมชาติที่แยกพวกมันออกจากความผิดปกติอื่น ๆ [15]
Kendler (2006) เน้นย้ำว่าเพื่อเป็นประโยชน์เกณฑ์การตรวจสอบความถูกต้องจะต้องมีความละเอียดอ่อนเพียงพอที่จะตรวจสอบกลุ่มอาการส่วนใหญ่ที่เป็นความผิดปกติที่แท้จริงในขณะเดียวกันก็มีความเฉพาะเจาะจงเพียงพอที่จะทำให้กลุ่มอาการส่วนใหญ่เป็นโมฆะซึ่งไม่ใช่ความผิดปกติที่แท้จริง บนพื้นฐานนี้เขาระบุว่าเกณฑ์ของ Robins และ Guze ของ "การทำงานในครอบครัว" มีความเฉพาะเจาะจงไม่เพียงพอเนื่องจากลักษณะทางจิตใจและร่างกายของมนุษย์ส่วนใหญ่มีคุณสมบัติเช่นกลุ่มอาการโดยพลการซึ่งประกอบด้วย "ความสูงมากกว่า 6 ฟุตผมสีแดง และจมูกขนาดใหญ่ "จะพบว่า" ทำงานในครอบครัว "และเป็น" กรรมพันธุ์ "แต่สิ่งนี้ไม่ควรถือเป็นหลักฐานว่าเป็นความผิดปกติ Kendler ได้เสนอแนะเพิ่มเติมว่าแบบจำลองยีน " Essentialist " ของโรคทางจิตเวชและความหวังว่าเราจะสามารถตรวจสอบการวินิจฉัยทางจิตเวชโดย "แกะสลักธรรมชาติที่ข้อต่อ" ซึ่งเป็นผลจากการค้นพบยีนเพียงอย่างเดียวนั้นไม่น่าเป็นไปได้ [16]
ในความถูกต้องสหรัฐอเมริกาศาลรัฐบาลกลางของระบบและความน่าเชื่อถือของหลักฐานที่ได้รับการประเมินโดยใช้เบิร์ทมาตรฐาน: เห็น. เบิร์ทวี Merrell Dow ยา Perri และ Lichtenwald (2010) เป็นจุดเริ่มต้นสำหรับการอภิปรายเกี่ยวกับหัวข้อที่น่าเชื่อถือและความถูกต้องที่หลากหลายในการวิเคราะห์ความเชื่อมั่นในการฆาตกรรมที่ผิดพลาด [17]
ดูสิ่งนี้ด้วย
- ทุกรุ่นผิดหมด
- ความถูกต้องพร้อมกัน
- ความถูกต้องของเนื้อหา
- สร้างความถูกต้อง
- การตรวจสอบความถูกต้องข้ามกัน (สถิติ)
- ความถูกต้องภายนอก
- เผชิญกับความถูกต้อง
- ความถูกต้องภายใน
- ความถูกต้องของการคาดการณ์
- การตรวจสอบแบบจำลองการถดถอย
- ความถูกต้องของข้อสรุปทางสถิติ
- การตรวจสอบโมเดลทางสถิติ
- ความถูกต้อง (ตรรกะ)
- มาตราส่วนที่ถูกต้อง
- การตรวจสอบความถูกต้อง (disambiguation)
- ความไวและความจำเพาะ
อ้างอิง
- ^ Brain, Willnat, Manheim, Rich 2011. การวิเคราะห์การเมืองเชิงประจักษ์พิมพ์ครั้งที่ 8. บอสตันแมสซาชูเซตส์: Longman p. 105
- ^ แคมป์เบล, โดนัลด์ตัน (1957) "ปัจจัยที่เกี่ยวข้องกับความถูกต้องของการทดลองในการตั้งค่าทางสังคม" จิตวิทยา Bulletin 54 (4): 297–312 ดอย : 10.1037 / h0040950 . ISSN 1939-1455
- ^ ตวัดทรูแมนลี (2470) แปลความหมายของการวัดการศึกษา ยองเกอร์สออนฮัดสันนิวยอร์ก: บริษัท หนังสือโลก น. 14.
ปัญหาของความถูกต้องคือการทดสอบวัดสิ่งที่ตั้งใจจะวัดจริงๆหรือไม่ ...
- ^ สมาคมวิจัยการศึกษาอเมริกันสมาคมจิตวิทยาและสภาแห่งชาติด้านการวัดผลทางการศึกษา (2542). มาตรฐานการศึกษาและการทดสอบทางจิตวิทยา วอชิงตันดีซี: สมาคมวิจัยการศึกษาแห่งสหรัฐอเมริกา
- ^ สภาแห่งชาติว่าด้วยการวัดผลทางการศึกษา http://www.ncme.org/ncme/NCME/Resource_Center/Glossary/NCME/Resource_Center/Glossary1.aspx?hkey=4bb87415-44dc-4088-9ed9-e8515326a061#anchorV
- ^ เครเมอเจฟฟรีย์พีดักลาสเอสเตนและวิกกี้ Phares ความรู้เบื้องต้นเกี่ยวกับจิตวิทยาคลินิก. 7th ed. Upper Saddle River, NJ: Pearson Prentice Hall, 2009. พิมพ์
- ^ ก ข ครอนบาค, ลีเจ.; มีห์ล, พอลอี. (2498). "ความเที่ยงตรงเชิงโครงสร้างในการทดสอบทางจิตวิทยา" จิตวิทยา Bulletin 52 (4): 281–302 ดอย : 10.1037 / h0040957 . hdl : 11299/184279 . ISSN 0033-2909 PMID 13245896 S2CID 5312179
- ^ Foxcroft ซีแพ็ตเตอร์สัน, เอช, le Roux เอ็นและ Herbst, D. มนุษยศาสตร์คณะกรรมการวิจัย (2004) 'การประเมินทางจิตวิทยาในแอฟริกาใต้: การวิเคราะห์ความต้องการ: รูปแบบการใช้การทดสอบและความต้องการของผู้ปฏิบัติงานการประเมินทางจิตวิทยา: รายงานฉบับสุดท้าย: เมษายน สืบค้นจากเว็บไซต์: http://www.hsrc.ac.za/research/output/outputDocuments/1716_Foxcroft_Psychologicalassessmentin%20SA.pdf
- ^ การประมาณการที่พบบ่อยที่สุดคือการเสียชีวิตระหว่าง 40,000 ถึง 60,000 คน Brian Levack ( The Witch Hunt in Early Modern Europe ) ทวีคูณจำนวนการทดลองแม่มดในยุโรปที่เป็นที่รู้จักด้วยอัตราเฉลี่ยของความเชื่อมั่นและการประหารชีวิตเพื่อให้ได้ตัวเลขผู้เสียชีวิตประมาณ 60,000 คน Anne Lewellyn Barstow ( Witchcraze ) ได้ปรับประมาณการของ Levack ให้เป็นบัญชีสำหรับบันทึกที่หายไปโดยคาดว่าจะมีผู้เสียชีวิต 100,000 คน Ronald Hutton ( Triumph of the Moon ) ให้เหตุผลว่าการคาดการณ์ของ Levack ได้รับการปรับเปลี่ยนสำหรับสิ่งเหล่านี้แล้วและแก้ไขตัวเลขเป็นประมาณ 40,000
- ^ แคมป์เบลล์โดนัลด์ที. (2500). "ปัจจัยที่เกี่ยวข้องกับความถูกต้องของการทดลองในการตั้งค่าทางสังคม" จิตวิทยา Bulletin 54 (4): 297–312 ดอย : 10.1037 / h0040950 . ISSN 1939-1455
- ^ Cozby, Paul C. วิธีการในการวิจัยพฤติกรรม. ฉบับที่ 10 บอสตัน: การศึกษาระดับอุดมศึกษา McGraw-Hill, 2552. พิมพ์.
- ^ Jonathan Javid (6 พฤศจิกายน 2558). "ความถูกต้องของการวัดและความน่าเชื่อถือ" . slideshare.net สืบค้นเมื่อ23 มีนาคม 2561 .
- ^ หลินเฮาส์; เวอร์เนอร์ Kaitlyn M.; Inzlicht, Michael (2021-02-16) "สัญญาและภัยของการทดลองการร่วมกันภายใน-ตั้งแต่วันที่ปัญหา" มุมมองเกี่ยวกับวิทยาศาสตร์ทางจิตวิทยา : 1745691620974773. ดอย : 10.1177 / 1745691620974773 ISSN 1745-6916
- ^ Schram, Arthur (2548-06-01). "ยศ: ความตึงเครียดระหว่างความถูกต้องภายในและภายนอกในการทดลองทางเศรษฐกิจ" วารสารระเบียบวิธีเศรษฐศาสตร์ . 12 (2): 225–237 ดอย : 10.1080 / 13501780500086081 . ISSN 1350-178X .
- ^ a b c d e เคนเดลล์, R; Jablensky, A (2003). "การแยกแยะระหว่างความถูกต้องและประโยชน์ของการวินิจฉัยทางจิตเวช". อเมริกันวารสารจิตเวช 160 (1): 4–12. ดอย : 10.1176 / appi.ajp.160.1.4 . PMID 12505793
- ^ เคนด์เลอร์, แคนซัส (2549). "ภาพสะท้อนความสัมพันธ์ระหว่างพันธุศาสตร์จิตเวชกับโรคทางจิตเวชทางจิตเวช". อเมริกันวารสารจิตเวช 163 (7): 1138–46. ดอย : 10.1176 / appi.ajp.163.7.1138 . PMID 16816216
- ^ Perri, FS; Lichtenwald, TG (2010). "ล่อแหลมใช้จิตวิทยานิติเวชเป็นหลักฐาน: ทิโมธีโทกรณี" (PDF) นิตยสาร Champion (กรกฎาคม): 34–45.
อ่านเพิ่มเติม
- ครอนบาค, แอลเจ; Meehl, PE (1955), "สร้างความถูกต้องในการทดสอบทางจิตวิทยา" , Psychological Bulletin , 52 (4): 281–302, doi : 10.1037 / h0040957 , hdl : 11299/184279 , PMID 13245896
- รัปป์, AA; Pant, HA (2007), "Validity theory" ใน Salkind, Neil J. (ed.), Encyclopedia of Measurement and Statistics , SAGE Publishing