ไซโคเมทริก
psychometricsเป็นสาขาวิชาที่เกี่ยวข้องกับทฤษฎีและเทคนิคของการเป็นจิตวิทยา การวัด ตามที่กำหนดโดย US National Council on Measurement in Education (NCME) Psychometrics หมายถึงการวัดทางจิตวิทยา โดยทั่วไปจะหมายถึงสาขาผู้เชี่ยวชาญด้านจิตวิทยาและการศึกษาที่อุทิศให้กับการทดสอบการวัดการประเมินและกิจกรรมที่เกี่ยวข้อง [1]
ข้อมูลที่เกี่ยวข้องกับวัตถุประสงค์การวัดทักษะและความรู้ความสามารถทัศนคติบุคลิกภาพ , โครงสร้างทางคลินิกและความผิดปกติทางจิตเช่นเดียวกับผลสัมฤทธิ์ทางการศึกษา นักวิจัยบางคน psychometric มุ่งเน้นไปที่การก่อสร้างและการตรวจสอบของเครื่องมือการประเมินเช่นแบบสอบถาม , การทดสอบ , การตัดสินผู้ประเมิน, เครื่องชั่งน้ำหนักอาการทางจิตวิทยาและการทดสอบบุคลิกภาพ อื่น ๆ มุ่งเน้นการวิจัยที่เกี่ยวข้องกับทฤษฎีวัด (เช่นทฤษฎีการตอบสนองข้อสอบ ; สัมพันธ์ intraclass )
นักปฏิบัติถูกอธิบายว่าเป็นนักจิตวิทยา Psychometricians มักจะมีคุณสมบัติเฉพาะและส่วนใหญ่เป็นนักจิตวิทยาที่มีการฝึกอบรมระดับบัณฑิตศึกษาขั้นสูง นอกเหนือจากสถาบันการศึกษาแบบดั้งเดิมแล้วนักจิตศาสตร์หลายคนยังทำงานให้กับรัฐบาลหรือในหน่วยงานทรัพยากรมนุษย์ อื่น ๆ มีความเชี่ยวชาญเป็นการเรียนรู้และการพัฒนามืออาชีพ
รากฐานทางประวัติศาสตร์
การทดสอบทางจิตวิทยาได้มาจากสองกระแสของความคิด: ครั้งแรกจากดาร์วิน , GaltonและCattellการวัดความแตกต่างของแต่ละบุคคลและที่สองจากHerbart , Weber , FechnerและWundtและการวัดจิตของพวกเขาสร้างที่คล้ายกัน บุคคลชุดที่สองและการวิจัยของพวกเขาคือสิ่งที่นำไปสู่การพัฒนาจิตวิทยาการทดลองและการทดสอบมาตรฐาน [2]
กระแสวิคตอเรีย
Charles Darwin เป็นแรงบันดาลใจเบื้องหลังเซอร์ฟรานซิสกัลตันที่นำไปสู่การสร้างไซโครเมทริก ในปีพ. ศ. 2402 ดาร์วินได้ตีพิมพ์หนังสือของเขาเรื่องต้นกำเนิดของสปีชีส์ซึ่งอุทิศให้กับบทบาทของการคัดเลือกโดยธรรมชาติในการเกิดขึ้นตามช่วงเวลาของจำนวนพืชและสัตว์ชนิดต่างๆ หนังสือเล่มนี้กล่าวถึงความแตกต่างของสมาชิกแต่ละชนิดของสิ่งมีชีวิตและลักษณะที่ปรับตัวเข้ากับสภาพแวดล้อมได้มากหรือน้อย ผู้ที่มีลักษณะการปรับตัวมากกว่ามีแนวโน้มที่จะให้กำเนิดและก่อให้เกิดคนรุ่นอื่น ผู้ที่มีลักษณะปรับตัวน้อยมีโอกาสน้อยที่จะให้กำเนิด ความคิดนี้กระตุ้นความสนใจของ Galton ในการศึกษาเกี่ยวกับมนุษย์และความแตกต่างจากสิ่งอื่นและที่สำคัญกว่านั้นคือจะวัดความแตกต่างเหล่านั้นได้อย่างไร
กัลตันเขียนหนังสือชื่อHereditary Geniusเกี่ยวกับลักษณะต่างๆที่ผู้คนมีและลักษณะเหล่านั้นทำให้พวกเขา "พอดี" มากกว่าคนอื่น ๆ อย่างไร ปัจจุบันความแตกต่างเหล่านี้เช่นการทำงานของประสาทสัมผัสและการเคลื่อนไหว (เวลาตอบสนองการมองเห็นและความแข็งแรงทางกายภาพ) เป็นโดเมนที่สำคัญของจิตวิทยาวิทยาศาสตร์ มากของการทำงานในช่วงต้นของทฤษฎีและการประยุกต์ใช้ใน psychometrics ได้ดำเนินการในความพยายามที่จะวัดปัญญา กัลตันมักเรียกกันว่า "บิดาแห่งไซโครเมทริก" วางแผนและรวมการทดสอบทางจิตไว้ในมาตรการทางมานุษยวิทยาของเขา James McKeen Cattell ซึ่งถือเป็นผู้บุกเบิกไซโครเมทริกได้ขยายผลงานของ Galton Cattell ยังบัญญัติศัพท์การทดสอบจิตและรับผิดชอบในการวิจัยและความรู้ซึ่งนำไปสู่การพัฒนาการทดสอบสมัยใหม่ในที่สุด [3]
กระแสเยอรมัน
ต้นกำเนิดของ psychometrics นอกจากนี้ยังมีการเชื่อมต่อไปยังสาขาที่เกี่ยวข้องของpsychophysics ในช่วงเวลาเดียวกันกับที่ดาร์วินกัลตันและแคทเทลกำลังทำการค้นพบ Herbart ก็สนใจที่จะ "ไขปริศนาแห่งจิตสำนึกของมนุษย์" ด้วยวิธีการทางวิทยาศาสตร์ [3] Herbart รับผิดชอบในการสร้างแบบจำลองทางคณิตศาสตร์ของจิตใจซึ่งมีอิทธิพลต่อแนวปฏิบัติทางการศึกษาในอีกไม่กี่ปีข้างหน้า
EH Weber สร้างขึ้นจากผลงานของ Herbart และพยายามพิสูจน์การมีอยู่ของเกณฑ์ทางจิตวิทยาโดยกล่าวว่าจำเป็นต้องมีสิ่งกระตุ้นขั้นต่ำเพื่อกระตุ้นระบบประสาทสัมผัส หลังจากเวเบอร์ GT Fechner ได้ขยายความรู้ที่เขารวบรวมมาจาก Herbart และ Weber เพื่อคิดค้นกฎที่ว่าความแข็งแกร่งของความรู้สึกจะเพิ่มขึ้นเมื่อลอการิทึมของความเข้มของการกระตุ้น Wilhelm Wundt ผู้ติดตามของ Weber and Fechner ได้รับเครดิตจากการก่อตั้งศาสตร์แห่งจิตวิทยา เป็นอิทธิพลของ Wundt ที่ปูทางให้ผู้อื่นพัฒนาการทดสอบทางจิตวิทยา [3]
ศตวรรษที่ 20
ในปีพ. ศ. 2479 นักจิตวิทยาLL Thurstoneผู้ก่อตั้งและประธานคนแรกของ Psychometric Society ได้พัฒนาและใช้แนวทางเชิงทฤษฎีในการวัดที่เรียกว่ากฎแห่งการตัดสินเปรียบเทียบซึ่งเป็นแนวทางที่มีความเชื่อมโยงอย่างใกล้ชิดกับทฤษฎีทางจิตฟิสิกส์ของErnst Heinrich WeberและGustav Fechner . นอกจากนี้ Spearman และ Thurstone ต่างมีส่วนร่วมสำคัญในทฤษฎีและการประยุกต์ใช้การวิเคราะห์ปัจจัยซึ่งเป็นวิธีการทางสถิติที่พัฒนาและใช้กันอย่างแพร่หลายใน Psychometrics [ ต้องการอ้างอิง ]ในช่วงปลายทศวรรษ 1950 Leopold Szondiได้ทำการประเมินทางประวัติศาสตร์และญาณวิทยาเกี่ยวกับผลกระทบของการคิดเชิงสถิติที่มีต่อจิตวิทยาในช่วงไม่กี่ทศวรรษก่อนหน้านี้: "ในช่วงหลายทศวรรษที่ผ่านมาความคิดเชิงจิตวิทยาโดยเฉพาะได้ถูกระงับและลบออกไปเกือบทั้งหมดและถูกแทนที่ โดยการคิดเชิงสถิติเราเห็นมะเร็งของอัณฑะวิทยาและฮอร์โมนเพศชายในปัจจุบันอย่างแม่นยำ " [4]
เมื่อเร็ว ๆ นี้ทฤษฎีทางจิตวิทยาได้ถูกนำมาใช้ในการวัดบุคลิกภาพ , ทัศนคติและความเชื่อและผลสัมฤทธิ์ทางการเรียน การวัดปรากฏการณ์ที่ไม่สามารถสังเกตได้เหล่านี้เป็นเรื่องยากและงานวิจัยและศาสตร์สะสมส่วนใหญ่ในสาขาวิชานี้ได้รับการพัฒนาขึ้นเพื่อพยายามกำหนดและหาปริมาณปรากฏการณ์ดังกล่าวอย่างเหมาะสม นักวิจารณ์รวมถึงผู้ปฏิบัติงานด้านวิทยาศาสตร์กายภาพและนักเคลื่อนไหวทางสังคมได้โต้แย้งว่าคำจำกัดความและการหาปริมาณดังกล่าวเป็นไปไม่ได้ยากและการวัดดังกล่าวมักถูกนำไปใช้ในทางที่ผิดเช่นการทดสอบบุคลิกภาพแบบไซโครเมตริกที่ใช้ในขั้นตอนการจ้างงาน:
- "ตัวอย่างเช่นนายจ้างต้องการใครสักคนสำหรับบทบาทที่ต้องให้ความสนใจอย่างสม่ำเสมอในรายละเอียดซ้ำ ๆ อาจจะไม่ต้องการมอบงานนั้นให้กับคนที่มีความคิดสร้างสรรค์และเบื่อง่าย" [5]
ตัวเลขที่ได้มีส่วนร่วมสำคัญในการ psychometrics รวมถึงคาร์ลเพียร์สัน , เฮนรี่เอฟไกเซอร์คาร์บริกแฮม , LL Thurstone , EL Thorndike , เฟรดริก Rasch , ยู Galanter , จอห์นสันโอคอนเนอร์ , เฟรเดริกพระเจ้าเมตร , Ledyard R ทักเคอร์และเจนเลอวิงเจอร์
ความหมายของการวัดในสังคมศาสตร์
ความหมายของการวัดในสังคมศาสตร์มีประวัติอันยาวนาน คำจำกัดความที่แพร่หลายในปัจจุบันเสนอโดยStanley Smith Stevens (1946) คือการวัดคือ "การกำหนดตัวเลขให้กับวัตถุหรือเหตุการณ์ตามกฎเกณฑ์บางประการ" คำนิยามนี้เป็นที่รู้จักในกระดาษที่สตีเว่นนำเสนอสี่ระดับของการวัด แม้ว่าจะมีการใช้กันอย่างแพร่หลาย แต่คำจำกัดความนี้ก็มีความแตกต่างในแง่ที่สำคัญจากคำจำกัดความคลาสสิกของการวัดที่นำมาใช้ในวิทยาศาสตร์กายภาพกล่าวคือการวัดทางวิทยาศาสตร์หมายถึง "การประมาณหรือการค้นพบอัตราส่วนของขนาดของคุณลักษณะเชิงปริมาณบางส่วนต่อหน่วยของคุณลักษณะเดียวกัน "(น. 358) [6]
อันที่จริงคำจำกัดความของการวัดผลของสตีเวนส์ถูกนำมาใช้เพื่อตอบสนองต่อคณะกรรมการเฟอร์กูสันของอังกฤษซึ่งมีประธานอ. เฟอร์กูสันเป็นนักฟิสิกส์ คณะกรรมการได้รับการแต่งตั้งในปีพ. ศ. 2475 โดย British Association for the Advancement of Science เพื่อตรวจสอบความเป็นไปได้ในการประมาณค่าเหตุการณ์ทางประสาทสัมผัสในเชิงปริมาณ แม้ว่าเก้าอี้และสมาชิกคนอื่น ๆ จะเป็นนักฟิสิกส์ แต่คณะกรรมการยังรวมถึงนักจิตวิทยาหลายคนด้วย รายงานของคณะกรรมการได้เน้นถึงความสำคัญของคำจำกัดความของการวัด ในขณะที่คำตอบของสตีเวนส์คือการเสนอคำจำกัดความใหม่ซึ่งมีอิทธิพลอย่างมากในสนาม แต่ก็ไม่ได้เป็นการตอบสนองต่อรายงานเพียงอย่างเดียว อีกประการหนึ่งที่แตกต่างกันโดยเฉพาะการตอบสนองคือการยอมรับคำจำกัดความแบบคลาสสิกดังที่แสดงในข้อความต่อไปนี้:
- การวัดทางจิตวิทยาและฟิสิกส์ไม่แตกต่างกัน นักฟิสิกส์สามารถวัดได้ว่าพวกเขาสามารถค้นหาการดำเนินการที่พวกเขาอาจเป็นไปตามเกณฑ์ที่จำเป็นเมื่อใด นักจิตวิทยามี แต่จะทำเช่นเดียวกัน พวกเขาไม่จำเป็นต้องกังวลเกี่ยวกับความแตกต่างที่ลึกลับระหว่างความหมายของการวัดในสองศาสตร์นี้ (Reese, 1943, p. 49) [7]
คำตอบที่แตกต่างเหล่านี้สะท้อนให้เห็นในแนวทางอื่นในการวัดผล ตัวอย่างเช่นโดยทั่วไปวิธีการที่ใช้เมทริกซ์ความแปรปรวนร่วมมักจะใช้บนสมมติฐานที่ว่าตัวเลขเช่นคะแนนดิบที่ได้จากการประเมินเป็นการวัด แนวทางดังกล่าวทำให้เกิดนิยามของการวัดผลของสตีเวนส์โดยปริยายซึ่งกำหนดให้ตัวเลขนั้นถูกกำหนดตามกฎบางข้อเท่านั้น ดังนั้นงานวิจัยหลักโดยทั่วไปถือว่าเป็นการค้นพบความสัมพันธ์ระหว่างคะแนนและปัจจัยที่เป็นปัจจัยหนุนความสัมพันธ์ดังกล่าว [8]
ในทางกลับกันเมื่อใช้โมเดลการวัดเช่นโมเดล Raschตัวเลขจะไม่ถูกกำหนดตามกฎ แต่เพื่อให้สอดคล้องกับคำแถลงของ Reese ข้างต้นจะมีการระบุเกณฑ์เฉพาะสำหรับการวัดผลและเป้าหมายคือการสร้างขั้นตอนหรือการดำเนินงานที่ให้ข้อมูลที่ตรงตามเกณฑ์ที่เกี่ยวข้อง การวัดจะประมาณตามแบบจำลองและทำการทดสอบเพื่อให้แน่ใจว่าตรงตามเกณฑ์ที่เกี่ยวข้องหรือไม่ [ ต้องการอ้างอิง ]
เครื่องมือและขั้นตอน
ครั้งแรก[ ต้องการอ้างอิง ]เครื่องมือทางจิตวิทยาที่ถูกออกแบบมาเพื่อวัดแนวคิดของหน่วยสืบราชการลับ [9]วิธีการหนึ่งที่ทางประวัติศาสตร์ที่เกี่ยวข้องกับการทดสอบ Stanford-Binet IQสร้างสรรค์พัฒนาโดยฝรั่งเศสนักจิตวิทยาอัลเฟรด Binet แนวคิดทางเลือกของความฉลาดคือความสามารถในการรับรู้ภายในแต่ละบุคคลเป็นการแสดงให้เห็นถึงองค์ประกอบทั่วไปหรือปัจจัยด้านสติปัญญาทั่วไปตลอดจนความสามารถในการรับรู้ที่เฉพาะเจาะจงสำหรับโดเมนที่กำหนด [ ต้องการอ้างอิง ]
อีกสิ่งสำคัญใน psychometrics ที่ได้รับในการทดสอบบุคลิกภาพ มีหลายวิธีทางทฤษฎีในการกำหนดแนวคิดและการวัดบุคลิกภาพ บางส่วนของตราสารที่รู้จักกันดีรวมถึงสินค้าคงคลังบุคลิกภาพมินนิโซตา Multiphasicที่ห้าปัจจัยรุ่น (หรือ "บิ๊ก 5") และเครื่องมือเช่นบุคลิกภาพและการตั้งค่าของสินค้าคงคลังและMyers-Briggs ชนิดตัวบ่งชี้ ทัศนคติยังได้รับการศึกษาอย่างกว้างขวางโดยใช้วิธีไซโครเมตริก [ ต้องการอ้างอิง ]วิธีการทั่วไปในการวัดทัศนคติคือการใช้ของขนาด Likert อีกวิธีหนึ่งเกี่ยวข้องกับการประยุกต์ใช้แบบจำลองการวัดแบบแฉโดยทั่วไปมากที่สุดคือแบบจำลองไฮเปอร์โบลิกโคไซน์ (Andrich & Luo, 1993) [10]
แนวทางเชิงทฤษฎี
Psychometricians ได้พัฒนาทฤษฎีการวัดที่แตกต่างกันจำนวนมาก ซึ่งรวมถึงทฤษฎีการทดสอบแบบคลาสสิก (CTT) และทฤษฎีการตอบสนองของรายการ (IRT) [11] [12]แนวทางที่ดูเหมือนในทางคณิตศาสตร์จะคล้ายกับ IRT แต่ก็ค่อนข้างโดดเด่นเช่นกันในแง่ของต้นกำเนิดและคุณสมบัตินั้นแสดงโดยแบบจำลอง Raschสำหรับการวัด การพัฒนาแบบจำลอง Rasch และคลาสที่กว้างขึ้นของโมเดลที่เป็นของมันถูกสร้างขึ้นอย่างชัดเจนจากข้อกำหนดของการวัดในวิทยาศาสตร์กายภาพ [13]
Psychometricians ยังได้พัฒนาวิธีการทำงานกับเมทริกซ์ที่มีความสัมพันธ์และความสัมพันธ์ร่วมกันจำนวนมาก เทคนิคในประเพณีทั่วไปนี้รวมถึง: วิเคราะห์ปัจจัย , [14]วิธีการกำหนดขนาดพื้นฐานของข้อมูล หนึ่งในความท้าทายหลักที่ต้องเผชิญกับผู้ใช้ในการวิเคราะห์ปัจจัยคือการขาดการฉันทามติเกี่ยวกับวิธีการที่เหมาะสมสำหรับการกำหนดจำนวนของปัจจัยที่แฝงอยู่ [15]ขั้นตอนปกติคือหยุดการแยกตัวประกอบเมื่อค่าลักษณะเฉพาะลดลงต่ำกว่าค่าหนึ่งเนื่องจากทรงกลมเดิมหดตัว การขาดจุดตัดยังเกี่ยวข้องกับวิธีการหลายตัวแปรอื่น ๆ ด้วย [ ต้องการอ้างอิง ]
การปรับขนาดหลายมิติ[16]เป็นวิธีการค้นหาการแทนค่าอย่างง่ายสำหรับข้อมูลที่มีมิติแฝงจำนวนมาก การวิเคราะห์คลัสเตอร์เป็นแนวทางในการค้นหาวัตถุที่เหมือนกัน การวิเคราะห์ปัจจัยการปรับขนาดหลายมิติและการวิเคราะห์คลัสเตอร์ล้วนเป็นวิธีการพรรณนาหลายตัวแปรที่ใช้ในการกลั่นจากโครงสร้างที่ง่ายกว่าของข้อมูลจำนวนมาก
เมื่อเร็ว ๆ นี้การสร้างแบบจำลองโครงสร้างสม[17]และวิเคราะห์เส้นทางแทนวิธีการที่มีความซับซ้อนมากขึ้นในการทำงานร่วมกับขนาดใหญ่เมทริกซ์ความแปรปรวน วิธีการเหล่านี้ช่วยให้โมเดลที่มีความซับซ้อนทางสถิติสามารถติดตั้งกับข้อมูลและทดสอบเพื่อพิจารณาว่าเหมาะสมเพียงพอหรือไม่ เนื่องจากในการวิจัยไซโครเมตริกระดับละเอียดจะเกี่ยวข้องกับขอบเขตและลักษณะของความหลากหลายในแต่ละรายการที่น่าสนใจขั้นตอนที่ค่อนข้างใหม่ที่เรียกว่าการวิเคราะห์สองปัจจัย[18] [19] [20]จึงมีประโยชน์ การวิเคราะห์ปัจจัยสองทางสามารถย่อยสลาย "ความแปรปรวนอย่างเป็นระบบของรายการในแง่ของสองแหล่งที่มาปัจจัยทั่วไปและแหล่งที่มาของความแปรปรวนเชิงระบบเพิ่มเติมหนึ่งแหล่ง" [21]
แนวคิดหลัก
แนวคิดหลักในทฤษฎีการทดสอบแบบดั้งเดิมที่มีความน่าเชื่อถือและความถูกต้อง การวัดที่เชื่อถือได้คือมาตรการที่วัดโครงสร้างอย่างสม่ำเสมอตลอดเวลาบุคคลและสถานการณ์ การวัดที่ถูกต้องคือการวัดสิ่งที่ตั้งใจจะวัด ความน่าเชื่อถือเป็นสิ่งที่จำเป็น แต่ไม่เพียงพอสำหรับความถูกต้อง
ทั้งความน่าเชื่อถือและความถูกต้องสามารถประเมินได้ทางสถิติ ความสม่ำเสมอในการวัดซ้ำของการทดสอบเดียวกันสามารถประเมินได้ด้วยค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันและมักเรียกว่าความน่าเชื่อถือของการทดสอบซ้ำ [22]ในทำนองเดียวกันความเท่าเทียมกันของรุ่นต่างๆของการวัดเดียวกันสามารถจัดทำดัชนีได้โดยสหสัมพันธ์แบบเพียร์สันและเรียกว่าความน่าเชื่อถือในรูปแบบที่เท่ากันหรือคำที่คล้ายกัน [22]
ความสอดคล้องภายในที่อยู่ที่ความเป็นเนื้อเดียวกันของรูปแบบการทดสอบเดียวอาจได้รับการประเมินโดยความสัมพันธ์ระหว่างประสิทธิภาพการทำงานบนสองครึ่งของการทดสอบซึ่งเป็น termed น่าเชื่อถือแยกครึ่ง ; ค่าของค่าสัมประสิทธิ์สหสัมพันธ์โมเมนต์ผลิตภัณฑ์ของเพียร์สันสำหรับการทดสอบครึ่งหนึ่งสองครั้งจะถูกปรับด้วยสูตรการทำนายของสเปียร์แมน - บราวน์เพื่อให้สอดคล้องกับความสัมพันธ์ระหว่างการทดสอบเต็มความยาวสองครั้ง [22]บางทีดัชนีความน่าเชื่อถือที่ใช้บ่อยที่สุดคือαของครอนบาคซึ่งเทียบเท่ากับค่าเฉลี่ยของสัมประสิทธิ์การแบ่งครึ่งที่เป็นไปได้ทั้งหมด วิธีการอื่น ๆ ได้แก่สหสัมพันธ์ภายในคลาสซึ่งเป็นอัตราส่วนของความแปรปรวนของการวัดของเป้าหมายที่กำหนดกับความแปรปรวนของเป้าหมายทั้งหมด
ความถูกต้องมีหลายรูปแบบ ความถูกต้องที่เกี่ยวข้องกับเกณฑ์หมายถึงขอบเขตที่การทดสอบหรือมาตราส่วนทำนายตัวอย่างของพฤติกรรมกล่าวคือเกณฑ์ที่เป็น "ภายนอกของเครื่องมือวัดนั้นเอง" [23]ตัวอย่างพฤติกรรมภายนอกนั้นอาจเป็นได้หลายอย่างรวมถึงการทดสอบอื่นด้วย เกรดเฉลี่ยของวิทยาลัยเมื่อใช้ SAT ระดับมัธยมศึกษาตอนปลายเพื่อทำนายผลการเรียนในวิทยาลัย และแม้แต่พฤติกรรมที่เกิดขึ้นในอดีตตัวอย่างเช่นเมื่อใช้การทดสอบอาการทางจิตในปัจจุบันเพื่อทำนายการเกิดขึ้นของการตกเป็นเหยื่อในอดีต (ซึ่งจะแสดงถึงหลังการเสพติดได้อย่างถูกต้อง) เมื่อวัดเกณฑ์เป็นที่เก็บรวบรวมได้ในเวลาเดียวกันเป็นตัวชี้วัดที่ได้รับการตรวจสอบเป้าหมายคือการสร้างความถูกต้องพร้อมกัน ; เมื่อเกณฑ์จะถูกรวบรวมในภายหลังมีเป้าหมายที่จะสร้างความถูกต้องทำนาย การวัดมีความถูกต้องในการสร้างหากเกี่ยวข้องกับการวัดของโครงสร้างอื่น ๆ ตามที่ทฤษฎีกำหนด ความถูกต้องของเนื้อหาเป็นการแสดงให้เห็นว่ารายการทดสอบมีหน้าที่เพียงพอในการครอบคลุมโดเมนที่กำลังวัด ในตัวอย่างคัดเลือกบุคลากรเนื้อหาการทดสอบจะขึ้นอยู่กับคำสั่งที่กำหนดไว้หรือชุดของงบความรู้ทักษะความสามารถหรือลักษณะอื่น ๆ ที่ได้รับจากการวิเคราะห์งาน
ทฤษฎีการตอบสนองของรายการจะจำลองความสัมพันธ์ระหว่างลักษณะแฝงและการตอบสนองต่อรายการทดสอบ ในข้อดีอื่น ๆ IRT ให้พื้นฐานสำหรับการได้รับการประมาณตำแหน่งของผู้ทำการทดสอบเกี่ยวกับลักษณะแฝงที่กำหนดตลอดจนข้อผิดพลาดมาตรฐานของการวัดสถานที่นั้น ตัวอย่างเช่นความรู้ด้านประวัติศาสตร์ของนักศึกษามหาวิทยาลัยสามารถอนุมานได้จากคะแนนของตนเองในการทดสอบระดับมหาวิทยาลัยแล้วนำมาเปรียบเทียบกับความรู้ของนักเรียนมัธยมปลายที่อนุมานได้อย่างน่าเชื่อถือจากแบบทดสอบที่ยากน้อยกว่า คะแนนที่ได้จากทฤษฎีการทดสอบแบบคลาสสิกไม่มีลักษณะนี้และการประเมินความสามารถที่แท้จริง (แทนที่จะเป็นความสามารถเมื่อเทียบกับผู้ทดสอบคนอื่น ๆ ) จะต้องได้รับการประเมินโดยการเปรียบเทียบคะแนนกับ "กลุ่มบรรทัดฐาน" ที่สุ่มเลือกจากประชากร ในความเป็นจริงมาตรการทั้งหมดที่ได้จากทฤษฎีการทดสอบแบบคลาสสิกนั้นขึ้นอยู่กับตัวอย่างที่ทดสอบในขณะที่โดยหลักการแล้วมาตรการที่ได้มาจากทฤษฎีการตอบสนองของรายการไม่ได้
นักจิตวิทยาหลายคนยังกังวลกับการค้นหาและขจัดอคติในการทดสอบจากการทดสอบทางจิตวิทยาของพวกเขา ความลำเอียงในการทดสอบเป็นรูปแบบหนึ่งของข้อผิดพลาดที่เป็นระบบ (เช่นไม่ใช่แบบสุ่ม) ซึ่งนำไปสู่การตรวจสอบจากกลุ่มประชากรกลุ่มหนึ่งที่มีข้อได้เปรียบที่ไม่มีเหตุผลมากกว่าการตรวจสอบจากกลุ่มประชากรอื่น [24]ตามที่ผู้เชี่ยวชาญชั้นนำความลำเอียงในการทดสอบอาจทำให้คะแนนเฉลี่ยแตกต่างกันในกลุ่มประชากร แต่ความแตกต่างของคะแนนกลุ่มไม่ได้เป็นหลักฐานเพียงพอที่แสดงให้เห็นว่ามีอคติในการทดสอบจริงเนื่องจากการทดสอบสามารถวัดความแตกต่างที่แท้จริงในแต่ละกลุ่มได้ [25] [24] Psychometricians ใช้วิธีการทางวิทยาศาสตร์ที่ซับซ้อนเพื่อค้นหาอคติในการทดสอบและกำจัดมัน การวิจัยแสดงให้เห็นว่าโดยปกติแล้วเป็นไปไม่ได้ที่ผู้ที่อ่านรายการทดสอบจะระบุได้อย่างถูกต้องว่าเอนเอียงหรือไม่ [26]
มาตรฐานคุณภาพ
โดยทั่วไปแล้วการพิจารณาความถูกต้องและความน่าเชื่อถือจะถูกมองว่าเป็นองค์ประกอบสำคัญในการกำหนดคุณภาพของการทดสอบใด ๆ อย่างไรก็ตามสมาคมวิชาชีพและผู้ปฏิบัติงานมักจะวางข้อกังวลเหล่านี้ไว้ในบริบทที่กว้างขึ้นเมื่อพัฒนามาตรฐานและทำการตัดสินโดยรวมเกี่ยวกับคุณภาพของการทดสอบโดยรวมภายในบริบทที่กำหนด การพิจารณาความกังวลในการตั้งค่าการวิจัยประยุกต์หลายอย่างคือเมตริกของสินค้าคงคลังทางจิตวิทยาที่ระบุนั้นมีความหมายหรือไม่โดยพลการ [27]
มาตรฐานการทดสอบ
ในปี 2014 ชาวอเมริกันสมาคมการศึกษาวิจัย (AERA) สมาคมจิตวิทยาอเมริกัน (APA) และสภาแห่งชาติเกี่ยวกับการวัดในการศึกษา (NCME) ตีพิมพ์การแก้ไขเป็นมาตรฐานสำหรับการศึกษาและการทดสอบทางจิตวิทยา , [28]ซึ่งอธิบายมาตรฐานสำหรับการพัฒนาทดสอบ การประเมินผลและการนำไปใช้ มาตรฐานครอบคลุมหัวข้อที่จำเป็นในการทดสอบรวมถึงความถูกต้องและความน่าเชื่อถือ / ข้อผิดพลาดของการวัดและความเป็นธรรมในการทดสอบ หนังสือเล่มนี้ยังกำหนดมาตรฐานที่เกี่ยวข้องกับการดำเนินการทดสอบซึ่งรวมถึงการออกแบบและพัฒนาการทดสอบคะแนนมาตราส่วนบรรทัดฐานการเชื่อมโยงคะแนนตัดคะแนนการบริหารการทดสอบการให้คะแนนการรายงานการตีความคะแนนเอกสารประกอบการทดสอบสิทธิและความรับผิดชอบของผู้ทดสอบและผู้ใช้แบบทดสอบ . สุดท้ายมาตรฐานครอบคลุมหัวข้อที่เกี่ยวข้องกับการทดสอบการใช้งานรวมถึงการทดสอบทางจิตวิทยาและการประเมินผลการทดสอบการทำงานและความชำนาญ , ทดสอบทางการศึกษาและการประเมินผลและการทดสอบในการประเมินผลโครงการและนโยบายสาธารณะ
มาตรฐานการประเมิน
ในด้านการประเมินผลและโดยเฉพาะการประเมินผลการศึกษาที่ร่วมกับคณะกรรมการมาตรฐานการศึกษาการประเมินผล[29]ได้ตีพิมพ์สามชุดมาตรฐานสำหรับการประเมินผล มาตรฐานการประเมินผลงานบุคลากร[30]ตีพิมพ์ในปี พ.ศ. 2531 มาตรฐานการประเมินผลโครงการ (พิมพ์ครั้งที่ 2) [31]ได้รับการตีพิมพ์ในปี พ.ศ. 2537 และมาตรฐานการประเมินผลนักเรียน[32]ได้รับการตีพิมพ์ในปี พ.ศ. 2546
สิ่งพิมพ์แต่ละฉบับนำเสนอและจัดทำชุดมาตรฐานอย่างละเอียดเพื่อใช้ในสถานศึกษาที่หลากหลาย มาตรฐานดังกล่าวให้แนวทางในการออกแบบดำเนินการประเมินและปรับปรุงรูปแบบการประเมินที่ระบุ [33]แต่ละมาตรฐานได้รับการจัดให้อยู่ในหมวดหมู่พื้นฐานหนึ่งในสี่ประเภทเพื่อส่งเสริมการประเมินทางการศึกษาที่เหมาะสมเป็นประโยชน์เป็นไปได้และถูกต้อง ในชุดของมาตรฐานเหล่านี้การพิจารณาความถูกต้องและความน่าเชื่อถือจะครอบคลุมภายใต้หัวข้อความถูกต้อง ตัวอย่างเช่นมาตรฐานความถูกต้องของนักเรียนช่วยให้มั่นใจได้ว่าการประเมินผลของนักเรียนจะให้ข้อมูลที่ถูกต้องแม่นยำและน่าเชื่อถือเกี่ยวกับการเรียนรู้และผลงานของนักเรียน
ไม่ใช่มนุษย์: สัตว์และเครื่องจักร
Psychometrics กล่าวถึงความสามารถของมนุษย์ทัศนคติลักษณะและวิวัฒนาการทางการศึกษา โดยเฉพาะอย่างยิ่งการศึกษาพฤติกรรมของกระบวนการทางจิตและความสามารถของมนุษย์ไม่ใช่สัตว์ที่มักจะมีการแก้ไขโดยจิตวิทยาเปรียบเทียบหรือความต่อเนื่องระหว่างสัตว์ไม่ใช่มนุษย์และส่วนที่เหลือของสัตว์โดยการวิวัฒนาการทางจิตวิทยา อย่างไรก็ตามมีผู้สนับสนุนบางคนสำหรับการเปลี่ยนแปลงที่ค่อยเป็นค่อยไประหว่างแนวทางที่ดำเนินการเพื่อมนุษย์และแนวทางที่ใช้กับสัตว์ (ที่ไม่ใช่มนุษย์) [34] [35] [36] [37]
การประเมินความสามารถลักษณะและวิวัฒนาการการเรียนรู้ของเครื่องได้รับส่วนใหญ่ที่ไม่เกี่ยวข้องกับกรณีของมนุษย์และสัตว์ไม่ใช่มนุษย์ที่มีเฉพาะวิธีการในพื้นที่ของปัญญาประดิษฐ์ นอกจากนี้ยังมีการเสนอแนวทางบูรณาการมากขึ้นภายใต้ชื่อของ Psychometrics สากล [38]
ดูสิ่งนี้ด้วย
- ทฤษฎีแคทเทล - ฮอร์น - แครอล
- ทฤษฎีการทดสอบคลาสสิก
- Psychometrics การคำนวณ
- สินค้าคงคลังแนวคิด
- อัลฟ่าของครอนบาค
- การขุดข้อมูล
- การประเมินทางการศึกษา
- จิตวิทยาการศึกษา
- การวิเคราะห์ปัจจัย
- ทฤษฎีการตอบสนองของรายการ
- รายชื่อซอฟต์แวร์ไซโครเมตริก
- รายชื่อโรงเรียนสำหรับ Psychometrics
- การดำเนินงาน
- จิตวิทยาเชิงปริมาณ
- สังคมไซโครเมตริก
- แบบจำลอง Rasch
- มาตราส่วน (สังคมศาสตร์)
- ที่ปรึกษาโรงเรียน
- จิตวิทยาโรงเรียน
- การทดสอบมาตรฐาน
อ้างอิง
บรรณานุกรม
- Andrich, D. & Luo, G. (1993). "รูปแบบการผ่อนชำระโคไซน์สำหรับการตอบสนองแฉเดียวกระตุ้นเศรษฐกิจแบบทวิลักษณ์" (PDF) ประยุกต์จิตวิทยาการวัด 17 (3): 253–276. CiteSeerX 10.1.1.1003.8107 ดอย : 10.1177 / 014662169301700307 . S2CID 120745971
- มิเชลล์เจ (2542). วัดในด้านจิตวิทยา Cambridge: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์ DOI: 10.1017 / CBO9780511490040
- Rasch, G. (2503/1980). น่าจะเป็นแบบจำลองสำหรับการทดสอบความฉลาดและความสำเร็จบางอย่าง โคเปนเฮเกนสถาบันวิจัยทางการศึกษาของเดนมาร์ก) ฉบับขยาย (1980) พร้อมคำนำหน้าและคำหลังโดย BD Wright ชิคาโก: สำนักพิมพ์มหาวิทยาลัยชิคาโก
- รีส, TW (2486). การประยุกต์ใช้ทฤษฎีการวัดทางกายภาพกับการวัดขนาดทางจิตวิทยาโดยมีตัวอย่างการทดลองสามตัวอย่าง Monographs จิตวิทยา, 55 , 1–89 ดอย: 10.1037 / h0061367
- สตีเวนส์เอสเอส (2489) "ว่าด้วยทฤษฎีมาตราส่วนการวัด". วิทยาศาสตร์ . 103 (2684): 677–80 Bibcode : 1946Sci ... 103..677S . ดอย : 10.1126 / science.103.2684.677 . PMID 17750512
- เธอร์สโตน, LL (2470). “ กฎแห่งการตัดสินเปรียบเทียบ”. จิตวิทยารีวิว 34 (4): 278–286 ดอย : 10.1037 / h0070288 .
- เธอร์สโตน, LL (2472). การวัดมูลค่าทางจิตใจ ในทีวีสมิ ธ และ WK ไรท์ (Eds.), บทความในปรัชญาโดยแพทย์ Seventeen ปรัชญาของมหาวิทยาลัยชิคาโก ชิคาโก: โอเพ่นคอร์ท
- เธอร์สโตน, LL (2502). การวัดค่า ชิคาโก: สำนักพิมพ์มหาวิทยาลัยชิคาโก
- SF Blinkhorn (1997). "ความไม่สมบูรณ์ในอดีตเงื่อนไขในอนาคต: ทฤษฎีการทดสอบห้าสิบปี" บ. ญ. คณิต. นักสถิติ. Psychol . 50 (2): 175–185 ดอย : 10.1111 / j.2044-8317.1997.tb01139.x .
- แซนฟอร์ดเดวิด (18 พฤศจิกายน 2560). "เคมบริดจ์เพียงแค่บอกว่าฉันข้อมูลขนาดใหญ่ไม่สามารถทำงานได้เลย" LinkedIn
หมายเหตุ
- ^ สภาแห่งชาติว่าด้วยการวัดผลทางการศึกษา http://www.ncme.org/ncme/NCME/Resource_Center/Glossary/NCME/Resource_Center/Glossary1.aspx?hkey=4bb87415-44dc-4088-9ed9-e8515326a061#anchorP ที่ เก็บถาวร 2017-07 -22 ที่ Wayback Machine
- ^ Kaplan, RM, & Saccuzzo, DP (2010). การทดสอบทางจิตวิทยา: หลักการการประยุกต์ใช้และประเด็น (ฉบับที่ 8) Belmont, CA: Wadsworth, Cengage Learning
- ^ a b c Kaplan, RM, & Saccuzzo, DP (2010) การเหยียบย่ำทางจิตวิทยา: หลักการการใช้งานและประเด็นต่างๆ (ฉบับที่ 8) Belmont, CA: Wadsworth, Cengage Learning
- ^ Leopold Szondi (1960)ดา zweite Buch: Lehrbuch der Experimentellen Triebdiagnostik Huber, Bern und Stuttgart, 2nd edition. Ch.27 จากการแปลภาษาสเปน B) II Las condiciones estadisticas , p.396 คำอ้างอิง:
el pensamiento psicologico especifico, en las ultima decadas, fue suprimido y Eliminado casi totalmente, siendo sustituido por un pensamiento estadistico. Precisamente aqui vemos el cáncer de la testología y testomania de hoy.
- ^ การ ประเมินไซโครเมตริก การประเมินไซโครเมตริก มหาวิทยาลัยเมลเบิร์น.
- ^ Michell, Joel (สิงหาคม 1997) "วิทยาศาสตร์เชิงปริมาณและความหมายของการวัดในจิตวิทยา". วารสารจิตวิทยาอังกฤษ . 88 (3): 355–383 ดอย : 10.1111 / j.2044-8295.1997.tb02641.x .
- ^ รีสทีดับบลิว (1943) การประยุกต์ใช้ทฤษฎีการวัดทางกายภาพกับการวัดขนาดทางจิตวิทยาโดยมีตัวอย่างการทดลองสามตัวอย่าง Monographs จิตวิทยา, 55 , 1–89 ดอย : 10.1037 / h0061367
- ^ http://www.assessmentpsychology.com/psychometrics.htm
- ^ "ลอสเดอ diferentes Tipos ทดสอบ psicometricos - psicometrico Examen" examenpsicometrico.com .
- ^ Andrich, D. & Luo กรัม (1993) ผ่อนชำระโคไซน์แฝงลักษณะแบบจำลองสำหรับการแฉ dichotomousตอบสนองเดียวกระตุ้นเศรษฐกิจ การวัดผลทางจิตวิทยาประยุกต์, 17, 253-276.
- ^ Embretson, SE, & Reise, SP (2000). ทฤษฎีการตอบสนองสินค้าย่อยให้กับนักจิตวิทยา Mahwah, NJ: Erlbaum
- ^ Hambleton, RK & Swaminathan เอช (1985) ทฤษฎีการตอบสนองต่อรายการ: หลักการและการประยุกต์ใช้ บอสตัน: Kluwer-Nijhoff
- ^ Rasch กรัม (1960/1980) น่าจะเป็นแบบจำลองสำหรับการทดสอบความฉลาดและความสำเร็จบางอย่าง โคเปนเฮเกนสถาบันวิจัยทางการศึกษาของเดนมาร์กฉบับขยาย (1980) พร้อมคำนำหน้าและคำหลังโดย BD Wright ชิคาโก: สำนักพิมพ์มหาวิทยาลัยชิคาโก
- ^ ธ อมป์สัน, BR (2004) การวิเคราะห์เชิงสำรวจและเชิงยืนยัน: การทำความเข้าใจแนวคิดและการประยุกต์ใช้ สมาคมจิตวิทยาอเมริกัน
- ^ ซวิควิลเลียมอาร์.; Velicer, Wayne F. (1986). "การเปรียบเทียบกฎ 5 ข้อเพื่อกำหนดจำนวนส่วนประกอบที่จะคงไว้" จิตวิทยา Bulletin 99 (3): 432–442 ดอย : 10.1037 // 0033-2909.99.3.432 .
- ^ เดวิสัน, ML (1992) การปรับขนาดหลายมิติ Krieger.
- ^ Kaplan, D. (2008) การสร้างแบบจำลองสมการโครงสร้าง: ฐานรากและส่วนขยาย , 2nd ed. ปราชญ์.
- ^ DeMars, CE (2013) บทแนะนำเกี่ยวกับการตีความคะแนนแบบจำลองสองปัจจัย International Journal of Testing, 13 , 354–378 http://dx.doi.org/10 .1080/15305058.2013.799067
- ^ Reise, SP (2555). การค้นพบใหม่ของการสร้างแบบจำลองสองปัจจัย การวิจัยพฤติกรรมหลายตัวแปร, 47 , 667–696 http://dx.doi.org/10.1080/00273171.2012.715555
- ^ Rodriguez, a, ท่องเที่ยว, SP และ Haviland, MG (2016) การประเมินแบบจำลอง bifactor: การคำนวณและตีความดัชนีทางสถิติ Psychological Methods, 21 , 137–150 http://dx.doi.org/10.1037/met0000045
- ^ Schonfeld, คือ Verkuilen เจ & Bianchi, R. (2019) การสร้างแบบจำลองสมการโครงสร้างเชิงสำรวจซึ่งใช้วิธีการวิเคราะห์แบบสองปัจจัยเพื่อเปิดเผยว่าสเกลความเหนื่อยหน่ายความซึมเศร้าและความวิตกกังวลใดที่วัดได้ การประเมินทางจิตวิทยา, 31 , 1073-1079 http://dx.doi.org/10.1037/pas0000721 น . 1075
- ^ ก ข ค "บ้าน - การศึกษาข้อมูลพื้นฐานเกี่ยวกับการวิจัยโดยเดล Siegle" www.gifted.uconn.edu .
- ^ Nunnally, JC (1978). ทฤษฎีไซโครเมตริก (2nd ed.) นิวยอร์ก: McGraw-Hill
- ^ ก ข วอร์นรัสเซลที.; ยุนเมียงซุน; ราคาคริสเจ (2014). "สำรวจการตีความ" อคติทดสอบ" " ที่หลากหลาย ความหลากหลายทางวัฒนธรรมและจิตวิทยาชนกลุ่มน้อย . 20 (4): 570–582 ดอย : 10.1037 / a0036503 . PMID 25313435
- ^ เรย์โนลด์, CR (2000) เหตุใดการวิจัยไซโครเมตริกเกี่ยวกับอคติในการทดสอบจิตจึงมักถูกละเลย จิตวิทยานโยบายสาธารณะและกฎหมาย 6 , 144-150 ดอย : 10.1037 / 1076-8971.6.1.144
- ^ Reschly, DJ (1980) หลักฐานทางจิตวิทยาในความคิดเห็นของ Larry P. : กรณีของการแก้ปัญหาที่ถูกต้อง - ผิด? School Psychology Review, 9 , 123-125
- ^ Blanton เอชและ Jaccard, J. (2006) เมตริกตามอำเภอใจในทางจิตวิทยา เก็บถาวร 2006-05-10 ที่ Wayback Machine American Psychologist, 61 (1), 27-41.
- ^ "มาตรฐานการทดสอบทางการศึกษาและจิตวิทยา" . apa.org .
- ^ คณะกรรมการร่วมว่าด้วยมาตรฐานการประเมินผลการศึกษาที่ เก็บถาวรในปี 2009-10-15 ที่ Wayback Machine
- ^ คณะกรรมการร่วมมาตรฐานการประเมินผลการศึกษา (2531). มาตรฐานการประเมินบุคลากร: วิธีการประเมินระบบสำหรับการประเมินนักการศึกษา เก็บถาวร 2005-12-12 ที่Wayback Machine Newbury Park, CA: Sage Publications
- ^ คณะกรรมการร่วมมาตรฐานการประเมินผลการศึกษา (2537). มาตรฐานการประเมินโปรแกรมฉบับที่ 2 เก็บถาวรเมื่อ 2006-02-22 ที่Wayback Machine Newbury Park, CA: Sage Publications
- ^ คณะกรรมการมาตรฐานการประเมินผลการศึกษา. (2546). มาตรฐานการประเมินผลนักเรียน: วิธีปรับปรุงการประเมินผลของนักเรียน เก็บถาวรเมื่อ 2006-05-24 ที่Wayback Machine Newbury Park, CA: Corwin Press
- ^ [ อีคาเบรา - เหงียน. "แนวทางผู้เขียนสำหรับการรายงานการพัฒนาขนาดและผลการตรวจสอบความถูกต้องในวารสารสมาคมสังคมสงเคราะห์และการวิจัย]" . Academia.edu . 1 (2): 99–103
- ^ ฮัมฟรีส์ LG (1987) "การพิจารณา Psychometrics ในการประเมินความแตกต่างของ intraspecies ในด้านสติปัญญา". พฤติกรรมวิทย์สมอง . 10 (4): 668–669 ดอย : 10.1017 / s0140525x0005514x .
- ^ Eysenck, HJ (1987). "ความหมายหลายประการของความฉลาด". พฤติกรรมวิทย์สมอง . 10 (4): 663. ดอย : 10.1017 / s0140525x00055060 .
- ^ Locurto, C. & Scanlon, C (1987). "ความแตกต่างระหว่างบุคคลและปัจจัยการเรียนรู้เชิงพื้นที่ของหนูสองสายพันธุ์". พฤติกรรมวิทย์สมอง . 112 : 344–352
- ^ King, James E & Figueredo, Aurelio Jose (1997) "แบบจำลองปัจจัยห้าบวกความโดดเด่นในบุคลิกภาพของลิงชิมแปนซี" วารสารวิจัยบุคลิกภาพ . 31 (2): 257–271 ดอย : 10.1006 / jrpe.1997.2179 .
- ^ เจเฮอร์นันเดซ - ออรัลโล; DL Dowe; MV Hernández-Lloreda (2013). "ยูนิเวอร์แซ Psychometrics: การวัดความสามารถทางปัญญาในเครื่องราชอาณาจักร" (PDF) การวิจัยระบบความรู้ความเข้าใจ . 27 : 50–74. ดอย : 10.1016 / j.cogsys.2013.06.001 . hdl : 10251/50244 . S2CID 26440282
อ่านเพิ่มเติม
- โรเบิร์ตเอฟเดเวลลิส (2016). พัฒนาขนาด: ทฤษฎีและการประยุกต์ใช้ สิ่งพิมพ์ SAGE ISBN 978-1-5063-4158-3.
- Borsboom, Denny (2005). วัดใจ: ปัญหาแนวคิดใน Psychometrics เคมบริดจ์: มหาวิทยาลัยเคมบริดจ์ ISBN 978-0-521-84463-5. สรุปการจัดวาง (28 มิถุนายน 2553).
- เลสลี่เอ. มิลเลอร์; โรเบิร์ตแอล. เลิฟเลอร์ (2015). ฐานรากของการทดสอบทางจิตวิทยา: วิธีการปฏิบัติ สิ่งพิมพ์ SAGE ISBN 978-1-4833-6927-3.
- โรเดอริคพีแมคโดนัลด์ (2013). ทฤษฎีการทดสอบ: การรักษาแบบครบวงจร จิตวิทยากด. ISBN 978-1-135-67530-1.
- พอลไคลน์ (2000). คู่มือของการทดสอบทางจิตวิทยา จิตวิทยากด. ISBN 978-0-415-21158-1.
- รัช AJ Jr; MB แรก; แบล็กเกอร์ D (2008) คู่มือมาตรการจิตเวช . สำนักพิมพ์จิตเวชอเมริกัน. ISBN 978-1-58562-218-4. OCLC 85885343
- แอนซีซิลเวอร์เลค (2016). คู่มือทดสอบความเข้าใจ: คู่มือและสมุด เทย์เลอร์และฟรานซิส ISBN 978-1-351-97086-0.
- เฟนตันเอช (2019). "เคล็ดลับ 10 อันดับแรกในการเตรียมตัวสำหรับการทดสอบไซโครเมตริกเพื่อให้ได้งานนั้น!" . สถาบันฝึกอบรมการเพิ่มประสิทธิภาพทางธุรกิจ
- ดร. Snigdha Rai (2018). "สุดยอดคู่มือ Psychometric ทดสอบ" Mercer Mettl
- Radhika Kulkarni (2019). "การจ้างงานโดยใช้การทดสอบออนไลน์ Psychometric" ไซโครเมตริก
- Saville, P. & Hopton, T. (2014). "Psychometrics @ Work" . หนังสือ CPICS1 maint: หลายชื่อ: รายชื่อผู้เขียน ( ลิงค์ )
ลิงก์ภายนอก
- มาตรฐาน APA สำหรับการทดสอบทางการศึกษาและจิตวิทยา
- กลุ่มรายการบุคลิกภาพระหว่างประเทศ
- คณะกรรมการร่วมมาตรฐานการประเมินผลการศึกษา
- ศูนย์ Psychometrics มหาวิทยาลัยเคมบริดจ์
- Psychometric Society และโฮมเพจ Psychometrika
- ห้องปฏิบัติการทางกายวิภาคของลอนดอน