หากกล่าวถึงการทดสอบทางสถิติ T-test ที่ใช้เพื่อ เปรียบเทียบค่าเฉลี่ย (means) ของสองกลุ่ม หรือเพื่อทดสอบค่าเฉลี่ยของกลุ่มเดียว กับค่าที่กำหนดไว้ จากประโยคข้างต้นลองนึกภาพว่าคุณมีลูกโป่งสองลูก ลูกโป่งแต่ละลูกแทนกลุ่มของคนที่เราสนใจ เช่น กลุ่มของนักเรียนห้อง A และห้อง B ตอนนี้คุณอยากรู้ว่านักเรียนในห้องไหนมีคะแนนเฉลี่ยในการสอบสูงกว่ากัน
T-test เป็นเหมือนเครื่องมือที่ช่วยให้คุณวัดและเปรียบเทียบขนาดของลูกโป่งทั้งสองว่ามีความแตกต่างกันมากแค่ไหน หากลูกโป่งมีขนาดใกล้เคียงกันมาก คุณอาจจะบอกไม่ได้ว่ามีความแตกต่างกัน แต่ถ้าหากลูกโป่งหนึ่งใหญ่กว่าอย่างเห็นได้ชัด สามารถบอกได้ว่าลูกโป่งทั้งสองมีความแตกต่างอย่างมีนัยสำคัญนั่นเองค่ะ
ในการทดสอบสถิติที่เรียกว่า T-test, ค่า t เป็นตัวเลขเพื่อดูว่าผลลัพธ์ที่เราสังเกตเห็นนั้นเกิดขึ้นจากเหตุผลที่แท้จริงหรือเป็นเพียงจากโอกาส ในตัวอย่างของลูกโป่งที่ให้ไว้ เราสนใจว่าลูกโป่งแต่ละลูก (หรือกลุ่มข้อมูล) มีขนาดที่แตกต่างกันอย่างมีนัยสำคัญหรือไม่ ดังนั้นค่า t จะช่วยเราอธิบายในเรื่องนี้ค่ะ
หาก ค่า t ที่คำนวณได้มีค่าสูงมากจะบ่งบอกว่าการที่เราเห็นลูกโป่งหนึ่งใหญ่กว่าอีกลูกหนึ่ง เปรียบเสมือนว่าการเปรียบเทียบคะแนนเฉลี่ยของนักเรียนในห้อง A และ B ได้ ค่า t ที่สูงมาก เราสามารถพูดได้ว่าห้องหนึ่งมีคะแนนเฉลี่ยที่สูงกว่าห้องอื่นอย่างมีนัยสำคัญ เพื่อตรวจสอบขนาดของลูกโป่งแต่ละลูกนั้นแตกต่างกันอย่างมีนัยสำคัญหรือไม่ เราจึงใช้ T-test ซึ่งเหมือนกับการใช้เครื่องมือวัดขนาดลูกโป่ง โดยเริ่มต้นจากการเก็บคะแนนของนักเรียนทุกคนในห้อง A และห้อง B ซึ่งเปรียบเสมือนการวัดขนาดลูกโป่ง ถัดมาเราจะคำนวณคะแนนเฉลี่ยของนักเรียนในแต่ละห้องซึ่งเปรียบเสมือนการหาขนาดเฉลี่ยของลูกโป่ง และเราใช้ T-test เปรียบเทียบคะแนนเฉลี่ยที่เราได้ ซึ่งเปรียบเสมือนการใช้เครื่องมือวัดเพื่อดูว่าขนาดเฉลี่ยของลูกโป่งแตกต่างกันอย่างมีนัยสำคัญหรือไม่
หาก ค่า t ที่ได้จากการทดสอบนั้นสูงมาก แสดงว่าคะแนนเฉลี่ยของนักเรียนในห้องหนึ่งสูงกว่าอีกห้องหนึ่งอย่างมีนัยสำคัญ จึงกล่าวว่าลูกโป่งหนึ่งใหญ่กว่าอีกลูกหนึ่งอย่างเห็นได้ชัดเจน และคุณสามารถมั่นใจได้ว่าไม่ใช่โอกาสหรือความผิดพลาดจากการวัดที่ทำให้ลมพัดเข้ามาในห้องจึงทำให้ลูกโป่งหนึ่งดูใหญ่ขึ้นในทางกลับกัน หาก ค่า t ต่ำ แสดงว่าคะแนนเฉลี่ยของห้องทั้งสองไม่มีความแตกต่างกันอย่างมีนัยสำคัญซึ่งเหมือนกับการพบว่าขนาดของลูกโป่งทั้งสองลูกค่อนข้างใกล้เคียงกัน และคุณไม่สามารถบอกได้ว่ามีความแตกต่างอย่างชัดเจน จึงสรุปง่ายๆว่า T-test คือเครื่องมือที่ใช้ในการตัดสินใจว่าความแตกต่างที่เราเห็นในกลุ่มข้อมูลหนึ่งๆ นั้นมีนัยสำคัญหรือไม่ โดยทั่วไป T-test จะบอกเราว่าค่าเฉลี่ยของกลุ่มตัวอย่างมีความแตกต่างจากค่าเฉลี่ยของประชากรหรือจากค่าเฉลี่ยของกลุ่มอื่นอย่างมีนัยสำคัญทางสถิติหรือไม่ โดยอาศัยการคำนวณ ค่า t และการดูค่า p-value
t-test และ p value
เมื่อเราทำการทดสอบ t-Test เราจะได้ค่าสถิติ t จากข้อมูลของเรา ค่า t นี้แสดงถึงความแตกต่างระหว่างค่าเฉลี่ยที่เราสังเกตได้และค่าเฉลี่ยที่สมมติไว้ภายใต้สมมติฐานหลัก จากนั้นเราจะเปรียบเทียบค่าสถิติ t ที่คำนวณได้กับค่า p ที่ระดับนัยสำคัญที่เรากำหนด (เช่น 0.05)
ค่า p-value จะบอกเราว่า:
- หากค่า p-value น้อยกว่าระดับนัยสำคัญที่เรากำหนด (เช่น 0.05) นั่นหมายความว่าผลลัพธ์ที่เราสังเกตได้นั้นไม่น่าจะเกิดขึ้นโดยบังเอิญ และเราจะปฏิเสธสมมติฐานหลัก
- หากค่า p-value สูงกว่าระดับนัยสำคัญ นั่นหมายความว่าผลลัพธ์ที่เราสังเกตอาจเกิดขึ้นได้โดยบังเอิญและเราไม่มีหลักฐานเพียงพอที่จะปฏิเสธสมมติฐานหลักหรือยอมรับสมมติฐานรองนั่นเอง
ในการทดสอบสมมติฐาน t-Test นั้นจะมีสองสมมติฐานหลัก:
สมมติฐานหลัก (Null Hypothesis): ไม่มีความแตกต่างระหว่างกลุ่มหรือประชากรที่เรากำลังศึกษา
- ตัวอย่าง: H0:μ1=μ2 หมายความว่าค่าเฉลี่ยของกลุ่มที่หนึ่ง (μ1) เท่ากับค่าเฉลี่ยของกลุ่มที่สอง (μ2)
สมมติฐานรอง (Alternative Hypothesis): มีความแตกต่างทางสถิติระหว่างกลุ่มหรือประชากร
- ตัวอย่าง: Ha :μ1=μ2 หมายความว่าค่าเฉลี่ยของกลุ่มที่หนึ่งไม่เท่ากับค่าเฉลี่ยของกลุ่มที่สอง
ประเภทของ t-Test
การทดสอบ t-Test แบบตัวอย่างเดียว (One Sample)
การทดสอบ t-Test แบบตัวอย่างเดียว (One sample) เป็นเครื่องมือทางสถิติที่ใช้เพื่อเปรียบเทียบค่าเฉลี่ยของกลุ่มตัวอย่างที่เรามีกับค่าเฉลี่ยที่กำหนดไว้ล่วงหน้า (ที่เรียกว่า ค่าทดสอบ หรือ population mean) เพื่อดูว่ามีความแตกต่างอย่างมีนัยสำคัญหรือไม่ระหว่างทั้งสองค่าเหล่านี้ ซึ่งสามารถใช้ในหลากหลายสถานการณ์
ยกตัวอย่างเช่น:
สมมุติว่าเราต้องการทดสอบว่าโปรแกรมการออกกำลังกายใหม่มีผลต่อส่วนสูงของเด็กในวัยเจริญเติบโตหรือไม่ และเรามีค่าเฉลี่ยของส่วนสูงทั่วไปของเด็กในวัยนี้จากข้อมูลที่มีอยู่เป็น 150 เซนติเมตร เราทำการสุ่มเลือกเด็กจำนวน 30 คนที่เข้าร่วมโปรแกรมออกกำลังกายนี้ และจดส่วนสูงของพวกเขาหลังจากเข้าโปรแกรม 6 เดือน จากการวัดพบว่าค่าเฉลี่ยส่วนสูงของกลุ่มตัวอย่างเด็กที่เข้าร่วมโปรแกรมคือ 153 เซนติเมตร
เราจะใช้ t-Test แบบตัวอย่างเดียวเพื่อเปรียบเทียบค่าเฉลี่ยส่วนสูงของกลุ่มเด็กที่เข้าโปรแกรม (153 เซนติเมตร) กับค่าเฉลี่ยที่เราคาดหวังจากประชากรทั่วไป (150 เซนติเมตร) ค่ะ
โดยสมมติฐานที่เราจะตั้งสำหรับการทดสอบ t-Test แบบตัวอย่างเดียวควรเป็นดังนี้:
สมมติฐานหลัก (Null Hypothesis, H0): ค่าเฉลี่ยส่วนสูงของกลุ่มเด็กที่เข้าโปรแกรมออกกำลังกายไม่แตกต่างจากค่าเฉลี่ยของประชากรทั่วไปที่เราคาดหวังไว้ ซึ่งในกรณีนี้คือ 150 เซนติเมตร นั่นคือ μ=150 เซนติเมตร
สมมติฐานทางเลือก (Alternative Hypothesis, H1): ค่าเฉลี่ยส่วนสูงของกลุ่มเด็กที่เข้าโปรแกรมออกกำลังกายมีความแตกต่างอย่างมีนัยสำคัญจากค่าเฉลี่ยของประชากรทั่วไป นั่นคือ μ ≠150 เซนติเมตร
ดังนั้น การทดสอบ t-Test ในสถานการณ์นี้จะเป็นการทดสอบทางเดียว (One-tailed t-Test) โดยที่เราสนใจเฉพาะการทดสอบว่าค่าเฉลี่ยส่วนสูงของเด็กที่เข้าร่วมโปรแกรมมีค่ามากกว่า 150 เซนติเมตรหรือไม่ หากค่า p-value จากการทดสอบนั้นน้อยกว่า 0.05 เราจะปฏิเสธสมมติฐานหลัก (H0) และยอมรับสมมติฐานทางเลือก (H1) เราจะสามารถสรุปได้ว่าโปรแกรมออกกำลังกายมีผลทำให้เด็กเหล่านั้นมีส่วนสูงเพิ่มขึ้นอย่างมีนัยสำคัญเมื่อเปรียบเทียบกับค่าเฉลี่ยของส่วนสูงทั่วไปของเด็กในวัยเดียวกันค่ะ
การทดสอบคู่ตัวอย่าง (Paired Samples Test)
หรือที่เรียกว่าการทดสอบ t-Test แบบคู่ เป็นวิธีการทางสถิติที่ใช้เพื่อเปรียบเทียบค่าเฉลี่ยของชุดข้อมูลสองชุดที่มีความสัมพันธ์กัน ซึ่งข้อมูลสองชุดมีความสัมพันธ์กันหมายความว่าข้อมูลที่ได้มาจากกลุ่มตัวอย่างเดียวกันในสองสถานการณ์ที่แตกต่างกันหรือในสองช่วงเวลาที่แตกต่างกัน เช่น ก่อนและหลังการทดลอง, วัดความดันโลหิตของผู้ป่วยก่อนและหลังการให้ยา, การวัดน้ำหนักของบุคคลเดียวกันก่อนและหลังการเข้าโปรแกรมลดน้ำหนัก, การวัดคะแนนการทดสอบของนักเรียนก่อนและหลังการเข้าหลักสูตรการฝึกอบรม
ยกตัวอย่างเช่น:
การวัดคะแนนสอบของนักเรียนก่อนและหลังจากที่พวกเขาเข้าร่วมหลักสูตรการศึกษาเพิ่มเติม เราต้องการทราบว่าคะแนนสอบมีการเปลี่ยนแปลงอย่างมีนัยสำคัญหลังจากการสอนหรือไม่ ซึ่งในการทดสอบนี้ เราจะมีคะแนนสอบสองชุด ได้แก่ ชุดแรกคือคะแนนสอบก่อนการเข้ารับการสอนและชุดที่สองคือคะแนนสอบหลังจากการเข้ารับการสอน ซึ่งสามารถตั้งสมมติฐานหลักและสมมติฐานรองได้ดังนี้:
สมมติฐานหลัก (Null Hypothesis, H0): คะแนนสอบของนักเรียนไม่มีการเปลี่ยนแปลงอย่างมีนัยสำคัญหลังจากการเข้าร่วมหลักสูตร นั่นหมายความว่า ค่าเฉลี่ยของคะแนนสอบก่อนและหลังการสอนจะเท่ากัน
สมมติฐานรอง (Alternative Hypothesis, H1): คะแนนสอบของนักเรียนมีการเปลี่ยนแปลงอย่างมีนัยสำคัญหลังจากการเข้าร่วมหลักสูตร นั่นหมายความว่า ค่าเฉลี่ยของคะแนนสอบหลังการสอนมีค่าที่สูงกว่าหรือต่ำกว่าคะแนนสอบก่อนการสอน
ดังนั้นการทดสอบสมมติฐานเหล่านี้จะใช้ข้อมูลคะแนนสอบก่อนและหลังการสอนจากนักเรียนเดียวกัน เพื่อตรวจสอบว่ามีการเปลี่ยนแปลงที่มีนัยสำคัญในคะแนนสอบหลังจากได้รับการสอนหรือไม่ หากค่า p-value ที่ได้จากการทดสอบน้อยกว่าระดับนัยสำคัญที่กำหนด (โดยปกติคือ 0.05) เราสามารถปฏิเสธสมมติฐานหลักและยอมรับสมมติฐานรองได้ว่าการเข้าร่วมหลักสูตรการศึกษามีผลต่อการเปลี่ยนแปลงคะแนนสอบของนักเรียน.
การทดสอบอิสระ (Independent Test)
ใช้เพื่อเปรียบเทียบค่าเฉลี่ยของสองกลุ่มที่ไม่มีความสัมพันธ์กัน ในทางสถิติ สองกลุ่มนี้จะถูกมองว่าเป็นอิสระจากกันและกัน นั่นคือ การวัดค่าในกลุ่มหนึ่งไม่มีผลต่อการวัดค่าในกลุ่มอื่น
ยกตัวอย่างเช่น:
วัดความแตกต่างระหว่างน้ำหนักเฉลี่ยของเด็กแรกเกิดในสองโรงพยาบาลว่าต่างกันหรือไม่ โดยเราจะเลือกตัวอย่างของเด็กแรกเกิดจากแต่ละโรงพยาบาลแล้ววัดน้ำหนักของพวกเขา หลังจากนั้น เราจะใช้การทดสอบ t-Test แบบอิสระเพื่อเปรียบเทียบค่าเฉลี่ยน้ำหนักของเด็กแรกเกิดจากโรงพยาบาลทั้งสอง ซึ่งสามารถตั้งสมมติฐานหลักและสมมติฐานรองสามารถเขียนได้ดังนี้:
สมมติฐานหลัก (Null Hypothesis, H0): ไม่มีความแตกต่างในน้ำหนักเฉลี่ยของเด็กแรกเกิดระหว่างสองโรงพยาบาล นั่นคือค่าเฉลี่ยของน้ำหนักเด็กแรกเกิดในโรงพยาบาล A และโรงพยาบาล B เท่ากัน (μA=μB).
สมมติฐานรอง (Alternative Hypothesis, H1): มีความแตกต่างในน้ำหนักเฉลี่ยของเด็กแรกเกิดระหว่างสองโรงพยาบาล นั่นคือค่าเฉลี่ยของน้ำหนักเด็กแรกเกิดในโรงพยาบาล A ไม่เท่ากับค่าเฉลี่ยในโรงพยาบาล B (μA ≠μB).
ดังนั้นการทดสอบ t-Test แบบอิสระจะเปรียบเทียบน้ำหนักเฉลี่ยของเด็กแรกเกิดจากโรงพยาบาลทั้งสอง และหากค่า p-value ที่ได้จากการทดสอบน้อยกว่าระดับนัยสำคัญที่กำหนด (โดยปกติคือ 0.05) เราจะปฏิเสธสมมติฐานหลัก H0 และยอมรับสมมติฐานรอง H1 ว่ามีความแตกต่างอย่างมีนัยสำคัญในน้ำหนักเฉลี่ยของเด็กแรกเกิดระหว่างสองโรงพยาบาลนั้น
สูตร T-test
สูตรของ t-test มีหลายรูปแบบขึ้นอยู่กับประเภทของการทดสอบ ดังนี้
สูตร Independent t-test
ซึ่งสูตรนี้เป็นสูตรพื้นฐานสำหรับการทดสอบแบบ Independent t-test ซึ่งใช้เพื่อเปรียบเทียบค่าเฉลี่ยของสองกลุ่มที่แยกกันคือ
t=\frac{\bar{X}_1-\bar{X}_2}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}
x̄1 และ x̄2 ค่าเฉลี่ยของสองกลุ่มที่เราต้องการเปรียบเทียบ (คำนวณค่าเฉลี่ยของแต่ละกลุ่ม (Xˉ1 และ Xˉ2) แยกกัน โดยการหาผลรวมของข้อมูลในแต่ละกลุ่มแล้วหารด้วยจำนวนข้อมูลในกลุ่มนั้น)
S12 และ S22 ความแปรปรวน (variance) ของแต่ละกลุ่ม ซึ่งเป็นตัวชี้วัดว่าข้อมูลในแต่ละกลุ่มกระจายตัวออกจากค่าเฉลี่ยมากน้อยเพียงใด
N1 และ N2 จำนวนข้อมูลหรือจำนวนตัวอย่างที่มีในแต่ละกลุ่ม
สูตร One-Sample T-Test
สำหรับการทดสอบ t-Test แบบตัวอย่างเดียว (One-Sample T-Test) ใช้เพื่อเปรียบเทียบค่าเฉลี่ยของตัวอย่างกับค่าเฉลี่ยที่รู้อยู่แล้วของประชากร หรือค่าที่กำหนดไว้ล่วงหน้า มีสูตรดังนี้:
t=\frac{\bar{X}-\mu}{\left(\frac{s}{\sqrt{n}}\right)}
Xˉ คือค่าเฉลี่ยของตัวอย่าง (คำนวณค่าเฉลี่ย (Xˉ) ของตัวอย่างโดยการหาผลรวมของข้อมูลทั้งหมดในตัวอย่างนั้น แล้วหารด้วยจำนวนของข้อมูล (จำนวนตัวอย่าง n)
μ คือค่าเฉลี่ยของประชากรที่กำหนดไว้ล่วงหน้าหรือค่าที่เราต้องการทดสอบกับตัวอย่าง
s คือส่วนเบี่ยงเบนมาตรฐานของตัวอย่าง
n คือจำนวนข้อมูลในตัวอย่าง
ค่า t ที่ได้จากสูตรนี้จะบอกเราว่าค่าเฉลี่ยของตัวอย่างมีความแตกต่างจากค่าเฉลี่ยที่กำหนดไว้ล่วงหน้าของประชากรมากน้อยเพียงใด หากค่า t นี้มีค่ามากหรือน้อยอย่างมีนัยสำคัญเมื่อเทียบกับค่าจากการแจกแจง t ที่ระดับนัยสำคัญที่กำหนดไว้ (เช่น 0.05) นั่นหมายความว่าค่าเฉลี่ยของตัวอย่างมีความแตกต่างที่มีนัยสำคัญทางสถิติจากค่าที่เราต้องการทดสอบ.
สูตรPair-Sample T-Test
สูตรสำหรับการทดสอบ t-Test แบบคู่ (Paired-Sample T-Test) ใช้เพื่อเปรียบเทียบค่าเฉลี่ยของข้อมูลที่เกี่ยวข้องกันในสองชุด ซึ่งมักจะเป็นการวัดก่อนและหลังการทดลอง มีสูตรดังนี้:
t=\frac{\bar{d}}{s_d / \sqrt{n}}
dˉ คือค่าเฉลี่ยของความแตกต่างของคู่ข้อมูล (ค่าวัดหลังการทดลอง ลบด้วย ค่าวัดก่อนการทดลอง) จากนั้นหาผลรวมของความแตกต่างเหล่านี้และหารด้วยจำนวนคู่ข้อมูล.
sd คือส่วนเบี่ยงเบนมาตรฐานของความแตกต่างของคู่ข้อมูล
n คือจำนวนของคู่ข้อมูล
ค่า t ที่ได้จากการคำนวณนี้จะถูกนำไปเปรียบเทียบกับค่าจากการแจกแจง t ที่ระดับนัยสำคัญที่กำหนดเอาไว้ เช่น 0.05 หรือ 5% เพื่อดูว่ามีความแตกต่างระหว่างค่าเฉลี่ยก่อนและหลังการทดลองที่มีนัยสำคัญทางสถิติหรือไม่.
นอกจากนั้นคุณสามารถอ่านบทความเกี่ยวกับ การทดสอบสถิติด้วย T-test ใน Excel