ความหมาย T-test

หากกล่าวถึงการทดสอบทางสถิติ T-test ที่ใช้เพื่อ เปรียบเทียบค่าเฉลี่ย (means) ของสองกลุ่ม หรือเพื่อทดสอบค่าเฉลี่ยของกลุ่มเดียว กับค่าที่กำหนดไว้ จากประโยคข้างต้นลองนึกภาพว่าคุณมีลูกโป่งสองลูก ลูกโป่งแต่ละลูกแทนกลุ่มของคนที่เราสนใจ เช่น กลุ่มของนักเรียนห้อง A และห้อง B ตอนนี้คุณอยากรู้ว่านักเรียนในห้องไหนมีคะแนนเฉลี่ยในการสอบสูงกว่ากัน

T-test เป็นเหมือนเครื่องมือที่ช่วยให้คุณวัดและเปรียบเทียบขนาดของลูกโป่งทั้งสองว่ามีความแตกต่างกันมากแค่ไหน หากลูกโป่งมีขนาดใกล้เคียงกันมาก คุณอาจจะบอกไม่ได้ว่ามีความแตกต่างกัน แต่ถ้าหากลูกโป่งหนึ่งใหญ่กว่าอย่างเห็นได้ชัด สามารถบอกได้ว่าลูกโป่งทั้งสองมีความแตกต่างอย่างมีนัยสำคัญนั่นเองค่ะ

ในการทดสอบสถิติที่เรียกว่า T-test, ค่า t เป็นตัวเลขเพื่อดูว่าผลลัพธ์ที่เราสังเกตเห็นนั้นเกิดขึ้นจากเหตุผลที่แท้จริงหรือเป็นเพียงจากโอกาส ในตัวอย่างของลูกโป่งที่ให้ไว้ เราสนใจว่าลูกโป่งแต่ละลูก (หรือกลุ่มข้อมูล) มีขนาดที่แตกต่างกันอย่างมีนัยสำคัญหรือไม่ ดังนั้นค่า t จะช่วยเราอธิบายในเรื่องนี้ค่ะ

หาก ค่า t ที่คำนวณได้มีค่าสูงมากจะบ่งบอกว่าการที่เราเห็นลูกโป่งหนึ่งใหญ่กว่าอีกลูกหนึ่ง เปรียบเสมือนว่าการเปรียบเทียบคะแนนเฉลี่ยของนักเรียนในห้อง A และ B ได้ ค่า t  ที่สูงมาก เราสามารถพูดได้ว่าห้องหนึ่งมีคะแนนเฉลี่ยที่สูงกว่าห้องอื่นอย่างมีนัยสำคัญ เพื่อตรวจสอบขนาดของลูกโป่งแต่ละลูกนั้นแตกต่างกันอย่างมีนัยสำคัญหรือไม่ เราจึงใช้ T-test ซึ่งเหมือนกับการใช้เครื่องมือวัดขนาดลูกโป่ง โดยเริ่มต้นจากการเก็บคะแนนของนักเรียนทุกคนในห้อง A และห้อง B ซึ่งเปรียบเสมือนการวัดขนาดลูกโป่ง ถัดมาเราจะคำนวณคะแนนเฉลี่ยของนักเรียนในแต่ละห้องซึ่งเปรียบเสมือนการหาขนาดเฉลี่ยของลูกโป่ง และเราใช้ T-test เปรียบเทียบคะแนนเฉลี่ยที่เราได้ ซึ่งเปรียบเสมือนการใช้เครื่องมือวัดเพื่อดูว่าขนาดเฉลี่ยของลูกโป่งแตกต่างกันอย่างมีนัยสำคัญหรือไม่

หาก ค่า t ที่ได้จากการทดสอบนั้นสูงมาก แสดงว่าคะแนนเฉลี่ยของนักเรียนในห้องหนึ่งสูงกว่าอีกห้องหนึ่งอย่างมีนัยสำคัญ จึงกล่าวว่าลูกโป่งหนึ่งใหญ่กว่าอีกลูกหนึ่งอย่างเห็นได้ชัดเจน และคุณสามารถมั่นใจได้ว่าไม่ใช่โอกาสหรือความผิดพลาดจากการวัดที่ทำให้ลมพัดเข้ามาในห้องจึงทำให้ลูกโป่งหนึ่งดูใหญ่ขึ้นในทางกลับกัน หาก ค่า t ต่ำ แสดงว่าคะแนนเฉลี่ยของห้องทั้งสองไม่มีความแตกต่างกันอย่างมีนัยสำคัญซึ่งเหมือนกับการพบว่าขนาดของลูกโป่งทั้งสองลูกค่อนข้างใกล้เคียงกัน และคุณไม่สามารถบอกได้ว่ามีความแตกต่างอย่างชัดเจน จึงสรุปง่ายๆว่า T-test คือเครื่องมือที่ใช้ในการตัดสินใจว่าความแตกต่างที่เราเห็นในกลุ่มข้อมูลหนึ่งๆ นั้นมีนัยสำคัญหรือไม่  โดยทั่วไป T-test  จะบอกเราว่าค่าเฉลี่ยของกลุ่มตัวอย่างมีความแตกต่างจากค่าเฉลี่ยของประชากรหรือจากค่าเฉลี่ยของกลุ่มอื่นอย่างมีนัยสำคัญทางสถิติหรือไม่ โดยอาศัยการคำนวณ ค่า t และการดูค่า p-value

t-test และ p value

เมื่อเราทำการทดสอบ t-Test เราจะได้ค่าสถิติ t จากข้อมูลของเรา ค่า t นี้แสดงถึงความแตกต่างระหว่างค่าเฉลี่ยที่เราสังเกตได้และค่าเฉลี่ยที่สมมติไว้ภายใต้สมมติฐานหลัก จากนั้นเราจะเปรียบเทียบค่าสถิติ t ที่คำนวณได้กับค่า p ที่ระดับนัยสำคัญที่เรากำหนด (เช่น 0.05)

ค่า p-value จะบอกเราว่า:

  • หากค่า p-value น้อยกว่าระดับนัยสำคัญที่เรากำหนด (เช่น 0.05) นั่นหมายความว่าผลลัพธ์ที่เราสังเกตได้นั้นไม่น่าจะเกิดขึ้นโดยบังเอิญ และเราจะปฏิเสธสมมติฐานหลัก
  • หากค่า p-value สูงกว่าระดับนัยสำคัญ นั่นหมายความว่าผลลัพธ์ที่เราสังเกตอาจเกิดขึ้นได้โดยบังเอิญและเราไม่มีหลักฐานเพียงพอที่จะปฏิเสธสมมติฐานหลักหรือยอมรับสมมติฐานรองนั่นเอง

ในการทดสอบสมมติฐาน t-Test นั้นจะมีสองสมมติฐานหลัก:

สมมติฐานหลัก (Null Hypothesis): ไม่มีความแตกต่างระหว่างกลุ่มหรือประชากรที่เรากำลังศึกษา

  • ตัวอย่าง: H0​:μ1​=μ2​ หมายความว่าค่าเฉลี่ยของกลุ่มที่หนึ่ง (μ1​) เท่ากับค่าเฉลี่ยของกลุ่มที่สอง (μ2​)

สมมติฐานรอง (Alternative Hypothesis): มีความแตกต่างทางสถิติระหว่างกลุ่มหรือประชากร

  • ตัวอย่าง: Ha :μ1​=μ2 หมายความว่าค่าเฉลี่ยของกลุ่มที่หนึ่งไม่เท่ากับค่าเฉลี่ยของกลุ่มที่สอง

ประเภทของ t-Test

การทดสอบ t-Test แบบตัวอย่างเดียว (One Sample)

การทดสอบ t-Test แบบตัวอย่างเดียว (One sample) เป็นเครื่องมือทางสถิติที่ใช้เพื่อเปรียบเทียบค่าเฉลี่ยของกลุ่มตัวอย่างที่เรามีกับค่าเฉลี่ยที่กำหนดไว้ล่วงหน้า (ที่เรียกว่า ค่าทดสอบ หรือ population mean) เพื่อดูว่ามีความแตกต่างอย่างมีนัยสำคัญหรือไม่ระหว่างทั้งสองค่าเหล่านี้ ซึ่งสามารถใช้ในหลากหลายสถานการณ์

ยกตัวอย่างเช่น:

สมมุติว่าเราต้องการทดสอบว่าโปรแกรมการออกกำลังกายใหม่มีผลต่อส่วนสูงของเด็กในวัยเจริญเติบโตหรือไม่ และเรามีค่าเฉลี่ยของส่วนสูงทั่วไปของเด็กในวัยนี้จากข้อมูลที่มีอยู่เป็น 150 เซนติเมตร เราทำการสุ่มเลือกเด็กจำนวน 30 คนที่เข้าร่วมโปรแกรมออกกำลังกายนี้ และจดส่วนสูงของพวกเขาหลังจากเข้าโปรแกรม 6 เดือน จากการวัดพบว่าค่าเฉลี่ยส่วนสูงของกลุ่มตัวอย่างเด็กที่เข้าร่วมโปรแกรมคือ 153 เซนติเมตร

เราจะใช้ t-Test แบบตัวอย่างเดียวเพื่อเปรียบเทียบค่าเฉลี่ยส่วนสูงของกลุ่มเด็กที่เข้าโปรแกรม (153 เซนติเมตร) กับค่าเฉลี่ยที่เราคาดหวังจากประชากรทั่วไป (150 เซนติเมตร) ค่ะ

โดยสมมติฐานที่เราจะตั้งสำหรับการทดสอบ t-Test แบบตัวอย่างเดียวควรเป็นดังนี้:

สมมติฐานหลัก (Null Hypothesis, H0​): ค่าเฉลี่ยส่วนสูงของกลุ่มเด็กที่เข้าโปรแกรมออกกำลังกายไม่แตกต่างจากค่าเฉลี่ยของประชากรทั่วไปที่เราคาดหวังไว้ ซึ่งในกรณีนี้คือ 150 เซนติเมตร นั่นคือ μ=150 เซนติเมตร

สมมติฐานทางเลือก (Alternative Hypothesis, H1​): ค่าเฉลี่ยส่วนสูงของกลุ่มเด็กที่เข้าโปรแกรมออกกำลังกายมีความแตกต่างอย่างมีนัยสำคัญจากค่าเฉลี่ยของประชากรทั่วไป นั่นคือ μ ≠150 เซนติเมตร

ดังนั้น การทดสอบ t-Test ในสถานการณ์นี้จะเป็นการทดสอบทางเดียว (One-tailed t-Test) โดยที่เราสนใจเฉพาะการทดสอบว่าค่าเฉลี่ยส่วนสูงของเด็กที่เข้าร่วมโปรแกรมมีค่ามากกว่า 150 เซนติเมตรหรือไม่ หากค่า p-value จากการทดสอบนั้นน้อยกว่า 0.05 เราจะปฏิเสธสมมติฐานหลัก (H0​) และยอมรับสมมติฐานทางเลือก (H1​)  เราจะสามารถสรุปได้ว่าโปรแกรมออกกำลังกายมีผลทำให้เด็กเหล่านั้นมีส่วนสูงเพิ่มขึ้นอย่างมีนัยสำคัญเมื่อเปรียบเทียบกับค่าเฉลี่ยของส่วนสูงทั่วไปของเด็กในวัยเดียวกันค่ะ

การทดสอบคู่ตัวอย่าง (Paired Samples Test)

หรือที่เรียกว่าการทดสอบ t-Test แบบคู่ เป็นวิธีการทางสถิติที่ใช้เพื่อเปรียบเทียบค่าเฉลี่ยของชุดข้อมูลสองชุดที่มีความสัมพันธ์กัน ซึ่งข้อมูลสองชุดมีความสัมพันธ์กันหมายความว่าข้อมูลที่ได้มาจากกลุ่มตัวอย่างเดียวกันในสองสถานการณ์ที่แตกต่างกันหรือในสองช่วงเวลาที่แตกต่างกัน เช่น ก่อนและหลังการทดลอง, วัดความดันโลหิตของผู้ป่วยก่อนและหลังการให้ยา, การวัดน้ำหนักของบุคคลเดียวกันก่อนและหลังการเข้าโปรแกรมลดน้ำหนัก, การวัดคะแนนการทดสอบของนักเรียนก่อนและหลังการเข้าหลักสูตรการฝึกอบรม

ยกตัวอย่างเช่น:

การวัดคะแนนสอบของนักเรียนก่อนและหลังจากที่พวกเขาเข้าร่วมหลักสูตรการศึกษาเพิ่มเติม เราต้องการทราบว่าคะแนนสอบมีการเปลี่ยนแปลงอย่างมีนัยสำคัญหลังจากการสอนหรือไม่ ซึ่งในการทดสอบนี้ เราจะมีคะแนนสอบสองชุด ได้แก่ ชุดแรกคือคะแนนสอบก่อนการเข้ารับการสอนและชุดที่สองคือคะแนนสอบหลังจากการเข้ารับการสอน ซึ่งสามารถตั้งสมมติฐานหลักและสมมติฐานรองได้ดังนี้:

สมมติฐานหลัก (Null Hypothesis, H0​): คะแนนสอบของนักเรียนไม่มีการเปลี่ยนแปลงอย่างมีนัยสำคัญหลังจากการเข้าร่วมหลักสูตร นั่นหมายความว่า ค่าเฉลี่ยของคะแนนสอบก่อนและหลังการสอนจะเท่ากัน

สมมติฐานรอง (Alternative Hypothesis, H1​): คะแนนสอบของนักเรียนมีการเปลี่ยนแปลงอย่างมีนัยสำคัญหลังจากการเข้าร่วมหลักสูตร นั่นหมายความว่า ค่าเฉลี่ยของคะแนนสอบหลังการสอนมีค่าที่สูงกว่าหรือต่ำกว่าคะแนนสอบก่อนการสอน

ดังนั้นการทดสอบสมมติฐานเหล่านี้จะใช้ข้อมูลคะแนนสอบก่อนและหลังการสอนจากนักเรียนเดียวกัน เพื่อตรวจสอบว่ามีการเปลี่ยนแปลงที่มีนัยสำคัญในคะแนนสอบหลังจากได้รับการสอนหรือไม่ หากค่า p-value ที่ได้จากการทดสอบน้อยกว่าระดับนัยสำคัญที่กำหนด (โดยปกติคือ 0.05) เราสามารถปฏิเสธสมมติฐานหลักและยอมรับสมมติฐานรองได้ว่าการเข้าร่วมหลักสูตรการศึกษามีผลต่อการเปลี่ยนแปลงคะแนนสอบของนักเรียน.

การทดสอบอิสระ (Independent Test)

ใช้เพื่อเปรียบเทียบค่าเฉลี่ยของสองกลุ่มที่ไม่มีความสัมพันธ์กัน ในทางสถิติ สองกลุ่มนี้จะถูกมองว่าเป็นอิสระจากกันและกัน นั่นคือ การวัดค่าในกลุ่มหนึ่งไม่มีผลต่อการวัดค่าในกลุ่มอื่น

ยกตัวอย่างเช่น:

วัดความแตกต่างระหว่างน้ำหนักเฉลี่ยของเด็กแรกเกิดในสองโรงพยาบาลว่าต่างกันหรือไม่ โดยเราจะเลือกตัวอย่างของเด็กแรกเกิดจากแต่ละโรงพยาบาลแล้ววัดน้ำหนักของพวกเขา หลังจากนั้น เราจะใช้การทดสอบ t-Test แบบอิสระเพื่อเปรียบเทียบค่าเฉลี่ยน้ำหนักของเด็กแรกเกิดจากโรงพยาบาลทั้งสอง ซึ่งสามารถตั้งสมมติฐานหลักและสมมติฐานรองสามารถเขียนได้ดังนี้:

สมมติฐานหลัก (Null Hypothesis, H0​): ไม่มีความแตกต่างในน้ำหนักเฉลี่ยของเด็กแรกเกิดระหว่างสองโรงพยาบาล นั่นคือค่าเฉลี่ยของน้ำหนักเด็กแรกเกิดในโรงพยาบาล A และโรงพยาบาล B เท่ากัน (μA​=μB​).

สมมติฐานรอง (Alternative Hypothesis, H1​): มีความแตกต่างในน้ำหนักเฉลี่ยของเด็กแรกเกิดระหว่างสองโรงพยาบาล นั่นคือค่าเฉลี่ยของน้ำหนักเด็กแรกเกิดในโรงพยาบาล A ไม่เท่ากับค่าเฉลี่ยในโรงพยาบาล B (μA​ ≠μB​).

ดังนั้นการทดสอบ t-Test แบบอิสระจะเปรียบเทียบน้ำหนักเฉลี่ยของเด็กแรกเกิดจากโรงพยาบาลทั้งสอง และหากค่า p-value ที่ได้จากการทดสอบน้อยกว่าระดับนัยสำคัญที่กำหนด (โดยปกติคือ 0.05) เราจะปฏิเสธสมมติฐานหลัก H0​ และยอมรับสมมติฐานรอง H1​ ว่ามีความแตกต่างอย่างมีนัยสำคัญในน้ำหนักเฉลี่ยของเด็กแรกเกิดระหว่างสองโรงพยาบาลนั้น

สูตร T-test

สูตรของ t-test มีหลายรูปแบบขึ้นอยู่กับประเภทของการทดสอบ ดังนี้

สูตร Independent t-test

ซึ่งสูตรนี้เป็นสูตรพื้นฐานสำหรับการทดสอบแบบ Independent t-test ซึ่งใช้เพื่อเปรียบเทียบค่าเฉลี่ยของสองกลุ่มที่แยกกันคือ

t=\frac{\bar{X}_1-\bar{X}_2}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}

x̄1 และ x̄2  ค่าเฉลี่ยของสองกลุ่มที่เราต้องการเปรียบเทียบ (คำนวณค่าเฉลี่ยของแต่ละกลุ่ม (Xˉ1​ และ Xˉ2​) แยกกัน โดยการหาผลรวมของข้อมูลในแต่ละกลุ่มแล้วหารด้วยจำนวนข้อมูลในกลุ่มนั้น)

S12 และ S22  ความแปรปรวน (variance) ของแต่ละกลุ่ม ซึ่งเป็นตัวชี้วัดว่าข้อมูลในแต่ละกลุ่มกระจายตัวออกจากค่าเฉลี่ยมากน้อยเพียงใด

N1 และ N2  จำนวนข้อมูลหรือจำนวนตัวอย่างที่มีในแต่ละกลุ่ม

สูตร One-Sample T-Test

สำหรับการทดสอบ t-Test แบบตัวอย่างเดียว (One-Sample T-Test) ใช้เพื่อเปรียบเทียบค่าเฉลี่ยของตัวอย่างกับค่าเฉลี่ยที่รู้อยู่แล้วของประชากร หรือค่าที่กำหนดไว้ล่วงหน้า มีสูตรดังนี้:

t=\frac{\bar{X}-\mu}{\left(\frac{s}{\sqrt{n}}\right)}

Xˉ คือค่าเฉลี่ยของตัวอย่าง (คำนวณค่าเฉลี่ย (Xˉ) ของตัวอย่างโดยการหาผลรวมของข้อมูลทั้งหมดในตัวอย่างนั้น แล้วหารด้วยจำนวนของข้อมูล (จำนวนตัวอย่าง n)

μ คือค่าเฉลี่ยของประชากรที่กำหนดไว้ล่วงหน้าหรือค่าที่เราต้องการทดสอบกับตัวอย่าง

s คือส่วนเบี่ยงเบนมาตรฐานของตัวอย่าง

n คือจำนวนข้อมูลในตัวอย่าง

ค่า t ที่ได้จากสูตรนี้จะบอกเราว่าค่าเฉลี่ยของตัวอย่างมีความแตกต่างจากค่าเฉลี่ยที่กำหนดไว้ล่วงหน้าของประชากรมากน้อยเพียงใด หากค่า t นี้มีค่ามากหรือน้อยอย่างมีนัยสำคัญเมื่อเทียบกับค่าจากการแจกแจง t ที่ระดับนัยสำคัญที่กำหนดไว้ (เช่น 0.05) นั่นหมายความว่าค่าเฉลี่ยของตัวอย่างมีความแตกต่างที่มีนัยสำคัญทางสถิติจากค่าที่เราต้องการทดสอบ.

สูตรPair-Sample T-Test

สูตรสำหรับการทดสอบ t-Test แบบคู่ (Paired-Sample T-Test) ใช้เพื่อเปรียบเทียบค่าเฉลี่ยของข้อมูลที่เกี่ยวข้องกันในสองชุด ซึ่งมักจะเป็นการวัดก่อนและหลังการทดลอง มีสูตรดังนี้:

t=\frac{\bar{d}}{s_d / \sqrt{n}}

dˉ คือค่าเฉลี่ยของความแตกต่างของคู่ข้อมูล (ค่าวัดหลังการทดลอง ลบด้วย ค่าวัดก่อนการทดลอง) จากนั้นหาผลรวมของความแตกต่างเหล่านี้และหารด้วยจำนวนคู่ข้อมูล.

sd​ คือส่วนเบี่ยงเบนมาตรฐานของความแตกต่างของคู่ข้อมูล

n คือจำนวนของคู่ข้อมูล

ค่า t ที่ได้จากการคำนวณนี้จะถูกนำไปเปรียบเทียบกับค่าจากการแจกแจง t ที่ระดับนัยสำคัญที่กำหนดเอาไว้ เช่น 0.05 หรือ 5% เพื่อดูว่ามีความแตกต่างระหว่างค่าเฉลี่ยก่อนและหลังการทดลองที่มีนัยสำคัญทางสถิติหรือไม่.

นอกจากนั้นคุณสามารถอ่านบทความเกี่ยวกับ การทดสอบสถิติด้วย T-test ใน Excel