¿Qué es la prueba t?
La prueba t es una prueba estadística que se utiliza para comparar las medias de dos grupos o para determinar si la media de un grupo difiere de un valor específico.
Imagina que tienes dos globos. Cada globo representa un grupo de personas que te interesa estudiar, como los estudiantes de la Clase A y la Clase B. Quieres saber qué clase tiene el promedio de calificaciones más alto. La prueba t funciona como una herramienta que te ayuda a medir y comparar los tamaños de ambos globos para ver qué tan diferentes son.
Si los globos son muy similares en tamaño, probablemente no puedas distinguir si son diferentes. Pero si un globo es notablemente más grande que el otro, puedes decir que los dos globos difieren significativamente.
¿Qué es el valor t?
En la prueba estadística llamada prueba t, el valor t es un número que nos indica si los resultados que observamos se deben a una razón real o simplemente al azar.
En el ejemplo de los globos, nos interesa saber si cada globo (o grupo de datos) tiene un tamaño significativamente diferente. El valor t nos ayuda a entender esto.
Si el valor t calculado es muy alto, indica que ver un globo más grande que el otro (similar a comparar los promedios de calificaciones de los estudiantes en la Clase A y B y obtener un valor t alto) significa que podemos decir que una clase tiene un promedio significativamente mayor que la otra.
Para verificar si el tamaño de cada globo difiere significativamente, usamos una prueba t, que funciona como una herramienta de medición. Comenzamos recopilando las calificaciones de todos los estudiantes de la Clase A y la Clase B, similar a medir los tamaños de los globos.
Luego, calculamos el promedio de calificaciones de los estudiantes en cada clase, lo que equivale a encontrar el tamaño promedio de los globos. Usamos la prueba t para comparar los promedios obtenidos, similar a usar una herramienta de medición para ver si los tamaños promedio de los globos difieren significativamente.
Cómo leer los valores de la prueba t
Si el valor t de la prueba es muy alto, significa que el promedio de calificaciones de los estudiantes en una clase es significativamente mayor que en la otra. Es como decir que un globo es claramente más grande que el otro, y puedes estar seguro de que no se debe al azar ni a un error de medición, como si el viento entrara a la habitación haciendo que un globo parezca más grande.
Por otro lado, si el valor t es bajo, significa que los promedios de calificaciones de ambas clases no difieren significativamente, similar a encontrar que ambos globos tienen aproximadamente el mismo tamaño y no puedes afirmar claramente que hay una diferencia.
En términos simples, una prueba t es una herramienta utilizada para decidir si la diferencia que observamos en un conjunto de datos es significativa o no. Generalmente, una prueba t nos indica si la media de una muestra difiere significativamente de la media poblacional o de la media de otro grupo, utilizando el valor t calculado y el valor p.
Prueba t y valor p
Cuando realizamos una prueba t, obtenemos un estadístico t a partir de nuestros datos. Este valor t muestra la diferencia entre la media que observamos y la media hipotética bajo la hipótesis nula.
Luego comparamos el estadístico t calculado con el valor p al nivel de significancia que establecimos (por ejemplo, 0.05).
El valor p nos indica:
- Si el valor p es menor que el nivel de significancia que establecimos (por ejemplo, 0.05), significa que los resultados que observamos es poco probable que ocurran por azar, y rechazamos la hipótesis nula.
- Si el valor p es mayor que el nivel de significancia, significa que los resultados que observamos podrían ocurrir por azar, y no tenemos suficiente evidencia para rechazar la hipótesis nula o aceptar la hipótesis alternativa.
En la prueba de hipótesis con prueba t, hay dos hipótesis principales:
Hipótesis nula: No existe diferencia entre los grupos o poblaciones que estamos estudiando.
- Ejemplo: H₀: μ₁ es igual a μ₂ significa que la media del primer grupo (μ₁) es igual a la media del segundo grupo (μ₂)
Hipótesis alternativa: Existe una diferencia estadísticamente significativa entre los grupos o poblaciones.
- Ejemplo: Hₐ: μ₁ ≠ μ₂ significa que la media del primer grupo no es igual a la media del segundo grupo
¿Cuántos tipos de prueba t existen?
Existen 3 tipos de pruebas t:
Figura 1: Diagrama de decisión para elegir el tipo correcto de prueba t según tu diseño de investigación
1. Prueba t de una muestra
La prueba t de una muestra es una herramienta estadística utilizada para comparar la media de una muestra que tenemos con un valor predeterminado (llamado valor de prueba o media poblacional) para ver si existe una diferencia significativa entre los dos valores. Se puede usar en diversas situaciones.
Por ejemplo:
Supongamos que queremos probar si un nuevo programa de ejercicios afecta la estatura de niños en crecimiento, y tenemos un valor de estatura promedio para niños de esta edad a partir de datos existentes de 150 centímetros.
Seleccionamos aleatoriamente 30 niños que participan en este programa de ejercicios y registramos sus estaturas después de 6 meses en el programa. Encontramos que la estatura promedio del grupo de niños en el programa es de 153 centímetros.
Usaremos una prueba t de una muestra para comparar la estatura promedio de los niños en el programa (153 cm) con el promedio esperado de la población general (150 cm).
Las hipótesis que debemos establecer para la prueba t de una muestra son:
Hipótesis nula (H₀): La estatura promedio de los niños en el programa de ejercicios no difiere del promedio esperado de la población, que en este caso es 150 centímetros. Es decir, μ es igual a 150 centímetros.
Hipótesis alternativa (H₁): La estatura promedio de los niños en el programa de ejercicios difiere significativamente del promedio de la población general. Es decir, μ ≠ 150 centímetros.
Por lo tanto, la prueba t en esta situación sería una prueba t unilateral, donde solo nos interesa probar si la estatura promedio de los niños que participaron en el programa es mayor que 150 centímetros.
Si el valor p de la prueba es menor que 0.05, rechazamos la hipótesis nula (H₀) y aceptamos la hipótesis alternativa (H₁). Podemos concluir que el programa de ejercicios tiene un efecto significativo en aumentar la estatura de estos niños en comparación con la estatura promedio general de niños de la misma edad.
2. Prueba t de muestras pareadas
También llamada prueba t pareada, es un método estadístico utilizado para comparar las medias de dos conjuntos de datos relacionados.
Dos conjuntos de datos relacionados significan datos que provienen del mismo grupo de muestra en dos situaciones diferentes o en dos momentos diferentes, como:
- Antes y después de un experimento
- Medir la presión arterial de pacientes antes y después de la medicación
- Medir el peso de la misma persona antes y después de un programa de pérdida de peso
- Medir las calificaciones de los estudiantes antes y después de asistir a un curso de capacitación
Por ejemplo:
Medir las calificaciones de los estudiantes antes y después de participar en un curso de educación adicional. Queremos saber si las calificaciones cambiaron significativamente después de la enseñanza.
En esta prueba, tenemos dos conjuntos de calificaciones:
- El primer conjunto son las calificaciones antes de recibir la enseñanza
- El segundo conjunto son las calificaciones después de recibir la enseñanza
Podemos establecer las hipótesis nula y alternativa de la siguiente manera:
Hipótesis nula (H₀): Las calificaciones de los estudiantes no cambiaron significativamente después de participar en el curso. Esto significa que el promedio de calificaciones antes y después de la enseñanza será igual.
Hipótesis alternativa (H₁): Las calificaciones de los estudiantes cambiaron significativamente después de participar en el curso. Esto significa que las calificaciones promedio después de la enseñanza son mayores o menores que las calificaciones antes de la enseñanza.
Por lo tanto, la prueba de estas hipótesis utilizará los datos de calificaciones antes y después de la enseñanza de los mismos estudiantes para verificar si hay un cambio significativo en las calificaciones después de recibir la enseñanza.
Si el valor p obtenido de la prueba es menor que el nivel de significancia establecido (generalmente 0.05), podemos rechazar la hipótesis nula y aceptar la hipótesis alternativa de que participar en el curso educativo afectó los cambios en las calificaciones de los estudiantes.
3. Prueba t de muestras independientes
Se utiliza para comparar las medias de dos grupos no relacionados. En estadística, estos dos grupos se consideran independientes entre sí, lo que significa que medir valores en un grupo no afecta la medición de valores en el otro grupo.
Por ejemplo:
Medir la diferencia entre los pesos promedio de bebés recién nacidos en dos hospitales para ver si difieren. Seleccionamos muestras de recién nacidos de cada hospital y medimos sus pesos.
Después de eso, usamos una prueba t independiente para comparar los pesos promedio de los recién nacidos de ambos hospitales. Las hipótesis nula y alternativa se pueden escribir de la siguiente manera:
Hipótesis nula (H₀): No hay diferencia en los pesos promedio de los recién nacidos entre los dos hospitales. Es decir, el peso promedio de los recién nacidos en el Hospital A y el Hospital B son iguales (μA es igual a μB).
Hipótesis alternativa (H₁): Hay una diferencia en los pesos promedio de los recién nacidos entre los dos hospitales. Es decir, el peso promedio de los recién nacidos en el Hospital A no es igual al promedio en el Hospital B (μA ≠ μB).
Por lo tanto, la prueba t independiente comparará los pesos promedio de los recién nacidos de ambos hospitales, y si el valor p obtenido de la prueba es menor que el nivel de significancia establecido (generalmente 0.05), rechazamos la hipótesis nula H₀ y aceptamos la hipótesis alternativa H₁ de que existe una diferencia significativa en el peso promedio de los recién nacidos entre los dos hospitales.
Fórmulas de la prueba t
Las fórmulas de la prueba t tienen varias formas según el tipo de prueba, como se muestra a continuación:
Fórmula de la prueba t independiente
Esta es la fórmula básica para una prueba t independiente, que se utiliza para comparar las medias de dos grupos separados:
X̄₁ y X̄₂ son las medias de los dos grupos que queremos comparar (calcula la media de cada grupo (X̄₁ y X̄₂) por separado sumando los datos de cada grupo y dividiendo entre el número de datos de ese grupo)
s₁² y s₂² son las varianzas de cada grupo, que indican cuánto se dispersan los datos de cada grupo respecto a la media
n₁ y n₂ son el número de datos o tamaños de muestra en cada grupo
Fórmula de la prueba t de una muestra
Para una prueba t de una muestra, utilizada para comparar la media de una muestra con una media poblacional conocida o un valor predeterminado, la fórmula es:
X̄ es la media muestral (calcula la media (X̄) de la muestra sumando todos los datos de esa muestra y dividiendo entre el número de datos (tamaño de muestra n))
μ es la media poblacional predeterminada o el valor contra el que queremos probar la muestra
s es la desviación estándar de la muestra
n es el número de datos en la muestra
El valor t obtenido de esta fórmula nos indica cuánto difiere la media muestral de la media poblacional predeterminada. Si este valor t es significativamente alto o bajo en comparación con el valor de la distribución t al nivel de significancia establecido (por ejemplo, 0.05), significa que la media muestral difiere estadísticamente de manera significativa del valor que queremos probar.
Fórmula de la prueba t de muestras pareadas
La fórmula para una prueba t de muestras pareadas, utilizada para comparar las medias de datos relacionados en dos conjuntos, que a menudo son mediciones de antes y después, es:
d̄ es la media de las diferencias de los datos pareados (valores medidos después del experimento menos valores medidos antes del experimento), luego se suma estas diferencias y se divide entre el número de pares de datos
sᴅ es la desviación estándar de las diferencias de los datos pareados
n es el número de datos pareados
El valor t obtenido de este cálculo se compara con el valor de la distribución t al nivel de significancia establecido, como 0.05 o 5%, para ver si existe una diferencia estadísticamente significativa entre las medias antes y después del experimento.
Supuestos de la prueba t
Antes de aplicar cualquier prueba t, es importante verificar que se cumplan ciertos supuestos:
- Variable dependiente continua: Los datos deben medirse en una escala de intervalo o razón
- Independencia de observaciones: Cada observación debe ser independiente de las demás
- Distribución aproximadamente normal: Los datos deben seguir una distribución normal, especialmente con muestras pequeñas (aunque la prueba t es robusta ante violaciones cuando n > 30)
- Homogeneidad de varianzas: Para la prueba t independiente, ambos grupos deben tener varianzas similares (se verifica con la prueba de Levene). Si las varianzas son desiguales, utiliza la corrección de Welch
Si los supuestos se violan gravemente, considera usar pruebas no paramétricas como la prueba U de Mann-Whitney o la prueba de rangos con signo de Wilcoxon. Recuerda también que la prueba t se limita a comparar dos grupos; si necesitas comparar tres o más grupos simultáneamente, utiliza ANOVA.
Preguntas Frecuentes
Próximos Pasos
Ahora que comprendes qué es la prueba t, sus tipos y fórmulas, el siguiente paso es aplicarla en la práctica:
- Prueba t en Excel: guía completa: Aprende a ejecutar los 3 tipos de prueba t paso a paso en Excel con datos reales
- Tamaño del efecto en Excel: Complementa tu prueba t calculando la significancia práctica de tus resultados con la d de Cohen
Referencias
- Student. (1908). The probable error of a mean. Biometrika, 6(1), 1-25.
- Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Lawrence Erlbaum Associates.
- Welch, B. L. (1947). The generalization of "Student's" problem when several different population variances are involved. Biometrika, 34(1/2), 28-35.
- Field, A. (2013). Discovering statistics using IBM SPSS statistics (4th ed.). SAGE Publications.