¿Qué es una prueba t y cuándo se utiliza?

Una prueba t es una prueba estadística que compara las medias de dos grupos para determinar si son significativamente diferentes entre sí. Utiliza una prueba t cuando: (1) quieres comparar dos medias de grupo, (2) tus datos son continuos (no categóricos), (3) tus datos siguen aproximadamente una distribución normal o el tamaño de muestra es suficientemente grande (n > 30), y (4) estás probando hipótesis sobre diferencias de medias. Los tres tipos son: de una muestra (comparar con un valor conocido), de muestras independientes (comparar dos grupos separados) y de muestras pareadas (comparar dos mediciones relacionadas).

¿Cuáles son los 3 tipos de prueba t?

Los tres tipos son: (1) Prueba t de una muestra: compara la media de una muestra con una media poblacional conocida o un valor hipotético. (2) Prueba t de muestras independientes: compara las medias de dos grupos separados y no relacionados (por ejemplo, hombres vs mujeres, tratamiento vs control). (3) Prueba t de muestras pareadas: compara dos mediciones relacionadas de los mismos sujetos (por ejemplo, antes vs después del tratamiento). Elige según tu pregunta de investigación y la estructura de tus datos.

¿Cómo se interpretan los resultados de una prueba t?

Interpreta los resultados examinando: (1) El estadístico t, que mide cuántos errores estándar difieren las medias; valores absolutos más grandes sugieren mayor diferencia. (2) Los grados de libertad (gl), relacionados con el tamaño de muestra. (3) El valor p: si p es menor a 0.05, la diferencia es estadísticamente significativa; si p es mayor a 0.05, no hay diferencia significativa. (4) El intervalo de confianza, el rango que probablemente contiene la verdadera diferencia. (5) El tamaño del efecto (d de Cohen), la significancia práctica de la diferencia.

¿Cuál es la diferencia entre prueba t y ANOVA?

La prueba t compara medias de exactamente DOS grupos, mientras que ANOVA (Análisis de Varianza) compara medias de TRES O MÁS grupos. Usa la prueba t cuando tienes dos grupos (tratamiento vs control). Usa ANOVA cuando tienes múltiples grupos (por ejemplo, comparar cuatro métodos de enseñanza). Si usas múltiples pruebas t en lugar de ANOVA para 3 o más grupos, inflas la tasa de error Tipo I (falsos positivos). ANOVA indica si algún grupo difiere; las pruebas post-hoc identifican qué pares específicos difieren.

¿Qué supuestos deben cumplirse para una prueba t?

Los supuestos incluyen: (1) Variable dependiente continua, medida en escala de intervalo o razón. (2) Independencia: las observaciones deben ser independientes entre sí. (3) Normalidad aproximada: los datos deben distribuirse normalmente, especialmente con muestras pequeñas (aunque es robusta ante violaciones con n > 30). (4) Homogeneidad de varianzas: para la prueba t independiente, ambos grupos deben tener varianzas similares (la prueba de Levene verifica esto). Si se violan los supuestos, considera alternativas no paramétricas como la prueba U de Mann-Whitney o la prueba de Wilcoxon.

¿Qué es el valor p en una prueba t y cómo lo interpreto?

El valor p representa la probabilidad de obtener resultados tan extremos como los tuyos si realmente no hubiera diferencia entre los grupos (la hipótesis nula es verdadera). Si p es menor a 0.05, rechaza la hipótesis nula: los grupos son significativamente diferentes. Si p es mayor o igual a 0.05, no hay suficiente evidencia de diferencia. Un valor p de 0.03 significa que hay un 3% de probabilidad de obtener estos resultados si los grupos fueran realmente iguales.

¿Se necesitan tamaños de muestra iguales para una prueba t?

No, no se requieren tamaños de muestra iguales, aunque proporcionan la máxima potencia estadística. La prueba t independiente puede manejar tamaños desiguales usando la prueba t de Welch (que no asume varianzas iguales). Sin embargo, muestras extremadamente desbalanceadas (por ejemplo, 10 vs 100) reducen la potencia y hacen la prueba más sensible a violaciones de supuestos. Procura tener grupos razonablemente equilibrados cuando sea posible.

¿Qué significa un valor t negativo?

Un valor t negativo simplemente indica la dirección de la diferencia entre medias. Significa que la media del primer grupo es menor que la del segundo grupo. El signo no afecta la significancia estadística: un valor t de -2.5 es igualmente significativo que +2.5. Lo que importa es el valor absoluto de t y el valor p correspondiente. Los valores t negativos vs positivos muestran dirección, no importancia ni significancia.

Prueba T: Definición, 3 Tipos y Cómo Interpretar Resultados

¿Qué es la prueba t?

La prueba t es una prueba estadística que se utiliza para comparar las medias de dos grupos o para determinar si la media de un grupo difiere de un valor específico.

Imagina que tienes dos globos. Cada globo representa un grupo de personas que te interesa estudiar, como los estudiantes de la Clase A y la Clase B. Quieres saber qué clase tiene el promedio de calificaciones más alto. La prueba t funciona como una herramienta que te ayuda a medir y comparar los tamaños de ambos globos para ver qué tan diferentes son.

Si los globos son muy similares en tamaño, probablemente no puedas distinguir si son diferentes. Pero si un globo es notablemente más grande que el otro, puedes decir que los dos globos difieren significativamente.

¿Qué es el valor t?

En la prueba estadística llamada prueba t, el valor t es un número que nos indica si los resultados que observamos se deben a una razón real o simplemente al azar.

En el ejemplo de los globos, nos interesa saber si cada globo (o grupo de datos) tiene un tamaño significativamente diferente. El valor t nos ayuda a entender esto.

Si el valor t calculado es muy alto, indica que ver un globo más grande que el otro (similar a comparar los promedios de calificaciones de los estudiantes en la Clase A y B y obtener un valor t alto) significa que podemos decir que una clase tiene un promedio significativamente mayor que la otra.

Para verificar si el tamaño de cada globo difiere significativamente, usamos una prueba t, que funciona como una herramienta de medición. Comenzamos recopilando las calificaciones de todos los estudiantes de la Clase A y la Clase B, similar a medir los tamaños de los globos.

Luego, calculamos el promedio de calificaciones de los estudiantes en cada clase, lo que equivale a encontrar el tamaño promedio de los globos. Usamos la prueba t para comparar los promedios obtenidos, similar a usar una herramienta de medición para ver si los tamaños promedio de los globos difieren significativamente.

Cómo leer los valores de la prueba t

Si el valor t de la prueba es muy alto, significa que el promedio de calificaciones de los estudiantes en una clase es significativamente mayor que en la otra. Es como decir que un globo es claramente más grande que el otro, y puedes estar seguro de que no se debe al azar ni a un error de medición, como si el viento entrara a la habitación haciendo que un globo parezca más grande.

Por otro lado, si el valor t es bajo, significa que los promedios de calificaciones de ambas clases no difieren significativamente, similar a encontrar que ambos globos tienen aproximadamente el mismo tamaño y no puedes afirmar claramente que hay una diferencia.

En términos simples, una prueba t es una herramienta utilizada para decidir si la diferencia que observamos en un conjunto de datos es significativa o no. Generalmente, una prueba t nos indica si la media de una muestra difiere significativamente de la media poblacional o de la media de otro grupo, utilizando el valor t calculado y el valor p.

Prueba t y valor p

Cuando realizamos una prueba t, obtenemos un estadístico t a partir de nuestros datos. Este valor t muestra la diferencia entre la media que observamos y la media hipotética bajo la hipótesis nula.

Luego comparamos el estadístico t calculado con el valor p al nivel de significancia que establecimos (por ejemplo, 0.05).

El valor p nos indica:

Si el valor p es menor que el nivel de significancia que establecimos (por ejemplo, 0.05), significa que los resultados que observamos es poco probable que ocurran por azar, y rechazamos la hipótesis nula.
Si el valor p es mayor que el nivel de significancia, significa que los resultados que observamos podrían ocurrir por azar, y no tenemos suficiente evidencia para rechazar la hipótesis nula o aceptar la hipótesis alternativa.

En la prueba de hipótesis con prueba t, hay dos hipótesis principales:

Hipótesis nula: No existe diferencia entre los grupos o poblaciones que estamos estudiando.

Ejemplo: H₀: μ₁ es igual a μ₂ significa que la media del primer grupo (μ₁) es igual a la media del segundo grupo (μ₂)

Hipótesis alternativa: Existe una diferencia estadísticamente significativa entre los grupos o poblaciones.

Ejemplo: Hₐ: μ₁ ≠ μ₂ significa que la media del primer grupo no es igual a la media del segundo grupo

¿Cuántos tipos de prueba t existen?

Existen 3 tipos de pruebas t:

Diagrama de decisión que muestra qué prueba t usar: una muestra para 1 grupo vs valor conocido, muestras pareadas para mismos sujetos medidos dos veces, y muestras independientes para dos grupos separados

Figura 1: Diagrama de decisión para elegir el tipo correcto de prueba t según tu diseño de investigación

1. Prueba t de una muestra

La prueba t de una muestra es una herramienta estadística utilizada para comparar la media de una muestra que tenemos con un valor predeterminado (llamado valor de prueba o media poblacional) para ver si existe una diferencia significativa entre los dos valores. Se puede usar en diversas situaciones.

Por ejemplo:

Supongamos que queremos probar si un nuevo programa de ejercicios afecta la estatura de niños en crecimiento, y tenemos un valor de estatura promedio para niños de esta edad a partir de datos existentes de 150 centímetros.

Seleccionamos aleatoriamente 30 niños que participan en este programa de ejercicios y registramos sus estaturas después de 6 meses en el programa. Encontramos que la estatura promedio del grupo de niños en el programa es de 153 centímetros.

Usaremos una prueba t de una muestra para comparar la estatura promedio de los niños en el programa (153 cm) con el promedio esperado de la población general (150 cm).

Las hipótesis que debemos establecer para la prueba t de una muestra son:

Hipótesis nula (H₀): La estatura promedio de los niños en el programa de ejercicios no difiere del promedio esperado de la población, que en este caso es 150 centímetros. Es decir, μ es igual a 150 centímetros.

Hipótesis alternativa (H₁): La estatura promedio de los niños en el programa de ejercicios difiere significativamente del promedio de la población general. Es decir, μ ≠ 150 centímetros.

Por lo tanto, la prueba t en esta situación sería una prueba t unilateral, donde solo nos interesa probar si la estatura promedio de los niños que participaron en el programa es mayor que 150 centímetros.

Si el valor p de la prueba es menor que 0.05, rechazamos la hipótesis nula (H₀) y aceptamos la hipótesis alternativa (H₁). Podemos concluir que el programa de ejercicios tiene un efecto significativo en aumentar la estatura de estos niños en comparación con la estatura promedio general de niños de la misma edad.

2. Prueba t de muestras pareadas

También llamada prueba t pareada, es un método estadístico utilizado para comparar las medias de dos conjuntos de datos relacionados.

Dos conjuntos de datos relacionados significan datos que provienen del mismo grupo de muestra en dos situaciones diferentes o en dos momentos diferentes, como:

Antes y después de un experimento
Medir la presión arterial de pacientes antes y después de la medicación
Medir el peso de la misma persona antes y después de un programa de pérdida de peso
Medir las calificaciones de los estudiantes antes y después de asistir a un curso de capacitación

Por ejemplo:

Medir las calificaciones de los estudiantes antes y después de participar en un curso de educación adicional. Queremos saber si las calificaciones cambiaron significativamente después de la enseñanza.

En esta prueba, tenemos dos conjuntos de calificaciones:

El primer conjunto son las calificaciones antes de recibir la enseñanza
El segundo conjunto son las calificaciones después de recibir la enseñanza

Podemos establecer las hipótesis nula y alternativa de la siguiente manera:

Hipótesis nula (H₀): Las calificaciones de los estudiantes no cambiaron significativamente después de participar en el curso. Esto significa que el promedio de calificaciones antes y después de la enseñanza será igual.

Hipótesis alternativa (H₁): Las calificaciones de los estudiantes cambiaron significativamente después de participar en el curso. Esto significa que las calificaciones promedio después de la enseñanza son mayores o menores que las calificaciones antes de la enseñanza.

Por lo tanto, la prueba de estas hipótesis utilizará los datos de calificaciones antes y después de la enseñanza de los mismos estudiantes para verificar si hay un cambio significativo en las calificaciones después de recibir la enseñanza.

Si el valor p obtenido de la prueba es menor que el nivel de significancia establecido (generalmente 0.05), podemos rechazar la hipótesis nula y aceptar la hipótesis alternativa de que participar en el curso educativo afectó los cambios en las calificaciones de los estudiantes.

3. Prueba t de muestras independientes

Se utiliza para comparar las medias de dos grupos no relacionados. En estadística, estos dos grupos se consideran independientes entre sí, lo que significa que medir valores en un grupo no afecta la medición de valores en el otro grupo.

Por ejemplo:

Medir la diferencia entre los pesos promedio de bebés recién nacidos en dos hospitales para ver si difieren. Seleccionamos muestras de recién nacidos de cada hospital y medimos sus pesos.

Después de eso, usamos una prueba t independiente para comparar los pesos promedio de los recién nacidos de ambos hospitales. Las hipótesis nula y alternativa se pueden escribir de la siguiente manera:

Hipótesis nula (H₀): No hay diferencia en los pesos promedio de los recién nacidos entre los dos hospitales. Es decir, el peso promedio de los recién nacidos en el Hospital A y el Hospital B son iguales (μA es igual a μB).

Hipótesis alternativa (H₁): Hay una diferencia en los pesos promedio de los recién nacidos entre los dos hospitales. Es decir, el peso promedio de los recién nacidos en el Hospital A no es igual al promedio en el Hospital B (μA ≠ μB).

Por lo tanto, la prueba t independiente comparará los pesos promedio de los recién nacidos de ambos hospitales, y si el valor p obtenido de la prueba es menor que el nivel de significancia establecido (generalmente 0.05), rechazamos la hipótesis nula H₀ y aceptamos la hipótesis alternativa H₁ de que existe una diferencia significativa en el peso promedio de los recién nacidos entre los dos hospitales.

Fórmulas de la prueba t

Las fórmulas de la prueba t tienen varias formas según el tipo de prueba, como se muestra a continuación:

Fórmula de la prueba t independiente

Esta es la fórmula básica para una prueba t independiente, que se utiliza para comparar las medias de dos grupos separados:

t=\frac{\bar{X}_1-\bar{X}_2}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}

X̄₁ y X̄₂ son las medias de los dos grupos que queremos comparar (calcula la media de cada grupo (X̄₁ y X̄₂) por separado sumando los datos de cada grupo y dividiendo entre el número de datos de ese grupo)

s₁² y s₂² son las varianzas de cada grupo, que indican cuánto se dispersan los datos de cada grupo respecto a la media

n₁ y n₂ son el número de datos o tamaños de muestra en cada grupo

Fórmula de la prueba t de una muestra

Para una prueba t de una muestra, utilizada para comparar la media de una muestra con una media poblacional conocida o un valor predeterminado, la fórmula es:

t=\frac{\bar{X}-\mu}{\left(\frac{s}{\sqrt{n}}\right)}

X̄ es la media muestral (calcula la media (X̄) de la muestra sumando todos los datos de esa muestra y dividiendo entre el número de datos (tamaño de muestra n))

μ es la media poblacional predeterminada o el valor contra el que queremos probar la muestra

s es la desviación estándar de la muestra

n es el número de datos en la muestra

El valor t obtenido de esta fórmula nos indica cuánto difiere la media muestral de la media poblacional predeterminada. Si este valor t es significativamente alto o bajo en comparación con el valor de la distribución t al nivel de significancia establecido (por ejemplo, 0.05), significa que la media muestral difiere estadísticamente de manera significativa del valor que queremos probar.

Fórmula de la prueba t de muestras pareadas

La fórmula para una prueba t de muestras pareadas, utilizada para comparar las medias de datos relacionados en dos conjuntos, que a menudo son mediciones de antes y después, es:

t=\frac{\bar{d}}{s_d / \sqrt{n}}

d̄ es la media de las diferencias de los datos pareados (valores medidos después del experimento menos valores medidos antes del experimento), luego se suma estas diferencias y se divide entre el número de pares de datos

sᴅ es la desviación estándar de las diferencias de los datos pareados

n es el número de datos pareados

El valor t obtenido de este cálculo se compara con el valor de la distribución t al nivel de significancia establecido, como 0.05 o 5%, para ver si existe una diferencia estadísticamente significativa entre las medias antes y después del experimento.

Supuestos de la prueba t

Antes de aplicar cualquier prueba t, es importante verificar que se cumplan ciertos supuestos:

Variable dependiente continua: Los datos deben medirse en una escala de intervalo o razón
Independencia de observaciones: Cada observación debe ser independiente de las demás
Distribución aproximadamente normal: Los datos deben seguir una distribución normal, especialmente con muestras pequeñas (aunque la prueba t es robusta ante violaciones cuando n > 30)
Homogeneidad de varianzas: Para la prueba t independiente, ambos grupos deben tener varianzas similares (se verifica con la prueba de Levene). Si las varianzas son desiguales, utiliza la corrección de Welch

Si los supuestos se violan gravemente, considera usar pruebas no paramétricas como la prueba U de Mann-Whitney o la prueba de rangos con signo de Wilcoxon. Recuerda también que la prueba t se limita a comparar dos grupos; si necesitas comparar tres o más grupos simultáneamente, utiliza ANOVA.

Preguntas Frecuentes

Próximos Pasos

Ahora que comprendes qué es la prueba t, sus tipos y fórmulas, el siguiente paso es aplicarla en la práctica:

Prueba t en Excel: guía completa: Aprende a ejecutar los 3 tipos de prueba t paso a paso en Excel con datos reales
Tamaño del efecto en Excel: Complementa tu prueba t calculando la significancia práctica de tus resultados con la d de Cohen

Referencias

Student. (1908). The probable error of a mean. Biometrika, 6(1), 1-25.
Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Lawrence Erlbaum Associates.
Welch, B. L. (1947). The generalization of "Student's" problem when several different population variances are involved. Biometrika, 34(1/2), 28-35.
Field, A. (2013). Discovering statistics using IBM SPSS statistics (4th ed.). SAGE Publications.

¿Qué es la prueba t?

¿Qué es el valor t?

Cómo leer los valores de la prueba t

Prueba t y valor p

¿Cuántos tipos de prueba t existen?

1. Prueba t de una muestra

2. Prueba t de muestras pareadas

3. Prueba t de muestras independientes

Fórmulas de la prueba t

Fórmula de la prueba t independiente

Fórmula de la prueba t de una muestra

Fórmula de la prueba t de muestras pareadas

Supuestos de la prueba t

Preguntas Frecuentes

¿Qué es una prueba t?

¿Qué valor de prueba t se considera significativo?

¿Cómo se leen los valores de la prueba t?

¿Cuántos tipos de prueba t existen?

¿Qué son el valor t y el valor p?

¿Cuándo se usa la prueba t de una muestra?

¿Cómo difiere la prueba t pareada de la prueba t independiente?

¿Cuáles son las fórmulas de la prueba t?

¿Los datos deben tener distribución normal antes de hacer una prueba t?

¿Qué son la hipótesis nula y la hipótesis alternativa?

Próximos Pasos

Referencias