¿Qué es la regresión lineal simple y cuándo debo usarla en mi tesis?

La regresión lineal simple predice el valor de una variable dependiente (Y) a partir de una variable independiente (X). Úsala cuando quieras entender si una variable predice otra y con qué fuerza, por ejemplo: '¿Las horas de estudio predicen las calificaciones?' Para investigaciones de tesis, la regresión lineal simple es adecuada cuando tienes un predictor continuo y una variable de resultado continua, y tu pregunta de investigación se centra en la predicción o cuantificación de una relación lineal.

¿Cuál es la diferencia entre regresión lineal simple y correlación?

La correlación mide la fuerza y dirección de la relación entre dos variables (rango de -1 a +1), mientras que la regresión predice valores y cuantifica cuánto cambia Y por cada unidad de aumento en X. La correlación trata ambas variables por igual, pero la regresión distingue entre predictor (X) y resultado (Y). Usa correlación cuando solo quieras saber si las variables están relacionadas. Usa regresión cuando necesites hacer predicciones, entender la dirección de la influencia o reportar cuánto una variable afecta a otra en la sección de Resultados de tu tesis.

¿Cómo interpreto el R-cuadrado en la regresión lineal simple?

R-cuadrado (R²) representa el porcentaje de varianza en tu variable dependiente explicada por tu variable independiente. Por ejemplo, R² = 0.64 significa que el 64% de la variación en calificaciones puede explicarse por las horas de estudio, mientras que el 36% se debe a otros factores. Según Cohen (1988), para ciencias del comportamiento: r² = .01 es pequeño, r² = .09 es mediano y r² = .25 es grande. Sin embargo, estos umbrales varían significativamente según el campo. Siempre interpreta R² dentro de las normas de tu disciplina y repórtalo en la sección de Resultados como medida del tamaño del efecto.

¿Qué significa el valor p en los resultados de regresión y qué debo reportar?

El valor p de Significance F prueba si tu modelo de regresión general es estadísticamente significativo (¿es X un predictor útil de Y?). Si p menor a 0.05, tu modelo es significativo. Los valores p de coeficientes individuales prueban si cada predictor es significativamente diferente de cero. Para regresión lineal simple, tienes dos valores p: uno para el intercepto (generalmente no es interesante) y uno para tu variable predictora (crítico para las conclusiones). Reporta tanto el Significance F como el valor p del coeficiente en la sección de Resultados de tu tesis.

¿Cómo verifico si mis datos cumplen los supuestos de regresión lineal en Excel?

Verifica cuatro supuestos clave en Excel: (1) Linealidad: Crea un diagrama de dispersión de X vs Y; la relación debe ser aproximadamente lineal, no curva. (2) Independencia: Asegúrate de que las observaciones sean independientes (sin medidas repetidas). (3) Normalidad de residuos: Crea un histograma de residuos del resultado de regresión; debe tener forma de campana. (4) Homocedasticidad: Grafica residuos vs valores ajustados; la dispersión debe ser aproximadamente constante en todos los valores de X. Si se violan los supuestos, los resultados de regresión pueden ser poco confiables.

¿Qué tipos de regresión NO puede realizar Excel?

Excel no puede realizar: (1) Regresión logística (para resultados binarios como aprobado/reprobado); usa SPSS o R. (2) Regresión stepwise (selección automática de variables); usa SPSS o R. (3) Regresión jerárquica (agregar predictores en bloques); usa SPSS. (4) Análisis de moderación o mediación (macro PROCESS); usa SPSS con PROCESS. (5) Diagnósticos avanzados (VIF para multicolinealidad, Durbin-Watson para autocorrelación); usa SPSS o R. Si tu comité de tesis requiere estas técnicas, necesitarás software estadístico adicional. Excel es perfecto solo para regresión lineal simple y múltiple.

¿Puedo usar regresión lineal simple si mi variable dependiente es categórica?

No, la regresión lineal simple requiere una variable dependiente continua (escala de intervalo o razón). Si tu variable dependiente es categórica (sí/no, aprobado/reprobado, bajo/medio/alto), no puedes usar regresión lineal en Excel. Para resultados binarios (dos categorías), usa regresión logística en SPSS o R. Para resultados ordinales (categorías ordenadas), usa regresión ordinal. Para resultados nominales (categorías no ordenadas), usa regresión logística multinomial. La regresión lineal asume que tu variable Y puede tomar cualquier valor en una escala continua, no categorías discretas.

¿Cuál es un buen tamaño de muestra para regresión lineal simple en investigación de tesis?

Para regresión lineal simple, se requiere un mínimo de n = 30 observaciones para un análisis básico, pero se recomiendan n = 50-100 para investigación de tesis y asegurar poder estadístico adecuado y estimaciones estables de coeficientes. Según Green (1991), se necesitan n ≥ 104 + k para probar el modelo general (donde k = número de predictores), y n ≥ 50 + 8k para probar predictores individuales. Para regresión simple con un predictor, esto sugiere n ≥ 105 para un análisis riguroso. Sin embargo, lo más confiable es realizar un análisis de potencia a priori usando software como G*Power antes de recolectar datos.

¿Cómo creo un diagrama de dispersión con línea de regresión en Excel?

Selecciona tus datos (columnas X e Y), ve a Insertar → Gráficos → Dispersión → Dispersión solo con marcadores. Haz clic en cualquier punto de datos, clic derecho, selecciona Agregar línea de tendencia. En las opciones de línea de tendencia: marca 'Presentar ecuación en el gráfico' y 'Presentar el valor R-cuadrado en el gráfico'. Selecciona tipo de línea de tendencia lineal. Formatea la línea con un color y grosor adecuado. Agrega títulos a los ejes describiendo tus variables. Esta representación visual es esencial para tu tesis para demostrar la relación lineal antes de reportar resultados numéricos.

¿Qué debo hacer si se violan los supuestos de regresión?

Si se viola la linealidad (patrón curvo en el diagrama de dispersión), intenta transformar variables (transformaciones logarítmica, raíz cuadrada o cuadrática). Si se viola la normalidad de residuos (histograma sesgado), busca valores atípicos o transforma la variable Y. Si se viola la homocedasticidad (patrón de embudo en el gráfico de residuos), considera mínimos cuadrados ponderados o transforma la variable Y. Si se viola la independencia (medidas repetidas), usa modelos de efectos mixtos. Para investigación de tesis, siempre reporta la verificación de supuestos en la sección de Métodos y reconoce las violaciones como limitaciones si las transformaciones no ayudan. Consulta con tu asesor si las violaciones son severas.

Regresión Lineal Simple en Excel: Guía para Tesis

Q: ¿Cómo reporto los resultados de regresión lineal simple en formato APA 7.ª edición?

Reporta la regresión en este orden: (1) Indica el análisis utilizado: 'Se realizó una regresión lineal simple para predecir...' (2) Reporta el ajuste del modelo: 'El modelo de regresión fue estadísticamente significativo, F(1, 28) = 850.27, p < .001, R² = .97.' (3) Reporta la ecuación: 'La ecuación de regresión fue: Calificación = 47.33 + 2.75(Horas de Estudio).' (4) Interpreta el coeficiente: 'Por cada hora adicional de estudio, las calificaciones aumentaron en 2.75 puntos en promedio (IC 95% [2.56, 2.95]).' Incluye una tabla de regresión con coeficientes no estandarizados, errores estándar, valores t y valores p.

La regresión lineal simple es una de las técnicas estadísticas más poderosas y accesibles para investigación de tesis y disertación. Ya sea que estés prediciendo el rendimiento estudiantil a partir de las horas de estudio, los ingresos por ventas a partir del presupuesto publicitario o los resultados de pacientes a partir de la duración del tratamiento, la regresión lineal simple te ayuda a cuantificar relaciones y hacer predicciones basadas en evidencia usando el Analysis ToolPak integrado de Excel.

A diferencia del análisis de correlación que solo indica si las variables están relacionadas, la regresión te permite predecir valores específicos, entender la dirección de la influencia y cuantificar exactamente cuánto cambia tu variable de resultado por cada unidad de aumento en tu predictor. Esto hace que la regresión sea esencial para el Capítulo 4 (Resultados) en disertaciones de psicología, educación, negocios, ciencias de la salud y ciencias sociales.

Esta guía completa te muestra cómo calcular la regresión lineal simple en Excel usando tres métodos, verificar los cuatro supuestos de regresión, interpretar los resultados correctamente y reportar los hallazgos en formato APA 7.ª edición. También aprenderás las limitaciones críticas de la regresión en Excel y cuándo necesitas usar SPSS o R.

Aprenderás:

Qué es la regresión lineal simple y cuándo usarla para investigación de tesis
Cómo calcular la regresión usando Analysis ToolPak (recomendado), líneas de tendencia en diagramas de dispersión y la función LINEST
Cómo interpretar R-cuadrado, valores p, coeficientes y errores estándar
Cómo verificar supuestos (linealidad, normalidad, homocedasticidad) en Excel
Cómo reportar resultados en formato APA 7.ª edición para tu disertación
Limitaciones de Excel y qué tipos de regresión requieren SPSS/R

Estas técnicas aplican ya sea que estés analizando datos experimentales, respuestas de encuestas o estudios observacionales con variables continuas.

Antes de comenzar: Esta guía asume que tienes Excel con el Analysis ToolPak instalado. Si aún no lo has habilitado, consulta nuestra guía sobre cómo agregar Data Analysis en Excel. También debes estar familiarizado con las estadísticas descriptivas básicas y entender qué son las variables independientes y dependientes.

¿Qué es la regresión lineal simple?

La regresión lineal simple es un método estadístico que modela la relación entre una variable independiente (predictor, X) y una variable dependiente (resultado, Y) ajustando una línea recta a través de tus puntos de datos. La línea de regresión representa la mejor predicción de Y basada en X, minimizando la suma de diferencias al cuadrado entre valores observados y predichos; esto se llama el método de mínimos cuadrados.

La ecuación de regresión

Si has estado leyendo libros de estadística o viendo tutoriales, es posible que hayas notado que la fórmula de regresión se escribe de manera diferente según la fuente. No te preocupes: ambas versiones son correctas. La diferencia es simplemente una convención de notación, y entender ambas te ayudará a leer cualquier recurso de estadística con confianza.

En libros de estadística teórica, típicamente verás letras griegas (símbolos beta). Esta notación representa los parámetros verdaderos de la población, los valores "reales" que existen en toda la población que intentamos estimar:

$Y = \beta_0 + \beta_1X + \varepsilon$

En guías aplicadas y tutoriales de Excel (incluyendo este), a menudo verás letras romanas (a y b). Esta notación representa las estimaciones de la muestra, los valores reales que Excel calcula a partir de tus datos como estimaciones de esos parámetros de la población:

$Y = a + bX + \varepsilon$

En resumen: Cuando ves β₀ en un libro y "Intercept" en Excel, se refieren a lo mismo. Cuando tu profesor escribe β₁ en la pizarra y Excel muestra un coeficiente de 2.75, es el mismo concepto. Excel etiqueta su salida simplemente como "Coefficients" sin importar qué notación use tu libro.

Donde:

Y = Variable dependiente (lo que estás prediciendo)
X = Variable independiente (tu predictor)
β₀ o a = Intercepto (valor esperado de Y cuando X = 0)
β₁ o b = Coeficiente de pendiente (cambio en Y por cada aumento de 1 unidad en X)
ε = Término de error (variación no explicada)

Por ejemplo, si estás prediciendo calificaciones a partir de horas de estudio:

$\text{Calificación} = 47.33 + 2.75 \times \text{Horas de Estudio}$

Esto significa: Un estudiante que no estudia (0 horas) tiene una calificación esperada de 47.33 puntos, y cada hora adicional de estudio aumenta la calificación en 2.75 puntos en promedio.

Cuándo usar regresión lineal simple para tu tesis

Usa regresión lineal simple cuando tu investigación cumpla estos criterios:

1. Requisitos de la pregunta de investigación:

Quieres predecir valores de Y basados en X
Quieres cuantificar cuánto cambia Y cuando X aumenta
Quieres probar si X es un predictor significativo de Y

2. Requisitos de las variables:

Un predictor continuo (X): Escala de intervalo o razón (ej. edad, ingresos, calificaciones, tiempo)
Un resultado continuo (Y): Escala de intervalo o razón
Ambas variables deben tener al menos 30 observaciones

3. Ejemplos de investigación por disciplina:

Psicología: ¿El número de sesiones de terapia predice la reducción de síntomas depresivos?
Educación: ¿La asistencia a clases predice las calificaciones del examen final?
Negocios: ¿El presupuesto publicitario predice los ingresos mensuales por ventas?
Ciencias de la salud: ¿Los minutos de ejercicio por semana predicen la pérdida de peso?
Ciencias sociales: ¿El nivel de ingresos predice las puntuaciones de satisfacción con la vida?

Regresión lineal simple vs correlación

Muchos estudiantes confunden regresión con correlación. Esta es la diferencia clave:

Aspecto	Correlación	Regresión lineal simple
Propósito	Mide la fuerza y dirección de la relación	Predice Y a partir de X y cuantifica el efecto
Resultado	Coeficiente de correlación (r) de -1 a +1	Ecuación de regresión (Y = a + bX)
Variables	Trata X e Y por igual (simétrica)	Distingue predictor (X) de resultado (Y)
Interpretación	"X e Y están relacionados"	"Cada unidad de aumento en X cambia Y en b unidades"
Uso en tesis	Análisis preliminar, exploración de relaciones	Análisis principal para predicción y cuantificación del efecto
Ejemplo	Las horas de estudio y las calificaciones están positivamente correlacionadas (r = 0.98)	Cada hora adicional de estudio aumenta la calificación en 2.75 puntos
Reporte APA	"Las horas de estudio y las calificaciones estuvieron positivamente correlacionadas, r = .98, p < .001"	"La regresión lineal simple reveló que las horas de estudio predijeron significativamente las calificaciones, β = 2.75, t(28) = 29.16, p < .001"

Tabla 1: Comparación entre correlación y regresión

Cuándo usar correlación: Análisis exploratorio, verificar si las variables están relacionadas antes de la regresión, reportar relaciones bivariadas en la sección de estadísticas descriptivas.

Cuándo usar regresión: Probar hipótesis sobre predicción, cuantificar efectos para la discusión, reportar resultados principales para preguntas de investigación centradas en predicción.

Regresión lineal simple vs múltiple: ¿cuál necesitas?

Antes de continuar, determina si necesitas regresión lineal simple o múltiple para tu tesis:

Diagrama de flujo para elegir entre regresión lineal simple (un predictor) y regresión lineal múltiple (dos o más predictores) según las preguntas de investigación y necesidades de prueba de hipótesis

Figura 1: Diagrama de flujo para seleccionar regresión lineal simple (un predictor) o regresión lineal múltiple (dos o más predictores) según tu pregunta de investigación y variables

Usa regresión lineal simple cuando:

Tienes solo una variable predictora
Tu pregunta de investigación se centra en una relación específica
Quieres aislar el efecto de una sola variable
Estás haciendo análisis preliminar antes de agregar covariables
Ejemplo: "¿Las horas de estudio predicen las calificaciones?"

Usa regresión lineal múltiple cuando:

Tienes dos o más variables predictoras
Quieres controlar variables confusoras
Tu pregunta de investigación incluye múltiples factores
Quieres comparar la importancia relativa de los predictores
Ejemplo: "¿Las horas de estudio, horas de sueño y asistencia a clases predicen las calificaciones?"

Piensa en ello como cocinar: la regresión simple es probar si agregar más ajo mejora tu salsa de pasta, mientras que la regresión múltiple prueba si el ajo, el aceite de oliva Y los tomates frescos juntos la mejoran, y cuál ingrediente importa más.

Característica	Regresión lineal simple	Regresión lineal múltiple
Número de predictores	1 variable independiente	2 o más variables independientes
Ecuación	Y = a + bX	Y = a + b₁X₁ + b₂X₂ + ...
Pregunta de investigación	"¿Las horas de estudio predicen las calificaciones?"	"¿Las horas de estudio Y la asistencia predicen las calificaciones?"
Cuándo usar	Cuando tienes un predictor de interés	Cuando tienes múltiples predictores o variables de control
Complejidad	Más simple, más fácil de interpretar	Más compleja, requiere verificaciones adicionales (multicolinealidad)
Software necesario	Excel Analysis ToolPak (suficiente)	Excel para lo básico, SPSS/R para análisis avanzado

Tabla 2: Comparación entre regresión lineal simple y múltiple

Conjunto de datos de ejemplo para este tutorial

A lo largo de esta guía, usaremos un conjunto de datos realista de tesis que examina la relación entre horas de estudio y calificaciones de exámenes para 30 estudiantes universitarios. Este dataset demuestra una pregunta de investigación típica de predicción: "¿El tiempo de estudio predice el rendimiento académico?"

Hoja de cálculo de Excel mostrando el conjunto de datos de ejemplo para análisis de regresión lineal simple con 30 estudiantes, incluyendo columnas de Horas de Estudio (variable independiente) y Calificación (variable dependiente)

Figura 2: Conjunto de datos de ejemplo con 30 estudiantes mostrando Horas de Estudio (variable X, predictor) y Calificación (variable Y, resultado) para análisis de regresión lineal simple

Características del dataset:

Tamaño de muestra: n = 30 estudiantes (adecuado para regresión simple)
Variable independiente (X): Horas de estudio por semana (rango: 2-20 horas)
Variable dependiente (Y): Calificación del examen (rango: 45-95 puntos, máximo 100)
Pregunta de investigación: ¿El tiempo de estudio semanal predice el rendimiento en el examen final?

Crea tu propio dataset:

Ingresa tus datos en dos columnas (X en columna A, Y en columna B)
Incluye encabezados (fila 1): "Horas_Estudio" y "Calificacion"
Mínimo 30 observaciones recomendadas para investigación de tesis
Asegúrate de que los datos sean continuos (sin variables categóricas)

Nota sobre el tamaño del efecto: Este dataset de enseñanza muestra intencionalmente una relación muy fuerte (R² = .97) para que los patrones sean claros y fáciles de interpretar. En investigación real de ciencias del comportamiento, valores de R² entre .10 y .40 son mucho más comunes y aún representan hallazgos significativos y publicables. No te desanimes si los datos de tu tesis muestran relaciones más débiles; eso es normal y esperado en ciencias sociales.

Cómo calcular la regresión lineal simple en Excel (paso a paso)

Excel ofrece tres métodos para calcular la regresión lineal simple. Cubriremos los tres, comenzando con el enfoque más completo para investigación de tesis.

Método 1: Analysis ToolPak (recomendado para tesis)

El Analysis ToolPak proporciona el resultado de regresión más completo, incluyendo R-cuadrado, valores p, coeficientes, errores estándar y residuos. Este método es el requerido para trabajo de tesis porque te da todas las estadísticas necesarias para el reporte APA.

Paso 1: Habilitar el Analysis ToolPak (configuración única)

Si no has usado el Analysis ToolPak antes, habilítalo:

Cuadro de diálogo Opciones de Excel mostrando cómo habilitar el complemento Analysis ToolPak para regresión lineal simple y análisis estadístico en Excel 365, Excel 2021 y Excel 2019

Figura 3: Habilitando Analysis ToolPak en Excel a través de Archivo → Opciones → Complementos → Analysis ToolPak

Haz clic en Archivo → Opciones
Selecciona Complementos (barra lateral izquierda)
En la parte inferior, selecciona Complementos de Excel del menú desplegable "Administrar"
Haz clic en Ir
Marca la casilla de Analysis ToolPak
Haz clic en Aceptar

Una vez habilitado, verás "Análisis de datos" en la pestaña Datos de la cinta.

¿Necesitas ayuda más detallada con la instalación? Para instrucciones paso a paso con capturas de pantalla para Windows, Mac y solución de problemas comunes, consulta la guía completa mencionada al inicio de este artículo.

Paso 2: Acceder a la herramienta de análisis de datos

Figura 4: Ubicación del botón Análisis de datos en la pestaña Datos de Excel (extremo derecho de la cinta)

Haz clic en la pestaña Datos en la cinta de Excel
Haz clic en Análisis de datos (extremo derecho)
Si no ves este botón, regresa al Paso 1 para habilitar el ToolPak

Paso 3: Seleccionar Regresión y configurar los ajustes

Cuadro de diálogo Análisis de datos en Excel mostrando la opción Regresión seleccionada de la lista de herramientas de análisis estadístico para calcular regresión lineal simple

Figura 5: Seleccionando Regresión de la lista de herramientas de Análisis de datos

En el cuadro de diálogo Análisis de datos, desplázate hacia abajo y selecciona Regression
Haz clic en Aceptar

Cuadro de diálogo de Regresión en Excel mostrando los rangos de entrada para la variable dependiente (Y) y la variable independiente (X) con la casilla de etiquetas y opciones de salida para análisis de regresión lineal simple

Figura 6: Cuadro de diálogo de Regresión con Input Y Range (Calificación), Input X Range (Horas de Estudio), casilla Labels y Output Range configurados

Input Y Range: Haz clic en el selector y resalta la columna de tu variable dependiente incluyendo el encabezado (ej. B1:B31 para Calificación)
Input X Range: Haz clic en el selector y resalta la columna de tu variable independiente incluyendo el encabezado (ej. A1:A31 para Horas_Estudio)
Marca Labels (indica a Excel que tu primera fila contiene nombres de variables)
Output Range: Haz clic en el selector y elige dónde deben aparecer los resultados (ej. D1 para una nueva área en la misma hoja)
Opcional: Marca Residuals para obtener valores de residuos para verificación de supuestos
Opcional: Marca Residual Plots para visualizar los residuos
Haz clic en Aceptar

Paso 4: Entender los resultados de regresión

Excel genera resultados completos de regresión organizados en varias secciones:

Resultado completo de regresión lineal simple en Excel mostrando Estadísticas de regresión (R-cuadrado, error estándar), tabla ANOVA (estadístico F, significance F) y tabla de Coeficientes (pendiente, intercepto, valores p, intervalos de confianza)

Figura 7: Resultado completo de regresión incluyendo secciones de Estadísticas de regresión (R-cuadrado), ANOVA (Significance F) y Coeficientes (pendiente e intercepto)

Sección 1: Estadísticas de regresión

Estadístico	Valor (ejemplo)	Interpretación
Multiple R	0.984	Correlación entre Y observado e Y predicho (igual que Pearson r para regresión simple)
R Square	0.968	El 96.8% de la varianza en calificaciones se explica por las horas de estudio
Adjusted R Square	0.967	R² ajustado por tamaño de muestra (usar para regresión múltiple, menos relevante para simple)
Standard Error	2.50	Distancia promedio de los puntajes observados respecto a la línea de regresión (en unidades de Y)
Observations	30	Tamaño de muestra (n = 30 estudiantes)

Tabla 3: Resultado de estadísticas de regresión

Sección 2: ANOVA (Análisis de varianza)

Fuente	df	SS	MS	F	Significance F
Regression	1	5,297.42	5,297.42	850.27	menor a 0.001
Residual	28	174.45	6.23	-	-
Total	29	5,471.87	-	-	-

Tabla 4: Tabla ANOVA para el modelo de regresión

Valor clave: Significance F menor a 0.001 significa que el modelo de regresión es estadísticamente significativo (las horas de estudio son un predictor significativo de las calificaciones).

Sección 3: Coeficientes

Variable	Coefficients	Standard Error	t Stat	P-value	Lower 95%	Upper 95%
Intercept	47.33	1.85	25.58	menor a 0.001	43.54	51.12
Horas_Estudio	2.75	0.09	29.16	menor a 0.001	2.56	2.95

Tabla 5: Coeficientes de regresión con errores estándar e intervalos de confianza

Ecuación de regresión: Calificación = 47.33 + 2.75(Horas de Estudio)

Interpretación:

Intercepto (47.33): Calificación esperada cuando las horas de estudio = 0
Pendiente (2.75): Por cada hora adicional de estudio por semana, las calificaciones aumentan 2.75 puntos en promedio
Valor p menor a 0.001: Esta relación es estadísticamente significativa
IC 95% [2.56, 2.95]: Tenemos 95% de confianza de que el aumento real en calificación está entre 2.56 y 2.95 puntos por hora

Método 2: Diagrama de dispersión con línea de tendencia (método visual rápido)

Este método proporciona una representación visual con la ecuación de regresión pero carece de estadísticas detalladas. Úsalo para análisis exploratorio o comunicación visual en presentaciones, no para el reporte de tesis.

Paso 1: Crear diagrama de dispersión

Pestaña Insertar de Excel mostrando cómo crear un gráfico de dispersión para visualizar la relación de regresión lineal simple entre variables independiente y dependiente

Figura 8: Creando un diagrama de dispersión seleccionando datos X e Y, luego Insertar → Gráficos → Dispersión → Dispersión solo con marcadores

Selecciona tus datos X e Y (incluyendo encabezados)
Haz clic en la pestaña Insertar
Haz clic en Gráficos → Dispersión → Dispersión solo con marcadores

Paso 2: Agregar línea de tendencia

Diagrama de dispersión en Excel con menú contextual de clic derecho mostrando la opción Agregar línea de tendencia para añadir una línea de regresión lineal simple al gráfico

Figura 9: Haciendo clic derecho en los puntos de datos y seleccionando Agregar línea de tendencia para mostrar la línea de regresión

Haz clic en cualquier punto de datos en el gráfico
Haz clic derecho y selecciona Agregar línea de tendencia
En el panel Formato de línea de tendencia:
- Asegúrate de que Lineal esté seleccionado
- Marca Presentar ecuación en el gráfico
- Marca Presentar el valor R-cuadrado en el gráfico
Formatea el color y grosor de la línea de tendencia según prefieras

Diagrama de dispersión en Excel con línea de tendencia de regresión lineal simple mostrando la ecuación de regresión (Y = 2.75X + 47.33) y el valor R-cuadrado (R² = 0.968) en el gráfico para visualizar la relación predictor-resultado

Figura 10: Diagrama de dispersión final con línea de regresión lineal, ecuación (y = 2.75x + 47.33) y R² = 0.968 mostrados

Lo que muestra el gráfico:

Ecuación: y = 2.75x + 47.33 (la ecuación de regresión)
R² = 0.968: 96.8% de la varianza explicada

Cuándo usar este método:

Análisis exploratorio de datos
Presentación visual en diapositivas de defensa
Verificación rápida de linealidad antes del análisis formal
Complementar los resultados del Método 1 con evidencia visual

Limitaciones:

Sin valores p para pruebas de significancia
Sin errores estándar ni intervalos de confianza
Sin diagnósticos de supuestos
No se puede usar solo para reportar en APA

Método 3: Función LINEST (enfoque por fórmulas)

La función LINEST calcula estadísticas de regresión usando fórmulas de Excel. Este método es útil para construir plantillas automatizadas o extraer valores específicos de regresión para cálculos.

Sintaxis

=LINEST(valores_y_conocidos, valores_x_conocidos, const, estadísticas)

Parámetros:

valores_y_conocidos: Rango de valores de la variable dependiente (Y)
valores_x_conocidos: Rango de valores de la variable independiente (X)
const: TRUE (incluir intercepto) o FALSE (forzar a pasar por el origen)
estadísticas: TRUE (devolver estadísticas completas de regresión) o FALSE (solo coeficientes)

Nota sobre configuración regional: Las fórmulas de Excel usan diferentes separadores de argumentos según tu configuración regional. Excel en inglés (EE.UU./Reino Unido) usa comas: =LINEST(C2:C31,B2:B31,TRUE,TRUE) mientras que Excel en español o europeo usa punto y coma: =LINEST(C2:C31;B2:B31;TRUE;TRUE). Si tu fórmula devuelve un error, intenta cambiar comas por punto y coma (o viceversa). Para verificar o cambiar tu configuración:

Windows: Archivo → Opciones → Avanzadas → "Usar separadores del sistema"

Mac: Preferencias del sistema → Idioma y región → Avanzado → Separadores numéricos

Aplicación paso a paso

Barra de fórmulas de Excel mostrando la sintaxis de la función LINEST para calcular pendiente, intercepto, R-cuadrado, errores estándar y estadístico F de regresión lineal simple usando matrices dinámicas

Figura 11: Ingresando la función LINEST en Excel; los resultados se desbordan automáticamente en un rango de 5x2 mostrando estadísticas de regresión

Haz clic en una celda vacía (ej. D2) con espacio vacío abajo y a la derecha
Escribe la fórmula:
```
=LINEST(C2:C31, B2:B31, TRUE, TRUE)
```
Presiona Enter; Excel desborda automáticamente los resultados en un rango de 5x2

Versiones anteriores de Excel (2019 y anteriores): Si solo ves un valor en lugar del resultado completo, usa el método de fórmula matricial: Selecciona un rango de 5 filas × 2 columnas, escribe la fórmula, luego presiona Ctrl+Shift+Enter (Windows) o Cmd+Shift+Enter (Mac). La barra de fórmulas mostrará llaves {=LINEST(...)} indicando una fórmula matricial.

Resultado de la función LINEST en Excel mostrando estadísticas de regresión lineal simple: coeficiente de pendiente (2.75), intercepto (47.33), errores estándar, R-cuadrado (0.968), estadístico F (850.27) y grados de libertad en cuadrícula 5x2

Figura 12: Diseño del resultado de LINEST con pendiente, intercepto, errores estándar, R-cuadrado y estadístico F etiquetados

Interpretación del resultado (fila por fila):

Fila 1: Coeficientes

Celda D2: Pendiente (b) = 2.75
Celda E2: Intercepto (a) = 47.33

Fila 2: Errores estándar

Celda D3: EE de la pendiente = 0.09
Celda E3: EE del intercepto = 1.85

Fila 3: Ajuste del modelo

Celda D4: R² = 0.968
Celda E4: Error estándar de la regresión = 2.50

Fila 4: Estadístico F

Celda D5: F = 850.27
Celda E5: gl (grados de libertad) = 28

Fila 5: Suma de cuadrados de regresión y residuos

Celda D6: SS de regresión = 5,297.42
Celda E6: SS residual = 174.45

Cuándo usar LINEST:

Construir plantillas automatizadas de regresión
Extraer valores específicos para cálculos posteriores
Crear dashboards personalizados de regresión
Programar análisis de regresión repetitivos

Limitaciones:

Sin valores p (deben calcularse manualmente usando la distribución t)
Requiere entender fórmulas matriciales
Más propenso a errores del usuario que el ToolPak
No recomendado para principiantes

Recomendación para tesis: Usa el Método 1 (Analysis ToolPak) como tu método principal. Usa el Método 2 para comunicación visual y el Método 3 solo si necesitas plantillas automatizadas.

Interpretación de resultados de regresión para tu tesis

Entender qué significan los resultados de regresión es crítico para escribir tus capítulos de Resultados y Discusión. Interpretemos cada estadístico en el contexto de investigación de tesis.

R-cuadrado (coeficiente de determinación)

Qué es: R² representa la proporción de varianza en Y explicada por X.

Piensa en ello como predecir el clima de mañana: si tu app del clima explica el 80% de la variación de temperatura basándose en la estación del año, tienes un modelo bastante bueno. El 20% restante podría deberse a la nubosidad aleatoria, patrones de viento u otros factores que tu app no registra.

Cómo interpretar:

Cohen (1988) proporciona referencias ampliamente usadas para las ciencias del comportamiento, donde r² = .01 es pequeño, r² = .09 es mediano y r² = .25 es grande. Sin embargo, estos umbrales varían drásticamente según el campo. Lo que se considera "débil" en física (R² menor a 0.90) puede ser "grande" en psicología. Siempre interpreta R² dentro de las normas de tu disciplina.

Valor de R²	Interpretación	Contexto de tesis
R² = 0.01	Efecto pequeño (Cohen, 1988)	Puede ser significativo en investigación social a gran escala
R² = 0.09	Efecto mediano (Cohen, 1988)	Típico para psicología, educación, ciencias del comportamiento
R² = 0.25	Efecto grande (Cohen, 1988)	Fuerte para ciencias del comportamiento; débil para ciencias físicas
R² = 0.50	Efecto muy grande	Raro en investigación del comportamiento; esperado en ingeniería
R² = 0.90	Casi determinístico	Común en física, química; raro en ciencias sociales

Tabla 6: Guías de interpretación de R² según el campo de estudio

Ejemplo de interpretación para R² = 0.968: "Las horas de estudio explicaron el 96.8% de la varianza en las calificaciones, indicando que el tiempo de estudio semanal es un predictor muy fuerte del rendimiento académico. El 3.2% restante de la varianza se atribuye a otros factores no incluidos en este modelo, como conocimientos previos, ansiedad ante exámenes o calidad del estudio."

Errores comunes:

Error: "R² = 0.30 es demasiado bajo, entonces el modelo es malo" → Incluso un R² pequeño puede ser significativo y relevante
Error: "R² = 0.90 significa que X causa Y" → R² no prueba causalidad, solo explica varianza
Error: No reportar R² en la sección de Resultados → Siempre repórtalo como medida del tamaño del efecto

Requisito de tesis: Siempre reporta R² aunque tu enfoque sean los valores p. La significancia (p menor a 0.05) te dice si el efecto existe, pero R² te dice qué tan grande es.

Nota importante sobre normas según el campo: Las referencias de R² mencionadas arriba se basan en las convenciones de Cohen (1988) para ciencias del comportamiento. Antes de concluir que tu R² es "débil" o "fuerte", consulta investigación publicada en tu campo específico. Tu comité de tesis evaluará tu tamaño del efecto según las expectativas de tu disciplina, no según reglas universales.

Significance F (significancia general del modelo)

Qué es: Valor p que prueba la hipótesis nula de que todos los coeficientes son iguales a cero (es decir, el modelo no tiene valor predictivo).

Regla de decisión:

Si Significance F menor a 0.05: Rechazar hipótesis nula → El modelo es estadísticamente significativo
Si Significance F mayor a 0.05: No rechazar → El modelo no es significativo (X no predice Y)

Ejemplo: Significance F = 0.000134 (menor a 0.001) "El modelo de regresión fue estadísticamente significativo, F(1, 28) = 850.27, p < .001, indicando que las horas de estudio predijeron significativamente las calificaciones."

Nota: Para regresión lineal simple, el Significance F y el valor p de tu coeficiente predictor siempre darán la misma conclusión (ambos significativos o ambos no significativos). Este valor p se vuelve más importante en regresión múltiple donde pruebas el modelo general versus predictores individuales.

Coeficientes (pendiente e intercepto)

Intercepto (a):

Qué es: Valor esperado de Y cuando X = 0
Ejemplo: Intercepto = 47.33 significa que los estudiantes que estudian 0 horas por semana tienen una calificación esperada de 47.33 en el examen
Relevancia para la tesis: Frecuentemente no es teóricamente significativo (¿quién estudia 0 horas?), pero es necesario para la ecuación de predicción

Pendiente (b):

Qué es: Cambio en Y por cada aumento de 1 unidad en X (el coeficiente de regresión β)
Ejemplo: Pendiente = 2.75 significa que cada hora adicional de estudio aumenta la calificación en 2.75 puntos
Relevancia para la tesis: Este es tu hallazgo principal: el tamaño del efecto y la dirección de la relación

Cómo interpretar la pendiente en Resultados:

"Por cada hora adicional de estudio semanal, las calificaciones aumentaron en 2.75 puntos en promedio (IC 95% [2.56, 2.95]), manteniendo todos los demás factores constantes."

Coeficientes estandarizados vs no estandarizados:

No estandarizados (b): Lo que Excel te da (2.75 puntos por hora)
Estandarizados (β): Si quieres comparar efectos entre diferentes escalas, calcula: β = b × (DE_x / DE_y)
Para regresión simple, β estandarizado = coeficiente de correlación (r)

Valores p para los coeficientes

Qué prueba: Si cada coeficiente es significativamente diferente de cero.

Para el coeficiente de pendiente:

H₀: β = 0 (X no tiene efecto sobre Y)
H₁: β ≠ 0 (X tiene un efecto sobre Y)

Ejemplo: Valor p para Horas_Estudio = 0.000015 (menor a 0.001) "El coeficiente de regresión para las horas de estudio fue estadísticamente significativo, t(28) = 29.16, p < .001, indicando que el tiempo de estudio predice significativamente el rendimiento académico."

Regla de decisión:

p menor a 0.05: El coeficiente es estadísticamente significativo
p ≥ 0.05: El coeficiente no es significativo (puede deberse al azar)

Error común: Confundir significancia con importancia práctica. Un valor p solo te dice si un efecto existe, no si es lo suficientemente grande para importar. Siempre interpreta junto con R² y la magnitud del coeficiente.

Error estándar e intervalos de confianza

Error estándar (EE):

Mide la incertidumbre en la estimación del coeficiente
Un EE más pequeño = estimación más precisa
Ejemplo: EE = 0.09 para el coeficiente de pendiente

Intervalo de confianza del 95%:

Rango dentro del cual probablemente se encuentra el verdadero coeficiente poblacional
Ejemplo: IC 95% [2.56, 2.95] para la pendiente
Interpretación: "Tenemos 95% de confianza de que el efecto real de las horas de estudio sobre las calificaciones está entre 2.56 y 2.95 puntos por hora"

Por qué importa para la tesis: Los intervalos de confianza muestran la precisión de tu estimación y ayudan a los lectores a juzgar la significancia práctica más allá de solo los valores p.

Verificación de supuestos de regresión en Excel

La regresión lineal simple requiere cuatro supuestos clave. Violar estos supuestos puede llevar a coeficientes sesgados, valores p incorrectos y conclusiones no válidas. Tu comité de tesis espera que demuestres la verificación de supuestos.

Piensa en los supuestos como la letra pequeña de una garantía: si no cumples las condiciones, la garantía (tus valores p e intervalos de confianza) podría no ser válida. La buena noticia: verificar los supuestos en Excel toma solo 10-15 minutos y protege meses de trabajo de investigación.

Supuesto 1: Linealidad

Qué significa: La relación entre X e Y debe ser lineal (línea recta, no curva). Para una comprensión más profunda, consulta nuestra guía sobre qué significa la linealidad en estadística.

Cómo verificar en Excel:

Crea un diagrama de dispersión de X vs Y (antes de ejecutar la regresión):

Diagrama de dispersión en Excel demostrando la verificación del supuesto de linealidad para regresión lineal simple mostrando un patrón de relación lineal entre horas de estudio (eje X) y calificaciones (eje Y) sin patrones curvos o en forma de U

Figura 13: Verificación de linealidad; el diagrama de dispersión muestra un patrón aproximadamente lineal (sin curvas obvias o formas de U)

Qué buscar:

Supuesto cumplido: Los puntos siguen un patrón de línea recta (aunque estén dispersos)
Violación: Los puntos forman una curva, forma de U o patrón exponencial

Qué hacer si se viola:

Intenta transformar X o Y (logarítmica, raíz cuadrada, cuadrática)
Usa regresión polinomial (cuadrática, cúbica)
Usa regresión no lineal o métodos no paramétricos
Reporta como limitación en tu tesis

Supuesto 2: Independencia de las observaciones

Qué significa: Cada observación debe ser independiente (no influenciada por otras observaciones). Aprende más sobre por qué la independencia es importante en estadística.

Cómo verificar:

Diseño de investigación: ¿Las observaciones son verdaderamente independientes?
Violaciones: Medidas repetidas, series de tiempo, datos agrupados, miembros de familia

Ejemplos:

Independiente: Diferentes estudiantes, una medición por estudiante
No independiente: Los mismos estudiantes medidos dos veces (usar análisis pareado)
No independiente: Estudiantes anidados dentro de aulas (usar modelado multinivel)

Excel no puede probar esto; es un tema de diseño de investigación que abordas en tu sección de Métodos.

Qué hacer si se viola:

Usar ANOVA de medidas repetidas (para series de tiempo)
Usar modelos de efectos mixtos (para datos agrupados)
Usar modelos autorregresivos (para series de tiempo)
Estos requieren SPSS o R, no Excel

Supuesto 3: Normalidad de los residuos

Qué significa: Los residuos (errores de predicción) deben estar aproximadamente distribuidos normalmente.

Cómo verificar en Excel:

Crea un histograma de residuos del resultado de regresión:

Histograma en Excel de residuos para regresión lineal simple mostrando distribución aproximadamente normal en forma de campana para probar el supuesto de normalidad con valores de residuos en el eje X y frecuencia en el eje Y

Figura 14: Verificación de normalidad; el histograma de residuos muestra una distribución aproximadamente en forma de campana (normal)

Pasos para crear un histograma de residuos:

En el cuadro de diálogo de regresión (Método 1), marca la casilla Residuals antes de hacer clic en Aceptar
Después de ejecutar la regresión, desplázate hacia abajo pasando las tablas principales. Excel crea una tabla separada "RESIDUAL OUTPUT" con tres columnas: Observation, Predicted [nombre variable Y] y Residuals
Selecciona solo los valores en la columna Residuals (no el encabezado, solo los valores numéricos)
Ve a Insertar → Gráficos → Histograma. Alternativamente, usa Análisis de datos → Histograma para mayor control sobre los tamaños de los intervalos
El histograma resultante debe mostrar la distribución de tus errores de predicción

Qué buscar:

Supuesto cumplido: Distribución en forma de campana, simétrica y centrada en cero
Violación: Fuertemente sesgada (cola larga a izquierda o derecha), bimodal (dos picos)

Nota: Con n mayor a 30, la regresión es robusta a violaciones moderadas de normalidad debido al Teorema del Límite Central.

Qué hacer si se viola:

Busca valores atípicos (residuos inusuales mayor a 3 DE de la media)
Intenta transformar la variable Y (logarítmica, raíz cuadrada)
Usa métodos de bootstrapping (requiere R)
Reporta como limitación si la transformación no ayuda

Supuesto 4: Homocedasticidad (varianza constante)

Qué significa: Los residuos deben tener varianza constante en todos los niveles de X (sin patrón de embudo). Para conocer más sobre este concepto, consulta qué es la homocedasticidad en estadística.

Cómo verificar en Excel:

Crea un diagrama de dispersión de residuos vs valores ajustados (predichos):

Diagrama de dispersión en Excel de residuos versus valores ajustados para regresión lineal simple mostrando varianza constante (homocedasticidad) en todo el rango sin patrón de embudo que indique heterocedasticidad

Figura 15: Verificación de homocedasticidad; residuos vs valores ajustados muestran dispersión aleatoria sin patrón de embudo (varianza constante)

Pasos para crear el gráfico de residuos:

En los resultados de regresión, Excel proporciona "Fitted Values" (Y predicho) y "Residuals"
Crea diagrama de dispersión: eje X = Valores ajustados, eje Y = Residuos
Agrega una línea horizontal en Y = 0 como referencia

Qué buscar:

Supuesto cumplido: Dispersión aleatoria alrededor de cero, dispersión aproximadamente constante en todo el rango de X
Violación: Forma de embudo (la varianza aumenta a medida que X aumenta)
Violación: Forma de cono (la varianza disminuye a medida que X aumenta)

Qué hacer si se viola:

Transforma la variable Y (la transformación logarítmica frecuentemente ayuda)
Usa regresión de mínimos cuadrados ponderados
Usa errores estándar robustos (requiere software estadístico)
Reporta la heterocedasticidad como limitación

Reportar la verificación de supuestos en tu tesis

En la sección de Métodos:

Previo al análisis de regresión, se examinaron diagramas de dispersión para verificar la linealidad entre las horas de estudio y las calificaciones. Se inspeccionaron gráficos de residuos e histogramas para verificar homocedasticidad y normalidad de residuos. Todos los supuestos se cumplieron, respaldando el uso de regresión lineal simple.

Si se violan los supuestos:

La inspección visual de gráficos de residuos reveló heterocedasticidad (patrón de embudo). Para abordar esta violación, se aplicó una transformación logarítmica a la variable dependiente, lo que mejoró la distribución de residuos. El análisis de regresión se realizó sobre las calificaciones transformadas logarítmicamente.

Cómo reportar regresión lineal simple en formato APA 7.ª edición

Tu comité de tesis espera que los resultados de regresión se reporten según las guías APA. Este es el formato completo para el Capítulo 4 (Resultados).

Plantilla para la sección de Resultados APA

Formato de párrafo:

Se realizó una regresión lineal simple para examinar si las horas de estudio semanales predecían las calificaciones del examen final. El supuesto de linealidad se cumplió, evaluado mediante inspección visual de un diagrama de dispersión. La inspección de gráficos de residuos indicó que los supuestos de normalidad y homocedasticidad se satisficieron.

El modelo de regresión predijo significativamente las calificaciones, F(1, 28) = 850.27, p < .001, R² = .97. Las horas de estudio explicaron el 96.8% de la varianza en las calificaciones. La ecuación de regresión fue: Calificación = 47.33 + 2.75(Horas de Estudio). Por cada hora adicional de estudio semanal, las calificaciones aumentaron en 2.75 puntos en promedio (IC 95% [2.56, 2.95]). El efecto de las horas de estudio sobre las calificaciones fue estadísticamente significativo, β = 2.75, t(28) = 29.16, p < .001.

Formato de tabla de regresión APA

Variable	B	EE	β	t	p	IC 95%
Intercepto	47.33	1.85	-	25.58	< .001	[43.54, 51.12]
Horas de Estudio	2.75	0.09	.98	29.16	< .001	[2.56, 2.95]

Tabla 7: Regresión lineal simple prediciendo calificaciones a partir de horas de estudio

Nota. n = 30. R² = .97, F(1, 28) = 850.27, p < .001. B = coeficiente de regresión no estandarizado. EE = error estándar. β = coeficiente estandarizado. IC = intervalo de confianza.

Lista de verificación para el reporte

Al reportar regresión en tu tesis, incluye TODOS estos elementos:

En texto (párrafo de Resultados):

Tipo de análisis ("Se realizó una regresión lineal simple...")
Pregunta de investigación/hipótesis probada
Declaración de verificación de supuestos
Significancia general del modelo: F(gl_regresión, gl_residual) = valor F, valor p
R² con interpretación ("explicó el X% de la varianza")
Ecuación de regresión: Y = a + bX
Interpretación del coeficiente con dirección y magnitud
Significancia del coeficiente: β = valor, t(gl) = valor t, valor p
Intervalo de confianza del 95% para el coeficiente

En tabla:

Número de tabla y título en cursiva
Coeficientes no estandarizados (B)
Errores estándar (EE)
Coeficientes estandarizados (β) si es relevante
Estadísticos t y valores p
Intervalos de confianza del 95%
Nota de tabla con n, R², estadístico F

Errores comunes al hacer regresión en Excel

Evita estos errores frecuentes que comprometen la calidad de la investigación de tesis:

1. No verificar supuestos antes de la regresión

Error: Ejecutar regresión sin verificar linealidad, normalidad u homocedasticidad.

Por qué está mal: Los supuestos violados llevan a coeficientes sesgados y valores p incorrectos.

Cómo corregir: Siempre crea diagramas de dispersión y gráficos de residuos antes de finalizar los resultados. Reporta la verificación de supuestos en la sección de Métodos.

2. Confundir correlación con causalidad

Error: Concluir "Las horas de estudio causan calificaciones más altas" a partir de los resultados de regresión.

Por qué está mal: La regresión muestra predicción y asociación, no causalidad. La causalidad requiere diseño experimental con asignación aleatoria.

Cómo corregir: Usa lenguaje cuidadoso: "predijo," "se asoció con," "se relacionó con" en lugar de "causó," "llevó a," "resultó en."

3. Usar regresión para variables dependientes categóricas

Error: Ejecutar regresión lineal con un resultado binario (aprobado/reprobado, sí/no).

Por qué está mal: La regresión lineal asume una Y continua. Los resultados categóricos violan los supuestos y producen predicciones sin sentido (ej. probabilidad predicha de 1.3).

Cómo corregir: Usa regresión logística para resultados binarios (requiere SPSS/R). Excel no puede hacer esto.

4. Ignorar valores atípicos y puntos influyentes

Error: No verificar valores atípicos con residuos extremos que distorsionan la línea de regresión.

Por qué está mal: Un solo valor atípico puede cambiar drásticamente la pendiente y R², llevando a conclusiones engañosas.

Cómo corregir: Examina gráficos de residuos buscando valores mayores a 3 DE de la media. Investiga los valores atípicos: ¿son errores de captura de datos o casos extremos legítimos? Reporta cómo se manejaron los valores atípicos.

5. No reportar el tamaño del efecto (R²)

Error: Solo reportar "p menor a 0.05" sin R² o magnitud del coeficiente.

Por qué está mal: La significancia estadística no te dice si el efecto es lo suficientemente grande para importar prácticamente.

Cómo corregir: Siempre reporta R² como medida del tamaño del efecto, incluso si es pequeño. Discute la significancia práctica en el capítulo de Discusión.

6. Extrapolar fuera del rango de datos

Error: Usar la ecuación de regresión para predecir Y para valores de X fuera de tu rango observado.

Ejemplo: Tus datos tienen Horas de Estudio de 2-20, pero predices la calificación para 40 horas por semana.

Por qué está mal: La relación lineal podría no mantenerse fuera del rango observado (podría estabilizarse o invertirse).

Cómo corregir: Solo haz predicciones dentro del rango de tus datos. Reconoce la extrapolación como limitación si es inevitable.

7. Tratar las limitaciones de Excel como capacidades

Error: Pensar que Excel puede hacer todos los tipos de regresión (logística, jerárquica, stepwise).

Por qué está mal: Excel solo hace regresión lineal simple y múltiple. Intentar soluciones alternativas produce resultados no válidos.

Cómo corregir: Conoce las limitaciones de Excel (consulta la siguiente sección). Usa SPSS/R cuando lo requiera tu diseño de investigación.

Qué tipos de regresión Excel NO puede hacer

El Analysis ToolPak de Excel es excelente para regresión lineal simple y múltiple, pero no puede realizar muchas técnicas de regresión avanzadas requeridas para ciertos diseños de tesis. Entender estas limitaciones previene errores metodológicos y te ayuda a elegir el software correcto.

Tipos de regresión que requieren SPSS o R

Tipo de regresión	Qué hace	Capacidad de Excel	Software alternativo
Regresión logística	Predice resultados binarios (sí/no, aprobado/reprobado, 0/1)	No	SPSS (Logística binaria), R (función glm)
Logística multinomial	Predice resultados categóricos (3+ categorías no ordenadas)	No	SPSS (Logística multinomial), R (multinom)
Regresión ordinal	Predice resultados categóricos ordenados (bajo/medio/alto)	No	SPSS (Regresión ordinal), R (polr)
Regresión stepwise	Selecciona predictores automáticamente según criterios	No	SPSS (Regresión lineal con Stepwise), R (función step)
Regresión jerárquica	Agrega predictores en bloques según la teoría	No (solución manual posible)	SPSS (bloques jerárquicos), R (comparación manual)
Análisis de moderación	Prueba si el efecto de X sobre Y depende del moderador M	No fácilmente	SPSS con macro PROCESS, R (interacciones)
Análisis de mediación	Prueba si X afecta a Y a través del mediador M	No	SPSS con macro PROCESS, R (lavaan, mediation)
Regresión polinomial	Ajusta curvas cuadráticas, cúbicas (términos X², X³)	Sí (agregar columna X² manualmente)	SPSS, R (sintaxis más fácil)
Regresión lineal simple	Predice Y a partir de un X continuo	Sí perfectamente	SPSS, R (también disponible)
Regresión lineal múltiple	Predice Y a partir de 2+ predictores continuos	Sí perfectamente	SPSS, R (también disponible)

Tabla 8: Capacidades de regresión de Excel vs requisitos de software estadístico

Diagnósticos avanzados que Excel no puede proporcionar

Aunque Excel proporciona resultados básicos de regresión, carece de herramientas de diagnóstico avanzadas:

Lo que Excel NO puede calcular:

VIF (Factor de inflación de la varianza): Detecta multicolinealidad en regresión múltiple
Estadístico de Durbin-Watson: Prueba autocorrelación en series de tiempo
Distancia de Cook: Identifica valores atípicos influyentes
DFBETAS: Mide la influencia en coeficientes individuales
Valores de leverage: Identifica puntos de alto apalancamiento
Residuos estandarizados: Detección de valores atípicos más fácil que con residuos crudos

Cómo solucionar:

Para regresión simple, la multicolinealidad no es un problema (solo un predictor)
Calcula residuos estandarizados manualmente: (Residuo / Error estándar)
Usa SPSS/R si tu asesor requiere diagnósticos avanzados

Cuándo usar Excel vs software estadístico

Usa Excel cuando:

Tienes solo regresión lineal simple o múltiple
Tu variable dependiente es continua (escala de intervalo/razón)
No necesitas regresión stepwise o jerárquica
Los diagnósticos básicos (gráficos de residuos) son suficientes
Tu comité acepta los resultados de Excel
Quieres aprender los fundamentos de regresión antes de SPSS/R

Usa SPSS/R cuando:

Necesitas regresión logística, ordinal o multinomial
Tu comité requiere VIF, Durbin-Watson o Distancia de Cook
Estás probando hipótesis de moderación o mediación
Necesitas selección stepwise de variables
Tienes diseños de encuestas complejos con ponderaciones
Publicas en revistas que requieren resultados de SPSS/R

Conclusión clave: Excel es perfecto para regresión lineal con resultados continuos. Para cualquier cosa más allá, invierte tiempo en aprender SPSS o R. La mayoría de los comités de tesis son flexibles con la elección de software para regresión simple, pero consulta con tu asesor. Si necesitas usar SPSS, consulta nuestra guía sobre cómo calcular la regresión lineal en SPSS.

Preguntas frecuentes

Próximos Pasos

Ahora tienes un marco completo para realizar regresión lineal simple en Excel, desde la preparación de datos hasta la verificación de supuestos y el reporte en formato APA. La clave del éxito en tu tesis no es solo ejecutar el análisis, sino entender cuándo usarlo, cómo interpretar los resultados correctamente y cómo comunicar los hallazgos de manera clara a tu comité.

Si necesitas analizar múltiples predictores simultáneamente, consulta cómo hacer regresión lineal múltiple en Excel. Para reportar tus estadísticas descriptivas en el formato correcto antes de la regresión, revisa cómo reportar estadísticas descriptivas en formato APA en Excel.

Referencias

American Psychological Association. (2020). Publication manual of the American Psychological Association (7th ed.). https://doi.org/10.1037/0000165-000

Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Lawrence Erlbaum Associates.

Green, S. B. (1991). How many subjects does it take to do a regression analysis? Multivariate Behavioral Research, 26(3), 499–510. https://doi.org/10.1207/s15327906mbr2603_7