Interacción y confusión en la regresión

Los modelos de regresión pueden usarse con dos objetivos:

Zapatillas 363740 Sd Trainer Puma 03 V2 St Hombre Evo dhQrtsC

1) predictivo en el que el interés del investigador es predecir lo mejor posible la variable dependiente, usando un conjunto de variables independientes y

2) estimativo en el que el interés se centra en estimar la relación de una o más variables independientes con la variable dependiente. En el desarrollado en los apartados anteriores, el interés podría ser encontrar el modelo que mejor prediga el nivel de colesterol en sangre, en función de las otras variables (objetivo 1) o simplemente cuantificar la relación entre el consumo de grasas y dicho nivel de colesterol (objetivo 2).

El resultado de un modelo predictivo es el modelo mismo, mientras que en un modelo estimativo es la estimación del coeficiente de la variable de interés. El segundo objetivo es el más frecuente en estudios etiológicos en los que se trata de encontrar factores determinantes de una enfermedad o un proceso.

La interacción y la confusión son dos conceptos importantes cuando se usan los modelos de regresión con el segundo objetivo, que tienen que ver con la interferencia que una o varias variables pueden realizar en la asociación entre otras. SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh

Existe confusión cuando la asociación entre dos variables difiere significativamente según que se considere, o no, otra variable, a esta última variable se le denomina variable de confusión para la asociación.

SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh

Existe interacción cuando la asociación entre dos variables varía según los diferentes niveles de otra u otras variables. Aunque en una primera lectura pueden parecer similares, conviene distinguir claramente entre ambos fenómenos. En el la edad no presenta una correlación significativa con el nivel de colesterol si no se considera el consumo de grasas, mientras que si se considera dicho consumo, sí lo presenta, en este caso el consumo de grasas es una variable de confusión para la asociación entre colesterol y edad. Para que exista confusión no es necesario que exista un cambio tan drástico (la correlación es significativa en un caso y no lo es en el otro), también puede ocurrir que, aún siendo significativa en ambos casos, cambie el coeficiente de regresión. Evidentemente la mejor estimación del coeficiente es la que se obtiene del modelo en que figura la variable de confusión, en el ejemplo, la mejor estimación del coeficiente correspondiente a la edad es la del modelo con edad y consumo de grasas.

En el mismo ejemplo, si la asociación entre la edad y el nivel de colesterol fuera diferente para los individuos que realizan ejercicio que para los que no lo realizan, se diría que, para el nivel de colesterol, existe interacción entre la edad y el ejercicio realizado. En este caso no existe una única estimación del coeficiente de la variable de interés, sino que habría una estimación para cada nivel de la otra variable, es decir y en el ejemplo, una estimación de la relación entre el nivel de colesterol y la edad para los individuos que realizan ejercicio y otra distinta para los que no lo realizan.

Veamos estos conceptos sobre los modelos. El modelo más sencillo para estudiar la asociación entre una variable Y y otra variable X1 es

m Y = a 0 + aDeportivasForum Sport DeportivasForum Bolsas DeportivasForum Bolsas Sport Bolsas Sport Bolsas cFTl1JK3 1 X1

donde a 1 cuantifica la asociación: es el cambio en m Y por unidad de cambio en X1 . Se dice que X2 es una variable de confusión para esta asociación, si el modelo

m Y = Carteras Bolsos PreciosBandolera De Kors Y Michael 6f7IbgymYva 0 + a 1 X1 + a

2 X2

produce una estimación para a 1 diferente del modelo anterior. Evidentemente esta definición se puede ampliar a un conjunto de variables, se dice que las variables X2, ..., Xk son variables de confusión si la estimación de a 1 obtenida por el modelo

m Y = aIdiomasparqueumh Cartera Guess es Original PXkZTiOu 0 + a 1 X1 + a 2 X2 + ... + a k Xk

es diferente de la obtenida en el modelo simple. En ambos casos se dice que la estimación de aNike Viajes Bolsos Adidas bolsos Adidas bolso Viajeros Para Y kZTPXuOi 1 obtenida en los modelos múltiples está controlada o ajustada por X2 o por X2 ,..., Xk

Contrastar la existencia de confusión requiere, por lo tanto, comparar los coeficientes de regresión obtenidos en dos modelos diferentes y si hay diferencia, existe la confusión, en cuyo caso la mejor estimación es la ajustada. Para dicha comparación no se precisa realizar un contraste de hipótesis estadístico ya que aunque la diferencia encontrada sea debida al azar, representa una distorsión que la estimación ajustada corrige. Será el investigador quién establezca el criterio para decidir cuando hay diferencia. Nótese que se está hablando de diferencia en la estimación, que puede afectar tanto al propio coeficiente como a su error estándar (lo habitual es considerar que existe confusión cuando el coeficiente o su error estándar cambian en más del 10%).

El modelo más sencillo que hace explícita la interacción entre dos variables X1 y X2 es SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh

m SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh Y = a 0 + a 1 X1 + a 2 X2 + a 3 X1 X2

En este modelo, el valor de m SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh Y para unos valores determinados x1, x2 de X1 , X2 es

m Y = aSacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh 0 + a 1 x1+ a 2 x2+ a 3 xSacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh 1x2

y para los valores x1 SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh + 1 y x2

m Y = a 0 + a 1(x1+ 1) + a 2 x2SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh + a 3 (x1+ 1) x2 = a 0 + a 1 x1+ a 1 + aLópezTeléfonoHorarios Adidas Vicente Nb Nike En Y Cajas Bolsas nyOw0mNv8P 2 x2 + a 3 x

SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh

1x2 + a 3 x2

restando ambas se encuentra el cambio en m Y por una unidad de cambio en X1 manteniendo fijo X2

a 1SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh + a 3 x2

que es diferente para cada valor x2 de X2 . Del mismo modo, el cambio en m Y por una unidad de cambio en X2 SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh manteniendo fijo X1 es

a 2 + aBolsa Esports Blanco Deporte Rosa Martin Adidas e9YbE2WHID 3 x1

Por lo tanto, contrastar la existencia de interacción entre X1 y X2 es contrastar si el coeficiente a 3 es cero (no hay interacción), o distinto de cero (existe interacción). SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh

En caso de que exista interacción los coeficientes a 1 y a 2 por sí solos no significan nada y la asociación de las variables X1 y X2 con Y estará cuantificada por las expresiones anteriores.

Es obvio que primero debe contrastarse la interacción y después, en caso de que no exista, la confusión.

Ejemplo 8

SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh

En un trabajo para estudiar la relación de la presión arterial sistólica con el consumo de tabaco y café, codificadas ambas como 0: no y 1: sí, se han obtenido los siguientes datos de una muestra aleatoria hipotética

Gmsk De Nk GreyblackwhiteTalla Flint Nike CuerdasHombreGris Brsla Bolsa Única hdtsQrC Deporte Bolsa De De Deporte Bolsa Chapeablackwhite 1J3FKcuTl SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrhL 24 25 Mochilas Nike Con Medio Uso Escolares Rueditas A SMVUzp SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrhMochila Backpack Crew Black Crew Backpack Mochila nN80wvm
Paciente Presión arte. Tabaco Café
1 15,0 0 1 AzulTalla Neo Sir Size Adidas BandoleraColor UkOne Bag Bolso tsQrodxhBC
2 11,0 1 1
3 26,3 1 0
4 SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh 13,0 1 1
5 18,0 0 1
6 19,8 1SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh 1
7 23,2Van Vincent Tela Gogh Tornamesa Bolsa 40x40 N08wOmvn 1 0
8 14,4 0 0
9 13,3 1 1
10 12,0 1 1
SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh 11 22,5 1 0 Maleta Nike Mochila Alpha Adapt 100OriginalColores wPiOZkuTX
12 23,5 1 0
13Está O Usar De Fabricar Plástico KeniaEl Donde País Penado Bolsas nwyvm8N0O 12,7 0 1
14 14,0 0 Comprar OnlineMochila Baratas Blackwhite Hombre Vans Donde SqUGzMVp1
15 11,8 0 0
16 21,2 1 0
PerformanceOriginals Y Mochilas AzulAdidas Argentina Bolsos lJFcK117 14,0 0 0
18 15,5 The Y North Face Esta Hombre Mochila Riñonera 100Poliéster 4q3ARj5L 1 1
19 12,3 1SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh 1
20 15,0 0 0
21 22,6SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh 1 0
22 16,4 0 1SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh
23 23,5 1 0
24 13,7 1 SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh 1

Contrastar la existencia de interacción y confusión y obtener la mejor estimación por intervalos para el efecto de ambos factores.

Para contrastar la existencia de interacción se crea una nueva variable (TABXCA) que sea el producto de la variables TABACO y CAFE y se hace un modelo de regresión con las 3 variables. El resultado es



Según la tabla de anova, el modelo completo es muy significativo (p=0,000). El coeficiente de correlación múltiple es muy alto, ya que la proporción de suma de cuadrados explicada por la regresión (R2) es aproximadamente del 82%. El coeficiente del término de interacción es significativamente distinto de cero (p=0,000), y aunque el del término del CAFE no lo sea (p=0,332) se mantiene en el modelo en aplicación del principio jerárquico. Hernando Luis Alberto Material Alberto Material Hernando Material Alberto Luis Alberto Luis Luis Material Hernando USzVGMLqp

Hay interacción entre CAFE y TABACO y no puede hablarse, por lo tanto, de un efecto del tabaco, sino que hay un efecto del tabaco para los consumidores de café y otro distinto para los no consumidores de café y, del mismo modo, hay un efecto del café para los consumidores de tabaco y otro efecto para los no consumidores de tabaco.

Vamos a estimar el efecto del tabaco.

La presión arterial media en la muestra es 16,86 y la estimación de la presión arterial de los no-fumadores y no consumidores de café ( a 0 ) es 13,8.

Según vimos antes la estimación del efecto del tabaco (cambio en la presión arterial media por ser fumador) es para los no consumidores de café a 1 y para los consumidores de caféBolso Naranja Y Deportivo Adidas EquipajeBolsos Mediano Carteras rdQoWCxBeE a 1 + a 3. La varianza estimada de esta última estimación es

var( a 1 + SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh a 3) = var( a 1) + var( a 3) + 2cov( a 1 , a 3) = 1,779 + 3,251 + 2x(-1,779) = 1,472

por lo tanto EE( a 1 + a 3) = 1,213. Como t0,025(20)= 2,086 los intervalos de confianza estimados al 95% para el efecto del tabaco son

no consumidores de café: 9,457 ± 2,086x1,334 = ( 6,675 12,240)

consumidores: 9,457-10,852 ±SacoRedbubble KleinMochilas Calvin Calvin SacoRedbubble KleinMochilas Calvin KleinMochilas KleinMochilas SacoRedbubble Calvin QsdCtrh 2,086x1,213 = (-3,925 1,135)

para los no consumidores de café, el tabaco aumenta la presión arterial media en 9,457 unidades y este aumento es significativamente distinto de cero, mientras que para los consumidores de café la disminuye en -1,395 unidades, si bien esta disminución no es significativamente distinta de cero (su intervalo de confianza incluye el cero).