Antecedentes Empíricos y Ejemplo
Tengo dos estudios; me encontré un experimento (Estudio 1) y, a continuación, se replica (Estudio 2). En el Estudio 1, he encontrado una interacción entre dos variables; en el Estudio 2, esta interacción fue en la misma dirección, pero no significativo. Aquí está el resumen para el Estudio 1 del modelo:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.75882 0.26368 21.840 < 2e-16 ***
condSuppression -1.69598 0.34549 -4.909 1.94e-06 ***
prej -0.01981 0.08474 -0.234 0.81542
condSuppression:prej 0.36342 0.11513 3.157 0.00185 **
Y el Estudio 2 del modelo:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.24493 0.24459 21.444 <2e-16 ***
prej 0.13817 0.07984 1.731 0.0851 .
condSuppression -0.59510 0.34168 -1.742 0.0831 .
prej:condSuppression 0.13588 0.11889 1.143 0.2545
En lugar de decir, "me imagino que no tiene nada, porque yo no se pudo replicar,'" lo que hice fue combinar los dos conjuntos de datos, se creó una variable ficticia para lo que estudio provienen los datos, y luego corrió la interacción de nuevo después de controlar para el estudio de la variable ficticia. Esta interacción fue significativa incluso después de controlar por ella, y me encontré con que esta interacción bidireccional entre el estado y la aversión a/prej no fue calificado por una interacción de tres vías con el estudio de la variable ficticia.
Introducción El Análisis Bayesiano
Tenía a alguien que sugieren que esta es una gran oportunidad para utilizar el análisis Bayesiano: En el Estudio 2, tengo la información del Estudio 1 que puedo utilizar como información previa! De esta manera, el Estudio 2, que está haciendo un Bayesiano de la actualización de la frecuentista, mínimos cuadrados ordinarios resultados en el Estudio 1. Así que, doy la vuelta y volver a analizar el Estudio 2 el modelo, ahora el uso informativo de los priores de los coeficientes: Todos los coeficientes era normal antes de donde la media fue de lo estimado en el Estudio 1 y la desviación estándar fue el error estándar en el Estudio 1.
Este es un resumen de los resultados:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.63 0.17 5.30 5.52 5.63 5.74 5.96
condSuppression -1.20 0.20 -1.60 -1.34 -1.21 -1.07 -0.80
prej 0.02 0.05 -0.08 -0.01 0.02 0.05 0.11
condSuppression:prej 0.34 0.06 0.21 0.30 0.34 0.38 0.46
sigma 1.14 0.06 1.03 1.10 1.13 1.17 1.26
mean_PPD 5.49 0.11 5.27 5.41 5.49 5.56 5.72
log-posterior -316.40 1.63 -320.25 -317.25 -316.03 -315.23 -314.29
Parece que ahora tenemos bastante sólida evidencia de una interacción desde el Estudio 2 de análisis. Esto concuerda con lo que hice yo cuando simplemente apilados los datos en la parte superior de uno al otro y corrió el modelo con el número de estudio como un maniquí-variable.
Hipótesis: ¿Qué Si Me Encontré Con El Estudio 2 Primeros?
Que me puso a pensar: ¿y si me había quedado Estudio 2 en primer lugar y, a continuación, utiliza los datos del Estudio 1 para actualizar mis creencias en el Estudio 2? Yo hice lo mismo que el anterior, pero en sentido inverso: me re-analizados en el Estudio 1 de los datos mediante el frecuentista, mínimos cuadrados ordinarios los coeficientes estimados y desviaciones estándar de Estudio 2 como antes los medios y las desviaciones estándar para el análisis de Estudio 1 los datos. El resumen de los resultados fueron:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.35 0.17 5.01 5.23 5.35 5.46 5.69
condSuppression -1.09 0.20 -1.47 -1.22 -1.09 -0.96 -0.69
prej 0.11 0.05 0.01 0.08 0.11 0.14 0.21
condSuppression:prej 0.17 0.06 0.05 0.13 0.17 0.21 0.28
sigma 1.10 0.06 0.99 1.06 1.09 1.13 1.21
mean_PPD 5.33 0.11 5.11 5.25 5.33 5.40 5.54
log-posterior -303.89 1.61 -307.96 -304.67 -303.53 -302.74 -301.83
De nuevo, vemos evidencia de una interacción, sin embargo, esto no podría haber sido necesariamente el caso. Tenga en cuenta que la estimación para ambos análisis Bayesiano ni siquiera están en el 95% de intervalos de credibilidad para el uno al otro; los dos intervalos de credibilidad de los análisis Bayesiano tiene más de superposición que se superponen.
¿Cuál Es El Bayesiano Justificación Para El Tiempo De Precedencia?
Mi pregunta es, pues: ¿Cuál es la justificación que Bayesians han de respetar la cronología de cómo los datos fueron recogidos y analizados? Obtengo los resultados del Estudio 1 y utilizarlos como informativo de los priores de Estudio 2, de modo que yo uso el Estudio 2 para "actualizar" mis creencias. Pero si asumimos que los resultados que obtengo son tomadas al azar de una distribución con un verdadero efecto de la población... entonces ¿por qué yo privilegio de los resultados del Estudio 1? ¿Cuál es la justificación para el uso de Estudio de 1 resultados como priores de Estudio 2 en lugar de tomar el Estudio 2 resultados como priores de Estudio 1? ¿El orden en el que he recogido y calcula el análisis realmente importa? No parece como a mí-¿cuál es el Bayesiano justificación para esto? ¿Por qué debo creer que el punto de estimación está más cerca de .34 que .17 sólo porque me encontré con el Estudio 1 en primer lugar?
Responder a Kodiologist la Respuesta
Kodiologist comentó:
El segundo de estos puntos para una importante partida que han hecho de Bayesiana de la convención. No ha establecido un antes de la primera y, a continuación, ajuste de ambos modelos en Bayesiano de la moda. Ajuste de un modelo no-Bayesiano de la moda y, a continuación, se utiliza para que los priores para el otro modelo. Si usted utiliza el método convencional, que no se vea la dependencia en el orden que has visto aquí.
Para solucionar esto, me ajuste de los modelos para el Estudio 1 y Estudio 2, donde todos los coeficientes de regresión tenido antes de $\text{N}(0, 5)$. El cond
variable una variable ficticia para la condición experimental, 0 o 1; prej
variable, así como los resultados, fueron medidos en los 7 puntos de escalas que van de 1 a 7. Por lo tanto, creo que es una justa elección de antes. Sólo por cómo los datos son a escala, sería muy, muy raro ver a los coeficientes mucho más grande de lo que antes se sugiere.
Las estimaciones promedio y la desviación estándar de las estimaciones son aproximadamente los mismos que en la regresión por MCO. Estudio 1:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.756 0.270 5.236 5.573 5.751 5.940 6.289
condSuppression -1.694 0.357 -2.403 -1.925 -1.688 -1.452 -0.986
prej -0.019 0.087 -0.191 -0.079 -0.017 0.040 0.150
condSuppression:prej 0.363 0.119 0.132 0.282 0.360 0.442 0.601
sigma 1.091 0.057 0.987 1.054 1.088 1.126 1.213
mean_PPD 5.332 0.108 5.121 5.259 5.332 5.406 5.542
log-posterior -304.764 1.589 -308.532 -305.551 -304.463 -303.595 -302.625
Y Estudio 2:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.249 0.243 4.783 5.082 5.246 5.417 5.715
condSuppression -0.599 0.342 -1.272 -0.823 -0.599 -0.374 0.098
prej 0.137 0.079 -0.021 0.084 0.138 0.192 0.287
condSuppression:prej 0.135 0.120 -0.099 0.055 0.136 0.214 0.366
sigma 1.132 0.056 1.034 1.092 1.128 1.169 1.253
mean_PPD 5.470 0.114 5.248 5.392 5.471 5.548 5.687
log-posterior -316.699 1.583 -320.626 -317.454 -316.342 -315.561 -314.651
Desde estos medios y desviaciones estándar son más o menos el mismo que el de la OPERACIÓN de las estimaciones, la orden de efecto sobre persiste. Si me plug-in de la parte posterior de las estadísticas de resumen del Estudio 1 en los priores al analizar el Estudio 2, observo un final diferente posterior de la hora de analizar el Estudio 2, primero y, a continuación, utilizar esos posterior resumen de las estadísticas de los priores para el análisis de Estudio de 1.
Incluso cuando yo uso el Bayesiano medios y desviaciones estándar de los coeficientes de regresión como priores en lugar de la frecuentista estimaciones, todavía iba a observar el mismo orden en el efecto. Así que la pregunta sigue siendo: ¿Cuál es el Bayesiano justificación para privilegiar el estudio que vino primero?