Mi equipo y me gustaría dar una presentación a la no-estadísticos de la empresa acerca de la utilidad del diseño de experimentos. Estos no los estadísticos son también nuestros clientes y la que generalmente no nos consulten antes de la recogida de sus datos. ¿Conoces algunos ejemplos reales que bien podría ilustrar Fisher la famosa frase de "Para llamar en el estadístico después de que el experimento se realiza puede no ser más que pedirle a realizar un examen post-mortem: él sólo puede ser capaz de decir lo que el experimento se murió". ? Preferiblemente que estamos buscando una ilustración en un industrial/industria farmacéutica/contexto biológico. Pensemos en un ejemplo de un resultado de análisis estadístico que podría haber tenido éxito si había sido preliminarmente bien diseñado, pero tal vez hay otras posibles ilustraciones.
Respuestas
¿Demasiados anuncios?Me he topado con diseños en los que el experimentador quería poner a prueba entre el sujeto efectos, pero el diseño era más adecuada para el sujeto dentro de los efectos.
Por ejemplo, un experimento consistió de 8 ratas, cuatro en la dieta Una y cuatro en la dieta B, y el peso de la rata fue medido cada día durante cuatro semanas. Esto estaba bien si estaban interesados en el efecto del tiempo de cada dieta, pero el objetivo fue investigar las diferencias en las dietas.
Ellos pensaban que mediante la medición de cada rata 28 veces en las que habían un montón de datos, pero la unidad experimental para el efecto de la dieta fue la rata, que sólo tenían 4 para cada tratamiento. Podrían haber medido las ratas de 10 veces al días, pero que habría hecho ninguna diferencia, en el extremo que más necesitan de las ratas.
Hice un poco de trabajo para una organización llamada Fundación Nacional para la Sensibilización para la enfermedad Celíaca. La organización promueve la conciencia pública de la Enfermedad Celíaca y proporciona una lista de verificación de síntomas de la enfermedad que consiste en la intolerancia a los alimentos que contienen gluten. Se llevó a cabo una encuesta en internet por sólo la apertura a cualquiera que quisiera participar. A través de los años se recogieron miles de respuestas por parte del público. Sin embargo, tenían la esperanza de llegar a conclusiones sobre el público en general, basado en los resultados de la encuesta. Tuve que decirles que los participantes fueron selfselected lugar de al azar y esto podría generar sesgo. Dado que el grado de sesgo es desconocido que no podemos hacer ninguna inferencia a pesar de la gran cantidad de datos.
Ahora los encuestados que parecía ser un peculiar grupo. Muchos son muy graves y respondió a expresar preocupación de que ellos o un familiar puede tener la enfermedad. Pero también hubo un distnct número de gente que contesta en un sabio hombre de la moda. Esto fue evidente a partir de los nombres falsos, extraño direcciones de correo electrónico y direcciones postales que se proporciona con sus respuestas.
Sentí que los datos sólo son útiles en un sentido exploratorio y la frecuencia de las respuestas podrían ser útiles para fomrulating hipótesis que pueden ser probadas en un bien planeado el futuro de la encuesta. Pero hasta ahora, mi consejo no ha sido escuchada y que se están ejecutando otro de estos fácil de hacer el auto selección de encuestas en internet.
Me preguntaron por un colega para 'hacer las estadísticas" en un estudio sobre la correlación entre un cierto tipo de evento de tiempo y fracasos en un tipo de infraestructura que se atribuye generalmente a simple desgaste. El colega quería ver si el tiempo de los eventos fueron en realidad contribuyen a la falla o no. Un equipo de personas que ya habían pasado un montón de tiempo y esfuerzo en la recopilación de una gran cantidad de datos y el trabajo de investigación fue prácticamente terminado, que sólo necesitaba que alguien la a "hacer los stats' y rellenar el bit final de la sección de resultados.
El problema era, que tenía cuidadosamente aseguró que el conjunto de datos contenía sólo 'muy interesante' los períodos en los que el clima evento en cuestión se había producido. Eso significaba que no había manera de comparar la tasa de fracaso durante los eventos con los que no las horas de los eventos. He intentado varias veces para explicar el problema, pero nunca fueron realmente convencido, porque el simplemente había tal cantidad de datos que seguramente yo podría obtener algo de ella.
Afortunadamente todavía hay un rango de severidad de los eventos climáticos y había una débil correspondencia entre la gravedad y la tasa de fracaso, así que hemos recuperado algo de él, al menos, pero el resultado podría haber sido mucho más definitivo que había pensado acerca de cómo "hacer las estadísticas" antes de embarcarse en el ejercicio de recogida de datos.
Hace algún tiempo me pidieron para analizar los resultados de un experimento sobre cómo la noche de almacenamiento de la posición de un solar fotovoltaica matriz afectada la velocidad a la que suelo acumulado en la matriz. (Estos grandes de concentración fotovoltaica matrices de seguimiento del sol todo el día, pero por la noche se almacenan apuntando hacia arriba, ya que este es el mínimo estrés en su posición para que el perseguidor.) La suciedad es un gran problema, ya que reduce significativamente la producción de energía, y la limpieza no es barato. El experimento había sido ejecutada en un campo de aproximadamente 120 perseguidores; el oeste de la mitad había sido estibados en vertical y el este de la mitad de forma horizontal (este alineado con el tracker que las conexiones de los dos inversores, que transmitiría una ventaja en la producción de energía durante el experimento, si hay un efecto significativo y ningún patrón particular de la suciedad de lo contrario, por lo que no es, por sí misma, una mala idea.)
Por desgracia, hay un fuerte viento predominante patrón a través del desierto desde el sur-suroeste, y un gran edificio al sur de la parte occidental del campo, "sombreado" (un poco) de gran parte de la parte occidental del campo de viento de partículas. Además, los rastreadores "sombra" desde el viento hasta cierto punto. En consecuencia, los mecanismos por los cuales el suelo se acumula (por ejemplo, arrastrado por el viento o adaptación) varían en magnitud relativa en el campo. Esto a su vez implica que las matrices se acumulan en el suelo en diferentes tarifas dependen de la ubicación; esto no es un efecto pequeño.
El resultado final de este análisis fue, esencialmente, que no era poco probable que la posición de almacenamiento hizo una diferencia, pero no hemos podido, por cualquier medio, descarta la posibilidad de que el efecto era trivial, ni determinar con gran confianza (basa en los datos) el signo del efecto. Luego he diseñado un experimento de seguimiento, la asignación de posiciones de almacenamiento basado en la matriz de localización con el objetivo de ser capaces de estimar la suciedad "de superficie de respuesta" a través del campo para ambas posiciones de almacenamiento, la estimación de "instalarse" vs "el viento" la suciedad de las tasas, y, por supuesto, el efecto de almacenamiento de ángulo en ambos de estos. Este experimento fue un éxito y hemos sido capaces de obtener una imagen clara de los beneficios de la vertical stow después de un par de meses.