2 votos

Análisis de datos con un componente acumulativo

Tengo formación en informática, pero soy nuevo en el trabajo estadístico real. Me han pedido que responda a una pregunta, y estoy buscando alguna orientación sobre cómo enfocarla.

Trabajo en la industria alimentaria, y tenemos alojamientos para animales, y hay un periodo de tiempo entre que un grupo de animales sale de este alojamiento y entra el siguiente. Este periodo de tiempo se denomina "distribución".

Medimos múltiples variables en los animales, como la conversión alimenticia y la mortalidad.

La opinión generalizada en el sector es que los trazados cortos afectan negativamente al rendimiento, mientras que los trazados largos implican una infrautilización de las viviendas. Además, se cree que se puede "hacer trampa" en el trazado haciendo un trazado corto de vez en cuando, pero que hacerlo con regularidad provocará una degradación del rendimiento.

Me piden que describa la relación entre las medidas de rendimiento y la disposición, con el objetivo de poder elaborar directrices en torno a la disposición.

No sé por dónde empezar, dada la posible relación entre la longitud del trazado y el historial de trazados anteriores. Lo siento no hay datos, pero es de propiedad, y estoy realmente sólo en busca de los conceptos a aplicar, no el código R para realizar el trabajo.

0voto

Jeremy Puntos 11

No estoy seguro de si mi respuesta será útil, pero intentaré aportar alguna orientación. Parece que ya has respondido en parte a tu pregunta: los trazados cortos tienen un impacto negativo en el rendimiento y los trazados largos son un despilfarro porque infrautilizan el alojamiento de los animales. Puede empezar con esas directrices básicas y quizás tener en cuenta el número de animales (es decir, el hacinamiento) de cualquier lote de animales en particular, el tamaño de los animales, el sexo y quizás el tipo de comida que se les da. Puede que tenga que utilizar datos limitados para los que se conocen los resultados y hacer proyecciones o extrapolar resultados para otros posibles rangos de condiciones utilizando algún tipo de fórmula.

El hecho de que puedas salirte con la tuya con un tiempo de disposición ocasionalmente corto sugiere que hay un mecanismo biológico en juego (como: el olor de animales anteriores en el área de alojamiento ralentiza temporalmente el crecimiento de los nuevos animales, pero sólo si la disposición cambia con frecuencia ) --- esto sugeriría otro factor en tu ecuación: número de periodos de disposición a los que los animales han estado expuestos, y duración de los periodos de disposición previos, para el lote de animales en cuestión. Puede que tengas que diseccionar las condiciones para dar con variables candidatas que tengan poder predictivo.

Estoy pensando que usted podría modelar todo esto con una ecuación de regresión (s) donde la variable de salida predicha es la conversión alimenticia (que probablemente desea maximizar) y depende de los parámetros anteriores, con cada parámetro que tiene un peso. O donde la mortalidad (que se quiere minimizar) se predice de forma similar mediante variables ponderadas. O quizás una ecuación global que incluya tanto el rendimiento como la mortalidad en la "calidad" general del esquema de distribución.

También se podría hacer un modelo de regresión logística en el que la mortalidad (ocurrida o no ocurrida) fuera la variable dicotómica de interés, predicha por las variables anteriores. Alternativamente, un modelo de regresión lineal con mortalidad tarifa como su resultado de interés podría funcionar.

También es posible tomar prestado de varias ciencias biosociales y llegar a un "índice" o puntuación de las condiciones (tamaño del rebaño, periodos de disposición previos, etc.), y utilizar este índice como variable única de predicción para un modelo de regresión del rendimiento o para la tasa de mortalidad.

Dado que con estos modelos de regresión se extrapola y se predicen teóricamente los resultados de condiciones que aún no se han dado, hay que intentar conocer los mecanismos biológicos implicados. Por ejemplo, en la situación que he mencionado antes sobre el olor de animales anteriores en la zona de estabulación, quizá el olor sólo de hembras preñadas, o de machos fértiles, pueda influir en el siguiente lote de animales con más fuerza que el olor de cualquier animal. O puede que haya umbrales biológicos en juego, como un tamaño ideal de rebaño que algunos tipos de animales prefieren de forma natural y con el que son más productivos. (Son sólo ejemplos).

También estoy pensando que el uso de una hoja de cálculo podría ser la mejor manera de avanzar para que pueda ajustar las regresiones, introducir parámetros de interés y establecer límites en estos valores de entrada, y el gráfico de sus resultados. Podría ser más intuitivo trabajar con una hoja de cálculo al principio que codificarlo directamente en R.

Como ejemplo teórico, su ecuación de regresión final podría ser: conversión alimenticia (su variable predicha de interés) = tamaño del rebaño al cuadrado, menos la proporción hembra-macho, más 3 X número de "disposiciones" en los últimos seis meses, menos 2 X la duración del último periodo de "disposición" (en días). Naturalmente, llevará algún tiempo construir y ajustar una ecuación de regresión y validarla con datos. Y cambiar una variable (por ejemplo, el tamaño del rebaño) puede cambiar la fuerza del efecto de otras variables (por ejemplo, la proporción de sexos) en el resultado del rendimiento. Ahí es donde los gráficos creativos pueden resultar útiles: podría identificar más de un "punto óptimo" de condiciones ideales que maximicen el rendimiento. Mi consejo es que mida lo que pueda o utilice las mediciones pasadas que estén disponibles si es posible, por ejemplo los datos de cada lote de animales que hayan pasado por el ciclo durante el último año. Eso sería especialmente útil para la regresión logística. Con diversos programas estadísticos puede introducir básicamente las variables y hacer que el ordenador estime una ecuación de regresión para usted como punto de partida. También es posible que tenga que decir a sus jefes que tendría que ajustar experimentalmente las condiciones de los animales para determinar, por ejemplo, el tiempo mínimo de "disposición" que tiene algún efecto, o el tiempo máximo más allá del cual no se muestra ningún efecto negativo mayor. Así evitarás predicciones de rendimiento descabelladas a partir de valores de entrada inusualmente altos o bajos.

En la investigación biomédica utilizamos este tipo de modelos predictivos. Normalmente tomamos un conjunto de datos establecido, construimos un modelo a partir de la mitad de ellos y utilizamos el modelo como punto de partida para predecir resultados en la otra mitad. Con una mayor verificación, el modelo puede utilizarse también para predecir resultados en otras poblaciones.

¡Espero haber ido por el camino correcto de razonamiento para su problema y espero que esto ayude!

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X