Estoy familiarizado con el concepto de variables categóricas y la respectiva codificación de variables ficticias que nos permite ajustar un nivel como línea de base para evitar la colinealidad. También sé cómo interpretar las estimaciones de los parámetros de estos modelos: El cambio previsto en el resultado para un determinado nivel ajustado del predictor categórico, en relación con la categoría de referencia.
Lo que no tengo claro es cómo interpretar un conjunto de variables independientes que son proporciones que suman uno . De nuevo tenemos colinealidad si ajustamos todas las proporciones en el modelo, así que presumiblemente tendríamos que dejar una categoría fuera como línea de base. También supongo que tendría que mirar el tipo III SS para la prueba general de la significación de esta variable. Sin embargo, ¿cómo interpretamos las estimaciones de los parámetros para los niveles ajustados en el modelo frente a los que se consideran de referencia?
Un ejemplo : A nivel de código postal, la variable independiente es la proporción de rocas metamórficas, ígneas y sedimentarias. Como ya sabrá, estos son los tres tipos principales de rocas, y todas las rocas se clasifican en uno de ellos. Por lo tanto, las proporciones de las tres suman 1. El resultado es el nivel medio de radón en un código postal determinado.
Si tuviera que ajustar, digamos, el metamórfico y ígneo proporciones como predictores en el modelo, dejando sedimentario como referencia, un SS global de tipo III F -prueba de los dos niveles ajustados significaría si el tipo de roca, en su conjunto, es un predictor importante del resultado (nivel medio de radón). A continuación, podría examinar cada p -(basados en el t ) para determinar si uno o ambos tipos de roca eran significativamente diferentes de la línea de base.
Sin embargo, cuando se trata de las estimaciones de los parámetros, mi cerebro sigue queriendo interpretarlos puramente como el cambio predicho en el resultado entre grupos (tipos de roca), y no entiendo cómo incorporar el hecho de que se ajustan como proporciones.
Si el $\beta$ estimación para metamórfico fueran, digamos, 0,43, la interpretación no es simplemente que el nivel medio de radón previsto aumenta en 0,43 unidades cuando la roca es metamórfica frente a sedimentaria. Sin embargo, la interpretación tampoco es simplemente que haya algún tipo de aumento unitario (digamos 0,1) en la proporción del tipo de roca metamórfica, porque esto no refleja el hecho de que también es relativo a la línea de base ( sedimentario ), y, además, que cambiar la proporción de metamórfico cambia intrínsecamente la proporción del ajuste del otro nivel de roca en el modelo, ígneo .
¿Alguien tiene una fuente que proporcione la interpretación de dicho modelo, o podría proporcionar aquí un breve ejemplo en caso contrario?