1 votos

Cómo entender el efecto de interacción

Investigo las diferencias en la presión fiscal de las empresas por tipos de empresas (3 categorías). Como podemos ver en la imagen categorie 3 tiene un efecto positivo significativo en la variable dependiente (la presión fiscal).

También utilicé algún efecto de interacción para investigar si algunos de ellos pueden mitigar el efecto positivo significativo (no sé con seguridad si puedo formularlo así).

Así que tomemos la interacción de categorie y WPAEX . Podemos observar que cuando categorie 3 tiene una mayor WPAEX Esto puede reducir la presión fiscal en un 8,4%. (Lo mismo ocurre con EQratio Sin embargo, sólo el 4,2%).

¿Puedo interpretar este resultado como que, por ejemplo, cuando categorie 3 tiene más WPAEX Esto compensa el efecto positivo y significativo de categorie 3 en la variable dependiente?

enter image description here

0voto

Vasiliy Borovyak Puntos 179

Sin duda, dirigiría una árbol de decisiones aquí. Así que, dependiendo de lo que estés usando, puede que tengas que poner una variable continua. Sólo tienes que ir con un algoritmo básico como CART y / o C4.5.

Le da una visión de lo que puede estar pasando, y también le da ideas para los términos interactivos que luego puede añadir a su modelo, y volver a ejecutar para poner esta interacción "en términos" de su regresión - por ejemplo, mediante la comparación de las estimaciones de los parámetros.

EDIT: Añadiendo un par de enlaces, y algunos comentarios generales sobre los árboles de decisión.

Aquí es un árbol de decisión en R. R es lo suficientemente bueno si sólo estás tratando de entenderlo por ti mismo, pero nunca he sido capaz de obtener visualizaciones de árboles de decisión de calidad de R.

Así que aquí es otro programa llamado RapidMiner, también de código abierto. Con este programa se obtienen mejores resultados visuales, aunque no son muy buenos, pero son mucho mejores que los de R.

El tiempo que se dedique a aprender a hacerlas en uno de los paquetes gratuitos merecerá la pena, si se dedica a este campo. No siempre son los predictores más potentes, pero pueden dar muchas ideas sobre lo que ocurre en un conjunto de datos. Por ejemplo, yo siempre hago uno primero para cualquier proyecto: no tienes que corregir los valores que faltan, ni limpiar los datos, ni siquiera eliminar los campos altamente correlacionados con tu objetivo. Ejecute un árbol y muchas cosas quedarán claras. Además, las personas no técnicas lo entenderán fácilmente.

Deberás familiarizarte con sus puntos débiles. Uno de los principales es que agrupan los valores categóricos de formas que pueden no tener sentido; por ejemplo, juntan los estados de CA y CT en un grupo si esto maximiza los criterios de división. Así que tendrá que asegurarse de que en estos casos dicha agrupación tiene sentido. En el ejemplo anterior, podría poner los estados en regiones y utilizar esto en lugar de estado.

Así que lo más importante es que tengas que aplicar algunos conocimientos de dominio y asegurarte de que el árbol tiene sentido.

HTH

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X