5 votos

Con dos variables relacionadas, por ejemplo, la religión y la religiosidad, ¿cómo transformarlos en una variable de regresión?

Decir que tengo el nominal de variables de la religión (0=Ateo; 1=Cristiano; 2=Judío; 3=Musulmán; 4=Otros)

Y, a continuación, una escala variable de la religiosidad de 1-10

Si quiero solo una escala variable, por lo que puedo conectar el valor en modelos de regresión de algo DV que es en una escala de 1-10, o es binario, es la solución para crear una variable ficticia para la religión y, a continuación, calcular todas las nuevas variables de

'Ateo-ness' = Religion_Athiest*la Religiosidad

Cristiano-ness' = Religion_Christian*la Religiosidad

'Judío-ness' = Religion_Jewish*la Religiosidad

"Musulmana-ness' = Religion_Muslim*la Religiosidad

'OtherReligious-ness' = Religion_Other*la Religiosidad

?

Porque entonces mi modelo de regresión se verá así:

Constante + (factor* valor) + (factor* valor) + (factor* valor) + (Ateo-ness* valor) + (Cristiano-ness* valor) + (Judío-ness* valor) + (Musulmán-ness* valor) + (OtherReligious-ness* valor)

Todas estas religiones son variables discretas, por lo que no importa, porque cualquier nuevo individuo conectado se tiene 0 para todos los valores relacionados con la religión, distinta a la que se aplican?

Mi primera pregunta es: ¿hay una más correcta y eficiente manera de hacer esto? Estoy utilizando el programa estadístico SPSS. Esto parece la manera intuitiva de hacerlo, pero no estoy seguro de si hay otra manera de que me estoy perdiendo.

Mi segunda pregunta es: ¿alguien que me explique en términos sencillos lo que he hecho y lo que es más importante ¿por qué lo he hecho?

4voto

Mark White Puntos 569

En primer lugar, si usted podría agregar un par de cosas en una edición a tu pregunta, creo que podría ayudar a más:

  • ¿Cuál es el objetivo de su análisis?
  • ¿Qué está tratando de predecir, a partir de este modelo?
  • ¿Cómo fue la "religiosidad" mide?

Voy a suponer que "la religiosidad" significa lo dedicado que están a cualquiera que sea su creencia religiosa es: un 5 significa que son moderadamente comprometido, un 10 significa que están muy comprometidos, etc.

Ya que alguien puede seleccionar solo una religión, lo ficticio de la codificación de la afiliación religiosa y, a continuación, multiplicando cada uno por la religiosidad que hace es hacer que todo el mundo tenga una puntuación de cero para todo y, a continuación, una puntuación que es igual a su religiosidad puntuación independientemente de la religión que suscribirse (desde su puntuación para que el maniquí-codificado de la variable es 1).

Así que, si yo era un ateo que seleccionaron 8 sobre la "religiosidad" (aquí supongo que es el grado de compromiso que uno es su religión), mi maniquí-codificado variable para el ateísmo sería "1", por lo que las puntuaciones para mí resultante de la multiplicación sería:

  • Athiestness: 8
  • Christianness:0
  • Judaísmo: 0
  • Muslimness: 0
  • Alteridad: 0

En sus el propios, estos resultados podrían no ser útiles. Así, en el modelo que se especifica con sólo estos multiplicativo términos de la presente, me gustaría tener un tiempo difícil encontrar ese modelo útil o muy interpretable.

Sin embargo, si se incluyen las maquetas de los códigos, el de la religiosidad de la puntuación, y todos los efectos multiplicativos juntos en un modelo, usted tiene una interacción que se está probando. Lo que este modelo podría hacer es ayudar a responder a la pregunta: "¿ la religiosidad se refieren a mi DV para los diferentes grupos religiosos?"

Por ejemplo, digamos que usted tenía la hipótesis de que la religiosidad está relacionado con capitalistas creencias, pero sólo para los Cristianos. Usted puede hacer de esta hipótesis debido a la investigación en ética de trabajo Protestante, por ejemplo.

Un modelo que se parece a:

capitalistic_beliefs ~ all_religion_dummies + religiosity + all_religion_dummies * religiosity

Podría contestar a esa pregunta. (Donde all_religion_dummies se refiere a todos los de la 0-o-1 variables si son Ateos, Cristianos, Judíos, etc.)

Si usted fuera a conseguir una interacción significativa, que podría sonda con simples pistas de análisis para ver si la pendiente de la religiosidad es significativa sólo para los Cristianos.

De nuevo, es difícil saber si lo que están haciendo tiene sentido o es útil para su objetivo de investigación sin conocer la variable dependiente. Yo estaría encantado de echar un vistazo a la pregunta de nuevo si quieres editar con más detalle o si necesita saber nada más.


Para demostrar, yo los datos simulados donde hay una relación entre la religiosidad y capitalistas creencias de los Cristianos, pero no para otras religiones. He simulado estos datos en R usando el siguiente código, y luego corrió un modelo y la prueba de la interacción:

set.seed(1839) # set seed for replicability
n <- 5000 # set number of participants
religiosity <- rnorm(n) # generate religiosity as normally distributed variable
# make it so that capitalistic beliefs (cb) is only related to religiosity
# for christians
cb_other <- rnorm(1000) # just predicted by error
cb_muslim <- rnorm(1000) # just predicted by error
cb_jewish <- rnorm(1000) # just predicted by error
cb_christian <- religiosity[3001:4000] + rnorm(1000) # by religiosity and error
cb_atheist <- rnorm(1000) # just predicted by error
# make into data set
dat <- data.frame(
  religiosity = religiosity,
  capitalistic_beliefs = c(
    cb_other, cb_muslim, cb_jewish, cb_christian, cb_atheist
  ),
  religious_affiliation = factor(c(
    rep("other", 1000), rep("muslim", 1000), rep("jewish", 1000), 
    rep("christian", 1000), rep("atheist", 1000)
  ))
)

# run regression with interactions you speak of-the interaction terms are where
# religiosity is multipled by their affiliation
# I do not specify dummy-codes explicitly, because R does it on its own
# without me having to do it! one of the reasons I would suggest using R
# instead of SPSS!
# compare model without interactions (just plus sign) to those with interactions
# (including multiplication)
model_without_ints <- lm(capitalistic_beliefs ~ religiosity + religious_affiliation, dat)
model_with_ints <- lm(capitalistic_beliefs ~ religiosity + religious_affiliation +
                        religiosity * religious_affiliation, dat)
anova(model_without_ints, model_with_ints) # interaction is significant!

Que la última llamada que nos da este resultado, mostrando la interacción fue significativa:

Model 1: capitalistic_beliefs ~ religiosity + religious_affiliation
Model 2: capitalistic_beliefs ~ religiosity + religious_affiliation + 
    religiosity * religious_affiliation
  Res.Df    RSS Df Sum of Sq      F    Pr(>F)    
1   4994 5711.1                                  
2   4990 4949.2  4    761.93 192.05 < 2.2e-16 ***
---
Signif. codes:  0 ‘***' 0.001 ‘**' 0.01 ‘*' 0.05 ‘.' 0.1 ‘ ' 1

Entonces podemos gráfico!

library(ggplot2)
ggplot(dat, aes(x = religiosity, y = capitalistic_beliefs, color = religious_affiliation)) +
  geom_smooth(method = "lm", se = FALSE)

Que se parece a:

enter image description here

En resumen: Los puntajes de maniquí-códigos multiplicado por la religiosidad no sirven de mucho por sí solo. Pero cuando se las incluye como términos de interacción en un contexto de regresión, pueden probar la interesante hipótesis de moderación.

Nota: sé que el R código de arriba es un poco ineficiente, pero yo quería hacer lo que uno podría seguir adelante si sólo estaban familiarizados con el programa SPSS, por el OP menciona en su post.

-3voto

Jay Querido Puntos 589

No se puede transformar juntos. Hay una ilusión de que son similares porque ambos implican la religión. Son muy diferentes. Considere el siguiente conjunto de variables categóricas, $\{cow, apple, house\}.$ denominaremos a ellos $\{1,2,3\}$. Básicamente, si existe una relación, que está oculto, a pesar de que uno podría existir. Pueden estar todos en la misma parcela de tierra. Ahora considere una escala variable, su masa. Supongamos que disponemos de varios pesos de las vacas, las manzanas, y las casas y nos clasificar cada uno de 1,2,3$\dots$10. Supongamos ahora que recoger una vaca de rango 3 masa y una casa de rango 1 masa. $1\times{3}=3\times{1}$ pero realmente no se puede decir lo que los tres medios. Estas son dimensiones separadas.

Aunque es cierto que a veces se puede multiplicar las variables ficticias, este no es uno de esos casos. La multiplicación implica que hay una interacción entre las dimensiones.

También hay graves problemas con sus categorías. Ellos tienen que ser mutuamente excluyentes. Las categorías no son. El budismo no tiene un dios, aunque los Budistas, opcionalmente, puede tener dioses. Para un Budista puede ser ateo o de otra. Algunos religiosa grupos, tales como el Mormón no se consideran Cristianos de otros grupos religiosos. Si este es el auto-informe, a continuación, usted puede obtener un error en la clasificación. Los mormones y los miembros de la iglesia Ortodoxa Oriental de la Iglesia no acepta el concilio de Nicea la declaración de fe, que a la mayoría de los grupos Cristianos que implica que no puede ser Cristiano. Por último, se puede ser Judío y Cristiano al mismo tiempo o la Judía y la Musulmana o la Judía y la de los ateos y Judíos y otros.

Las variables categóricas deben ser mutuamente excluyentes. Las personas que usan la religión en la investigación suelen ir alrededor de la categoría de etiquetas si existe algún riesgo de error en la clasificación, a menos que la auto-clasificación de interés en sí mismo. Por ejemplo, el de Barack Obama se auto-clasifica como el negro, pero no fue un problema importante en el inicio de su campaña como si los demás lo consideran negro o blanco. Si usted está estudiando en la clasificación, entonces las etiquetas importa, pero si la corrección de la etiqueta de los asuntos, a continuación, las preguntas que se llega a la etiqueta.

Para dar un ejemplo, los Ortodoxos no aceptan el "filioque" en el Credo de Nicea. Si estás tratando de identificar a los Cristianos que no podía preguntar si aceptan el credo como la Ortodoxa leer sin el filioque mientras que los Católicos y los Protestantes leer con el filioque. Simplemente preguntando si usted cree que el credo de Nicea iba a tanto alzado de los Ortodoxos con los Protestantes y los Católicos, que los Ortodoxos dirán que es un error y como estrictamente partidista Ortodoxa iba a decir que no son Cristianos y herejes y Ortodoxos son los Cristianos.

Usted tiene que averiguar lo que su real de la variable dependiente es la figura y cuál es su pregunta de investigación es y sus variables disponibles. Después de eso, usted puede trabajar fuera de su forma y recoger sus datos.

También hay una redacción problema. La religiosidad no se aplica a los ateos como los ateos no creen en la divina, por definición. Ellos no son un grupo. Para usar una frase célebre, los ateos son una religión como la no-filatelia es un hobby. Sería mejor que fuera incluyendo a los ateos como "otros", a menos que la religiosidad es importante para usted. Si lo hace, entonces los ateos será una variable de confusión y necesita una manera de separarlos. Usted puede buscar el conjunto de comportamientos que, en paralelo a la religiosidad como la pasión por las cosas de la gente cree.

Si usted tiene dos dimensiones, a continuación, usted está atascado con dos dimensiones.

EDITAR

Así que vamos a asumir que usted puede construir mutuamente excluyentes grupos. Entonces usted necesita ser muy cuidadoso en lo que su religiosidad y su religiosidad veces grupo ficticio significaría.

Si usted está asumiendo que hay un grupo de comportamientos que se llama religiosidad que es común a todos los seres humanos, entonces usted va a tener que ser muy cuidadoso mediante la adición de un término de interacción.

Considerar diferentes variables, como la velocidad de marcha. Un grupo religioso no debería afectar la velocidad de la caminata, a menos que uno de los "otros" grupos que sucede a participar en un comportamiento que se sabe que el impacto de la velocidad al caminar. Imaginar una religión construida alrededor de los eventos de pista y campo, entonces usted puede ver, podría ser el caso.

La religiosidad va a ser muy difícil de medir, debido a que si se incluyen a grupos como el de los ateos, entonces, si una de tus preguntas de escala es "ora cada día," entonces usted va a obtener ceros en esa pregunta.

Que es válido efecto de la interacción y la multiplicación significa algo. Pero esto plantea la pregunta de: "¿no sabéis que antes de que usted hizo la pregunta de investigación?"

La multiplicación de los componentes implica que hay una relación única entre el grupo y la religiosidad que no es común a otros seres humanos. Hay una razón por la puedo encontrar esta relación.

La prueba F, se comprueba si todas las pendientes son iguales a cero. Normalmente esto no es un problema. Ahora imaginemos a una de sus variables, es la velocidad de la caída de una bola de bolos. Sabemos que debido a la gravedad que el objeto tiene una velocidad positiva. Que una pendiente no tiene un cero, por lo que la prueba F se mostrará automáticamente como "significativo".

Mediante la inclusión de los ateos en una religiosidad pregunta, usted puede obtener un caso donde no importa lo que usted pida, todas las pruebas de F se muestran como "significativo".

Es un psicométricamente pregunta difícil, porque puede ser que hay ateos que sería una puntuación alta en la religiosidad si la religiosidad lugar de eso, fueron una medida de la pasión o de la devoción a algo que creemos en el o la cantidad de tiempo que pasé trabajando en él.

Me gustaría ver a algunos de escala, tales como el Ambiente de Trabajo de la Escala que es un increíblemente cuidado instrumento para medir el ambiente de trabajo. Usted también va a tener que ser muy cuidadoso con el uso del lenguaje. Recuerdo a una mujer joven que se convirtió de ser un Bautista para ser Católico. Su única razón para la conversión, y me hizo llegar a conocerla bastante bien, fue que los Católicos miró la cruz cuando oraron los Bautistas y miró hacia abajo. Ella se sentía uno podría estar en lo correcto, mientras que el otro mal. Esto la llevó a investigar y ella eligió el Catolicismo.

Esta diferencia muy pequeña alteración de su vida y sus definiciones del bien y del mal. Usted tiene que ser super cuidadoso con el lenguaje y la religión. Cosas muy pequeñas, puede tener profundos o profundos significados para algunos que no se desea.

Si uno es realista en lugar de teórica con respecto a un psicométricas del instrumento, un efecto de interacción es probable que realmente implica que los miembros de un grupo son la comprensión de la formulación de sus preguntas de manera diferente de las otras personas en otros grupos, en lugar de que hay un verdadero conductual, emocional o cognitivo profundo diferencia.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X