3 votos

¿Debo tratar el grupo de vegetación como una variable ordinal o nominal?

Como continuación de esto: Correlación entre la vegetación y la erosión Tengo problemas con el tipo de datos que tengo. Estoy confundido en cuanto a si mis cuatro categorías están ordenadas.

En concreto, mis cuatro grupos dentro de mi variable categórica son:

  • pérdida de vegetación,
  • No hay cambios en las zonas sin vegetación,
  • ningún cambio en las zonas con vegetación y
  • ganancia de vegetación.

Aunque están en orden de cantidad creciente de vegetación, no estoy seguro de si se considerarían nominales u ordinales.

2voto

user2735206 Puntos 51

En efecto, si se visita dos veces el mismo espacio muestreado, se observa la magnitud de la vegetación y se asigna un + si hubo un aumento, un 0 si no cambió nada y un - si hay una pérdida, los signos correspondientes para sus categorías serán entonces:

  • pérdida de vegetación (-)
  • sin cambios zonas sin vegetación (0)
  • ningún cambio en las zonas con vegetación (0)
  • aumento de la vegetación (+)

Como los dos ceros del medio no se pueden clasificar, no es estrictamente una variable ordinal. Por lo tanto, su plan de Kruskal Wallis parece ser legítimo.

Algunos comentarios al margen, la pregunta indica que hay un "orden de una cantidad creciente de vegetación" subyacente. Me resultó difícil de creer porque en la segunda opción no hay vegetación en absoluto, mientras que en la primera sólo se produjo una "pérdida" que puede ser total o, más probablemente, parcial. Yo recomendaría que, cuando se informe del análisis, se deje muy claro cuál es el constructo subyacente, si la magnitud del cambio de la vegetación o la vegetación.

Teniendo en cuenta los detalles de su escenario original en Correlación entre la vegetación y la erosión En el caso de los terrenos con vegetación, probablemente no tenga mucho sentido fusionar las opciones 2 y 3, ya que es probable que los terrenos con vegetación y los que no tienen vegetación tengan riesgos y perfiles de erosión muy diferentes. Esto probablemente significa que tendría que refinar su pregunta de investigación. Por ejemplo, ¿es "la erosión asociada al cambio de vegetación" o "la erosión asociada al cambio de vegetación, ajustada al nivel de vegetación de partida"? Creo que con la pregunta de investigación real podremos darte mejores consejos.


Sí, para mi estudio, las diferencias entre la categoría 2 y 3 son importantes. Sin embargo, discúlpeme, no estoy muy seguro de lo que quiere decir con "nivel de vegetación de referencia".

Hay muchas maneras de investigar esta cuestión. Por ejemplo, puedes centrarte sólo en la "erosión asociada al cambio de vegetación", en la que compararías las medias ( $\mu$ ) de la erosión del suelo en estas categorías:

  1. $\mu _{erosion}$ cuando la vegetación aumentó.
  2. $\mu _{erosion}$ cuando la vegetación se mantuvo sin cambios.
  3. $\mu _{erosion}$ cuando la vegetación disminuyó.

Otra forma de plantear esta pregunta es "la erosión asociada al cambio de vegetación, ajustada al nivel de vegetación de partida", que es más bien la comparación de las medias en estas categorías:

  1. $\mu _{erosion}$ cuando la vegetación aumentó y la tierra tenía vegetación para empezar.
  2. $\mu _{erosion}$ cuando la vegetación permaneció inalterada y la tierra tenía vegetación desde el principio.
  3. $\mu _{erosion}$ cuando la vegetación disminuyó y la tierra tenía vegetación para empezar.
  4. $\mu _{erosion}$ cuando la vegetación aumentó y la tierra fue no vegetado para empezar.
  5. $\mu _{erosion}$ cuando la vegetación se mantuvo sin cambios y la tierra fue no vegetado para empezar.

Categoría 6. " $\mu _{erosion}$ cuando la vegetación disminuyó y la tierra se no vegetar para empezar" es ilógico, así que podemos quitarlo. Ahora estamos observando la erosión correspondiente al cambio de vegetación, al tiempo que consideramos su estado de vegetación original. Esto es más o menos lo que quiero decir con "ajustado a la línea de base". Según tu esquema original, unirás las categorías 1 y 4 juntas, y las categorías 2 y 5 juntas, ignorando su riesgo de erosión de referencia.

En pocas palabras, creo que hay dos variables al acecho, y tu esquema intenta forzarlas en una sola. Creo que una regresión multivariable (posiblemente con interacción) puede ser una mejor opción.

1voto

RGA Puntos 113

Realmente depende de cómo quieras utilizar esas variables. Nunca puede tratar una variable nominal como ordinal, pero siempre puede tratar los datos ordinales como categóricos. El precio que tendrá que pagar por esto último es que dejará de utilizar la información presente en el ordenamiento. Que ese precio sea aceptable o demasiado elevado depende de la aplicación y de sus preferencias o estilo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X