7 votos

Pruebas de tendencias en modelos de probabilidades proporcionales parciales

Estoy tratando de construir un modelo para explicar una variable de respuesta ordinal $y$ con 4 niveles: $y_0$ , $y_1$ , $y_2$ y $y_3$ . La variable independiente en este modelo es $v$ . $v$ es una variable categórica con tres categorías $v_a$ , $v_b$ y $v_c$ . La hipótesis de las probabilidades proporcionales falla para $v$ . Por lo tanto, estoy utilizando el modelo de probabilidades proporcionales parciales (PPO). El modelo me da 3 OR para $y_1$ , $y_2$ y $y_3$ que corresponden a las probabilidades de los eventos $\{y>=y_1\}$ , $\{y>=y_2\}$ y $\{y>=y_3\}$ .

Me gustaría realizar una prueba de tendencia para cada uno de estos 3 eventos de forma que cada prueba dé un valor p. Por ejemplo, la prueba de tendencia para $y_1$ explicaría si existe una tendencia entre el cambio en el nivel de v y en las probabilidades de $\{y>=y_1\}$ .

¿Hay alguna manera de utilizar el modelo parcial de PO directamente para calcular una prueba de tendencia para los 3 eventos?

Esta es una solución en la que estoy pensando:

  1. Primero convierto la variable categórica v en una variable continua con los valores 1,2 y 3 y construyo un modelo PPO utilizando esta variable continua - llamemos a este modelo PPOC.
  2. Para cada nivel de resultados $i$ Dividí las muestras de los datos en 2 conjuntos: $\{y>=y_i\}$ y $\{y < y_i\}$ y calcular la probabilidad de esta división utilizando modelos PPO con a) sólo un término de intercepción, y b) tanto la intercepción como la exposición (es decir, PPOC). La diferencia en las probabilidades de a) y b) me da una prueba para este nivel.

¿Es este el enfoque correcto? ¿Será esta prueba equivalente a una prueba de tendencia?

¿Hay algún otro enfoque que pueda adoptar para determinar si existe una tendencia entre $v$ y $y$ para cada uno de los 3 niveles de $y$ ?

PD: He publicado esta pregunta en el foro de MedStats la semana pasada. Sin embargo, no ha habido respuestas hasta ahora. Espero que alguien pueda opinar sobre este problema aquí.

1voto

Sean Hanley Puntos 2428

Por desgracia, no conozco el modelo de probabilidades proporcionales parciales. Sé que Agresti -discutiendo otras situaciones (por ejemplo, PO)- ha sugerido que la gente siga adelante e invente valores para sus categorías y los ejecute como si fueran continuos. Me parece un poco incómodo, pero su argumento es que, a menos que estés muy equivocado, el sesgo inducido será pequeño. (N.B., habrá sesgo inducido, en función de la naturaleza y la magnitud de la tergiversación, pero es probable que sea pequeño). Espero que esto ayude.

0 votos

Gracias. ¿Cree usted que hay una manera de estimar la cantidad de sesgo que podría haber? es decir, una manera de saber cuánto se aleja de la estructura categórica, la conversión continua (1, 2, 3)?

1 votos

No estoy seguro de que este sea un buen enfoque, pero incluso si decide fingir que la variable está correctamente codificada para un análisis de escala de intervalo numérico, la falta de ajuste en el modelo revelada por la no-PO puede seguir estando presente en el modelo continuo de otra forma.

1 votos

@FrankHarrell, yo tampoco estoy seguro. Sólo ofrecí esta sugerencia b / c nadie había respondido, y el OP me pidió que. Si usted sabe de un enfoque productivo en esta situación, estoy seguro de que el OP apreciaría.

1voto

alexs77 Puntos 36

Creo que es una forma razonable de evaluar la tendencia. La clave se reduce a la interpretación del coeficiente o efecto que estima el modelo. Lo que se estima es, en efecto, un cociente de probabilidades para respaldar una unidad mayor $Y$ respuesta comparando grupos que difieren en 1 unidad en $V$ .

El modelo de probabilidades proporcionales suele requerir que el analista inspeccione el supuesto de probabilidades proporcionales mediante una prueba de significación o mediante una inspección gráfica. Yo prefiero esta última opción. Para inspeccionar las probabilidades proporcionales gráficamente, uno puede ajustar directamente los modelos logísticos para cada una de las respuestas acumulativas y asegurarse de que los IC del 95% para la OR se superponen con la OR "general" estimada en el modelo de probabilidades proporcionales. Si el solapamiento es consistente, podemos estar seguros de que cualquier posible hallazgo en el modelo de probabilidades proporcionales no está necesariamente impulsado por un nivel particular de respuestas Y acumulativas.

Una alternativa a esto, por supuesto, es simplemente ajustar el modelo de regresión lineal con ordinal $Y$ respuesta y ordinal $V$ respuesta. Esto puede inspeccionarse visualmente con un gráfico de dispersión para evaluar los mismos supuestos, y la línea de tendencia puede compararse con un spline de suavizado cúbico más flexible. Para asegurar una inferencia consistente debido a una posible relación media-varianza, la inferencia en la línea de tendencia puede hacerse robusta usando errores estándar basados en el sándwich. La similitud entre los modelos de probabilidades proporcionales y la regresión lineal con un resultado ordinal se ha discutido en La importancia de los supuestos de normalidad en los grandes conjuntos de datos de salud pública por Lumley, Dier, Emerson y Chen.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X