7 votos

Utilizar CDF empírico vs CDF de distribución?

NOTA: a propósito no se etiqueta el eje debido a la pendiente de las publicaciones. La línea de colores representan los mismos datos en las tres parcelas.
Me adaptaba a mis datos a través de una distribución binomial negativa para generar un pdf. Estoy feliz con el pdf y cumple con mis necesidades de investigación. PDF de la trama:

alt text


Para cuando los informes de la CDF, se debe utilizar el empírica o equipado CDF? Hay ligeras diferencias entre lo empírico y equipada CDF, específicamente en x = 40, el amarillo y el cian las líneas se cruzan en la distribución empírica, pero no el amueblada.

Empírica:
alt text

Binomial negativa CDF: alt text

6voto

patfla Puntos 1

El CDF empírica debe ser tratado con la atención al final de los puntos de los datos, y en otros lugares donde hay "escasa" de datos. Esto es debido a que ellos tienden a hacer la débil estructurales suposiciones acerca de lo que sucede en el "entre" de cada punto de datos. También sería una buena idea tener "puntos" para el CDF empírica de la trama en lugar de líneas, o tener los puntos superpuestos sobre las líneas, de modo que es más fácil ver donde la mayoría de los datos que realmente es. Otra alternativa es poner los "puntos" de los datos a través de módulos de CDF de la trama, aunque hay demasiadas cosas que suceden en la trama.

Tal vez sea una de trazado de dificultad, pero el CDF empírica debe verse como una escalera o de función de paso (líneas horizontales con "saltos" en los valores observados). El empírica parcelas de arriba no se ven de esta manera, aparecen "suavizada". Tal vez es un "no-paramétrico" CDF el uso de algún tipo de trama más suave?

Si es un "no-paramétrico" CDF, a continuación, que son, básicamente, la comparación entre los modelos: la binomial negativa y los no paramétricos.

Mi consejo: tener una parcela independiente para cada uno de los datos (cada color en un nuevo gráfico) y, a continuación, poner el CDF empírica como "puntos" donde los datos se observa, y el amueblada binomial negativa CDF como una línea suave en la misma parcela. Esto sería similar a una regresión al estilo gráfico de dispersión con un ajustado línea. Un ejemplo de el tipo de trama con la que estoy hablando (que tiene R-código para crear es aquí Cómo presentar el aumento en la varianza explicada gracias a la correlación de y y X?)

5voto

Berek Bryan Puntos 349

Personalmente, yo preferiría mostrar el ajuste de lo teórico a la distribución empírica utilizando un conjunto de parcelas PP o parcelas QQ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X