Me gustaría averiguar qué distribución se ajusta mejor a mis datos.
Aquí está el histograma de mis datos :
Utilicé el fitdistrplus
en R para tratar de encontrar el mejor ajuste para mis datos. Para tener una idea de qué distribución familiar ajustar, hice lo siguiente:
library(fitdistrplus)
descdist(my_data, discrete=FALSE, boot=500)
Obtengo este gráfico de asimetría y curtosis:
Con estas estadísticas resumidas :
min: 23 max: 1989
mediana: 184
medio: 228.8346
sd estimado: 165,6273
asimetría estimada: 1,706379
curtosis estimada: 11,31023
Así que aparentemente ninguna distribución es una buena candidata para los datos. ¿Cómo interpretar este gráfico? ¿Significa esto que mis datos son una mezcla de varias distribuciones?
EDITAR :
Esta distribución representa las longitudes de los fragmentos de ADN obtenidos en un experimento. Mi objetivo es poder simular el resultado de este experimento simulando los fragmentos resultantes. (es decir, un fragmento simulado está definido por dos posiciones en el genoma separadas por una distancia D). Asumo que la longitud del fragmento observada en el experimento real puede ser descrita por una función de función de densidad o una mezcla de densidades. Estoy buscando la mejor función función a partir de la cual pueda muestrear los valores de D para mis simulaciones.
Hay que tener en cuenta que sólo estoy utilizando una submuestra para ajustar una distribución. Generamos millones de fragmentos. Yo trabajo con una submuestra de 500.000 fragmentos.
2 votos
¿Podría explicar por qué quiere encontrar cualquier ¿fórmula matemática para su distribución de datos? ¿Qué conseguiría con ello?
0 votos
Si sólo busca distribuciones estadísticas candidatas a considerar, tengo un ajustador de distribuciones estadísticas en línea en zunzun.com/Distribuciones estadísticas/1 que podría sugerir algo útil. Pegue los datos en bruto en el "Editor de datos de texto" y pulse el botón "Enviar" para ver lo que encuentra.
0 votos
Una cola como esa hará subir la curtosis poderosamente.
0 votos
@whuber He editado mi pregunta añadiendo mi objetivo.
0 votos
Las longitudes de los fragmentos son discretas, ¿verdad?
0 votos
Sí, las longitudes de los fragmentos son discretas.