4 votos

Estimación del error de un pequeño conjunto de datos de conteo

Estoy bastante seguro de que me tomará unos cuantos intentos para formular esta pregunta correctamente, pero espero que alguien con conocimientos relevantes lo entienda. También espero que esta pregunta tenga realmente una respuesta(s) para que se convierta en algo más que una discusión filosófica. También me disculpo si estoy repitiendo preguntas anteriores - aunque esto es sin duda un tema común, como un no-estadístico puede ser difícil saber si las soluciones son relevantes para su caso específico.

Así que sin más preámbulos a mi problema: He estado fotografiando (fotos fijas) burbujas mientras cambiaban las propiedades del líquido en el que residen. Resulta que el número de burbujas está fuertemente correlacionado con un parámetro en particular, digamos x. Para investigar esto más a fondo mantengo el parámetro firme y obtengo 1 fotografía por minuto durante 1 hora, por lo tanto n=60. Luego me refiero al número de burbujas y las grafo en función de x. Esto parece funcionar bien, una correlación lineal de la media del número de burbujas contra el parámetro x da como resultado un R2 de 0,98. Sin embargo, ahora mi problema es que la naturaleza aleatoria de la exposición de 1/60 segundos, 60 veces en 1 hora (básicamente 1/3600 del tiempo) significa que mi desviación estándar del número de burbujas es grande (~60%). Asumí que la naturaleza caótica de la captura de burbujas en mis imágenes significaría que si trazo un histograma del número de burbujas por imagen sería aproximadamente gaussiano (si es muy amplio); sin embargo parece estar ligeramente sesgado (no tengo ninguna explicación física para esto así que sospecho que es simplemente el pequeño tamaño del conjunto de datos).

Así que a mi pregunta exacta: ¿es un método de remuestreo como el bootstrapping adecuado aquí dado que mi distribución no parece físicamente plausible? ¿O debería simplemente tomar más fotos? ¿Qué clase de prueba debería hacer para estimar cuántas fotos son suficientes? He trazado tanto la media como la desviación estándar en función del número de fotografías y ambas parecen estabilizarse después de mucho menos de 60 fotos...

Muchas gracias por cualquier consejo

2voto

cbeleites Puntos 12461

Asumí que la naturaleza caótica de atrapar burbujas en mis imágenes significaría que si trazo un histograma del número de burbujas por imagen sería aproximadamente gaussiano

Tal vez, tal vez no. Mi primera conjetura habría sido Poisson (que puede ser aproximado como Gaussiano si hay "suficientes" burbujas).

Tren de pensamientos: uno de los famosos ejemplos para producir una distribución de Poisson es la medición de la desintegración radiactiva. Desde el punto de vista de la cinética química, es una cinética de primer orden. Así que si la producción de tus burbujas puede ser sensiblemente descrita o aproximada como (pseudo) de primer orden, la distribución de Poisson sería una suposición sensata.

Pensaría que la cinética de las burbujas es algo más complicada (hay siembra y crecimiento) pero eso puede ser un primer comienzo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X