9 votos

¿Técnicas para determinar cuán "aleatoria" es una muestra?

¿Qué técnicas existen para determinar la "aleatoriedad" de una muestra?

Por ejemplo, digamos que tengo datos de una serie de $1200$ tiradas de dados de seis caras. Si los resultados eran

1, 2, 3, 4, 5, 6, 1, 2, 3, 4, 5, 6, ...

O:

1, 1, 1, ..., 2, 2, 2, ..., 3, 3, 3, ...

La confianza de la aleatoriedad sería bastante baja.

¿Existe una fórmula en la que pueda introducir la secuencia de resultados y obtener un número que corresponda a la probabilidad de aleatoriedad?

Gracias

ACTUALIZACIÓN: La respuesta de awkward fue la más útil. Buscando en Google, encontré estos dos recursos útiles:

  • Análisis estadístico de Random.org - un resumen de los análisis estadísticos utilizados para evaluar los números aleatorios generados por el sitio web, www.random.org

  • Software de generación de números aleatorios - un proyecto financiado por el NIST que ofrece un debate sobre las pruebas que pueden utilizarse contra los generadores de números aleatorios, así como un paquete de software gratuito para ejecutar dichas pruebas.

2voto

awkward Puntos 1740

Los informáticos han desarrollado una gran variedad de pruebas para comprobar los generadores de números pseudoaleatorios. Estas pruebas pueden adaptarse a otras fuentes de números aleatorios, como el lanzamiento de dados. Una fuente de información es la sección 3.3, "Pruebas estadísticas", de El arte de la programación informática, volumen 2 (Algoritmos seminuméricos) por Donald Knuth. Es un tema demasiado extenso para ser resumido de forma concisa, pero las pruebas discutidas por Knuth incluyen

(1) Prueba de equidistribución (prueba de frecuencia): los números están distribuidos uniformemente.

(2) Prueba en serie: los pares de números sucesivos deben estar uniformemente distribuidos de forma independiente.

(3) Prueba de los huecos: los huecos entre las ocurrencias de un número determinado deben seguir una distribución adecuada.

(4) Prueba de póquer (prueba de partición): si se utilizan los números aleatorios para generar manos de póquer, deben seguir la distribución conocida de las manos de póquer.

(5) Prueba de permutación: la secuencia de entrada se divide en grupos de longitud fija $t$ Cada ordenamiento de los elementos debe aparecer con probabilidad $1/t!$ .

(6) Prueba de funcionamiento: las longitudes de las secuencias crecientes o decrecientes deben seguir una distribución adecuada.

Y varios otros ...

Muchas de estas pruebas incluyen pruebas de Chi-cuadrado o de Kolomogorov-Smirnov para sus cálculos.

Estoy seguro de que también puedes encontrar muchos recursos en línea; sólo tienes que buscar "testing random number generators".

1voto

vpram86 Puntos 1408

Depende de lo que entiendas por "aleatoriedad". Puedes medir la desviación estándar de los valores colocados delante y determinar cuántas desviaciones estándar tiene un valor con respecto a la normal. Si un valor se encuentra demasiado lejos de la norma, podrías etiquetarlo como un valor atípico. Esto sería lo más adecuado para encontrar valores que "no pertenecen".

Como alternativa, se puede crear una proyección de puntos anteriores y medir la distancia del valor actual con respecto a esta proyección. Esto funcionaría mejor para valores crecientes o decrecientes.

Por lo demás, depende realmente de lo que se entienda por "aleatoriedad". Un profesor de matemáticas al principio del semestre de una de mis clases pidió una vez a todos sus alumnos que hicieran una de estas dos cosas: A) Lanzar una moneda 100 veces y registrar los resultados o B) Inventar resultados aleatorios 100 veces. Lo importante es que hiciéramos exactamente una u otra cosa y no mezcláramos la metodología.

El profesor era capaz de adivinar con un 100% de precisión los que lanzaban una moneda y los que se inventaban resultados aleatorios, y se basaba puramente en el principio de que si lanzar una moneda 100 veces fuera realmente aleatorio, entonces sería extremadamente improbable que saliera cara o cruz 7 veces seguidas. La mayoría de los seres humanos pensamos que 7 caras o colas consecutivas no son lo suficientemente aleatorias, y por ello tendemos a "hacerlas más aleatorias" aunque estemos haciendo lo contrario.

Lo que quiero decir con esta historia es que la aleatoriedad no es una métrica que pueda medirse fácilmente. Puede ser que 1,1,1,2,2,2,3,3,3 sea totalmente aleatorio y tenga tantas posibilidades de ocurrir como cualquier otra serie de tiradas de dados para la misma cantidad de tiradas.

1voto

Mahdi Khosravi Puntos 2483

Depende de su deducción de la aleatoriedad. Si por aleatoriedad te refieres a ser similar al ruido, puedes comparar sus estadísticas con las de un ruido gaussiano. Si tienes la f.d.p. de una variable aleatoria de referencia y quieres ver si esta secuencia es la realización de esa variable aleatoria, puedes comparar los estadísticos de esta secuencia con los de la variable aleatoria que estás considerando. Los estadísticos más utilizados son el histograma, los estadísticos de orden superior como la curtosis, la asimetría, ... .

0voto

Sony R K Puntos 11

Yo diría que los dos ejemplos que has puesto serían tan aleatorios como cualquier otro conjunto de puntos de datos. Tal vez podría intentar buscar una secuencia repetida en lugar de un nivel de "aleatoriedad".

0voto

re5et Puntos 406

Lo que yo haría es tomar primero las muestras de una en una, y comprobar si es uniforme (Se asigna algún valor dependiendo de lo lejos que esté la distribución de ser uniforme y la forma de calcular este valor depende de la aplicación). A continuación, tomaría las muestras de dos en dos y haría lo mismo de arriba, y luego de tres en tres y así sucesivamente. Con la ponderación adecuada, tu segunda secuencia será, por ejemplo, marcada como "no aleatoria" con esta técnica. Esto es también lo que hace el profesor de Neil (en una de las respuestas a esta pregunta) para ver si la secuencia de sus alumnos es realmente aleatoria o generada por humanos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X