Estoy leyendo sobre el Kolmogrov-Smirnov pruebas del libro Probabilidad y Estadística DeGroot y Schervish. En el primer par de líneas sobre este tema, los autores afirman lo siguiente:-
Suponga que las variables aleatorias X1,...,Xn forman una muestra aleatoria de algunos de distribución continua, y vamos a x1,...,xn denotar los valores observados de X1,...,Xn. Dado que las observaciones provienen de una distribución continua, hay probabilidad de 0 que dos de los valores observados x1,...,xn será igual. Por lo tanto, se asume por simplicidad que todos los n valores son diferentes.
Mi pregunta es - Para una muestra de una distribución continua, será la probabilidad de que dos muestras de los valores de la igualdad de ser exactamente cero o aproximadamente cero? Si es el antiguo, por favor puede darme una pista sobre cómo demostrarlo matemáticamente?
Intuitivamente, la probabilidad de ser aproximadamente cero tiene sentido sin embargo rara que puede ser, es posible tener dos valores iguales generado a partir de una distribución. He intentado comprobar este computacionalmente mediante la ejecución de una simple secuencia de comandos de R (por abajo) y después de la ejecución de un 100 veces, tengo la probabilidad de ser igual a cero en todos los casos. Puede estar ejecutando un par de millones de veces podrían producir mejores resultados, sino que sería cruel en mi Dell Core i3, memoria RAM de 2 gb portátil.
probOfCommonObs <- rep(0, 100)
noOfCommonObs <- rep(0, 100)
for(i in 1:100)
{
gaussianSample <- rnorm(1000, sample(1:50, 1), sample(1:50, 1))
for(j in 1:999)
{
for(k in (j+1):1000)
{
if(gaussianSample[j] == gaussianSample[k])
{
noOfCommonObs[i] <- noOfCommonObs[i] + 1
}
}
}
probOfCommonObs[i] <- noOfCommonObs[i]/1000
}
noOfCommonObs
probOfCommonObs
Supongo que una explicación teórica podría ayudar a aclarar mi duda y cualquier ayuda sería muy apreciada.
He guardado la publicación de las instrucciones en cuenta al escribir este post, pero quisiera pedir disculpas si he cometido algún error. Gracias!