Yo no soy un estadístico, pero yo a veces tengo que jugar con los datos. Tengo dos conjuntos de datos, listas de valores en la unidad de intervalo. He representado como histogramas, así que tengo una idea intuitiva de lo "lejos" que son. Pero quiero algo un poco más formal.
Mi primer pensamiento fue simplemente la suma de las diferencias de los valores en los contenedores, pero este no es satisfactoria. Entonces pensé en tomar una de tres bin promedio y la suma de las diferencias respecto de estos. (Disculpas si me estoy destrozando las estadísticas de la terminología)
Pero yo estaba pensando probablemente estoy reinventando la rueda, así que vine aquí. Preguntas similares, parece, a la "prueba de Kolmogorov Smirnov pruebas" o algo así.
Así que mi pregunta es esta: ¿es este el método adecuado para calcular la medida de estos conjuntos de datos son aparte? Y no hay una manera fácil de hacer esto en R? Idealmente ubicado KStest(data1,data2)
o algo así.
Editar destacar, estoy particularmente interesado en maneras para medir hasta qué punto los datos están separados directamente en lugar de ajuste de una distribución a cada uno y luego medir la distancia entre las distribuciones. [¿Que sentido? Supongo cálculos numéricos en R se hará mediante el muestreo de una distribución de todos modos...]