No estoy en el campo de las estadísticas.
He visto la palabra "atado datos" al leer acerca de coeficientes de correlación de rango.
- ¿Qué es atado los datos?
- ¿Qué es un ejemplo de datos atados?
No estoy en el campo de las estadísticas.
He visto la palabra "atado datos" al leer acerca de coeficientes de correlación de rango.
"Atado de datos" surge en el contexto de la clasificación basada en el estadístico no paramétrico de las pruebas.
Pruebas no paramétricas: prueba de que no supone una determinada distribución de probabilidad, por ejemplo, no asume una curva en forma de campana.
clasificación basada en: una gran clase de pruebas no paramétricas de inicio mediante la conversión de los números (por ejemplo, "3 días", "5 días", y "4 días") en los rangos (por ejemplo, "duración más corta (3º)", "más larga duración (1º)", "la segunda más larga duración (2º)"). Un tradicional paramétrica del método de ensayo se aplica a estos rangos.
Atado de datos es un problema ya que los números que son idénticos ahora se deben convertir en rango. A veces, los rangos son asignados de manera aleatoria, a veces un rango de promedio se utiliza. Lo que es más importante, un protocolo para romper rangos vinculados necesita ser descrita por la reproducibilidad de los resultados.
Se trata simplemente de dos valores de datos idénticos, como observación 7 dos veces en el mismo conjunto de datos.
Esto surge en el contexto de métodos estadísticos que suponen datos tienen un continuo y tan idénticas mediciones son imposibles (o técnicamente, la probabilidad de valores idénticos es cero). Complicaciones prácticas ocurren cuando estos métodos se aplican a los datos que se redondean o para que las medidas idénticas son no sólo posibles sino muy común.
La pregunta es de fundamental importancia:
¿Qué es un atado de observación/datos/pareja ?
Aunque a menudo se menciona sólo en los métodos no paramétricos, esta noción es independiente de los métodos no paramétricos. Se menciona en los métodos no paramétricos debido a que esta situación hará que el cálculo de complicación en la obtención de las estadísticas que se utilizan en los métodos no paramétricos, como el de Wilcoxon Firmado Clasificadas estadísticas de $T^+$.
(Así que no creo que @Ming-Chi Kao respuesta es correcta mediante la introducción de pruebas no paramétricas en primer lugar. Pero dado que el título es " ¿Qué está atado de datos en el contexto de un rango coeficiente de correlación?', Lo voy a comprar.)
Para ilustrar, creo que la mejor manera es trabajar con el ejemplo más sencillo de Wilcoxon Firmado Clasificado de la Prueba: Supongamos que tenemos una muestra de pares de datos de tamaño de 10: Definir la diferencia de la variable aleatoria $Z_{i}=X_{i}-Y_{i}$
$(X_{i},Y_{i})$: (1,-1) (1,2) (1,2) (1,-1) (2,1) (2,1) (2,3) (2,3) (3,2) (3,0)
$Z_{i}$: 2 -1 -1 2 1 1 -1 -1 1 3
Tomar el valor absoluto de estos $Z_{i}$'s para tener un rango.
$|Z_{i}|$: 2 1 1 2 1 1 1 1 1 3
Ahora el problema surgir, con tantas idéntico 1 y 2, de cómo podemos hacer un ranking? Nosotros les damos el término "atado" para mostrar este caso. Y por el término de "atado grupo"(que es un equivalente de la relación), simplemente el grupo de los atados de las observaciones dentro de los grupos por sus valores. En este ejemplo, tenemos 3 atado grupos(Pensar por qué):$\{(1,-1) (1,-1)\},\{ (1,2) (1,2) (2,1) (2,1) (2,3) (2,3) (3,2) \},\{(3,0)\}$ de la Atención que el soporte no significa un conjunto, pero sólo una notación.
Vamos a tratar de la manera muy fácil de hacerlo, nos rango de izquierda a derecha y de dar:
$R_{i}$: 8 1 2 9 3 4 5 6 7 10
Pero aquí nuevamente debemos preguntarnos por qué el ranking de otro no es la adecuada ya que no hay ninguna diferencia entre los idénticos $|Z_{i}|$'s, como:
$R_{i}$: 8 7 6 9 5 4 3 2 1 10
Por lo tanto, podemos simplemente tomar la media de los idénticos $|Z_{i}|$'s y asignar de nuevo:
$R_{i}$: 8 7 6 9 5 4 3 2 1 10
La negrita representa el primer atado grupo se compone de los $|Z_{i}|=1$ observaciones; la cursiva representa el segundo atado grupo se compone de los $|Z_{i}|=2$ observaciones.
Asignamos a cada uno de la observación en el primer grupo el rango de$\frac{1+\cdots+7}{7}=4$;asignamos a cada una de las observaciones en el segundo grupo el rango de$\frac{8+9}{2}=8.5$. Por lo tanto tenemos:
$R_{i}$: 8.5 4 4 8.5 4 4 4 4 4 10
Esta modificación de la clasificación y hacer de cada uno de los atados de observación tiene la misma influencia en el cálculo del ranking de las estadísticas, por lo tanto en la prueba de rango.
¿Cuáles son las soluciones a atado de observación/datos/pareja ?
(1)Asignar el rango de promedio. Esto es justo lo que hizo anteriormente. Asignando el mismo valor para el atado de datos en el mismo grupo, hacemos de su influencia en el clasificado de la prueba de la misma y por lo tanto eliminar la posible inexactitud causada por observaciones vinculadas.
(2)Asignar al azar rango. Simplemente asignar rangos de forma aleatoria a cada uno de los atados elemento de grupo. La única restricción es que el $MaxRank_{first group}<MinRank_{second group}$ desde el si $MaxRank_{first group}>MinRank_{second group}$, que rompe con la clasificación de la ley; si $MaxRank_{first group}=MinRank_{second group}$, entonces tenemos que combinar dos atados grupos en uno solo.
(3)la Perturbación de los datos. Esto requiere un examen muy cuidadoso acerca de la naturaleza de los datos. Esto sólo funciona si los datos no categórica(discretos). En el ejemplo anterior, nos podemos hacer una Esto pone a los diferentes pesos de forma manual para cada uno de los elementos en el atado de grupo. Para una distribución continua, por ejemplo, hace poca diferencia si se perturba en $\epsilon$ manera.
(@John D. Cook 's respuesta es un poco engañoso de esta manera. Una mejor manera de decir que este punto es que, cuando la distribución es continua, $P{X=x}=0$. Sin embargo, se deberán observar los lazos desde nuestra medición es de una precisión limitada, es decir, cualquier espacio muestral en realidad es, en realidad finita.) (@quarkdown27 's respuesta es simple, pero correcto en cada palabra.)
I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.