Tengo un conjunto de datos de observaciones repetidas y estoy tratando de determinar si alguna de las observaciones es un valor atípico. La investigación que he realizado sólo ha mostrado métodos que determinarían si un valor (máximo, mínimo o un valor cuestionado) es un valor atípico, o si tanto el valor más alto como el más bajo son atípicos. Lo que me gustaría poder mostrar es si múltiples valores en todo el conjunto de datos son valores atípicos, como sospecho, sin saber exactamente cuántos valores atípicos hay. Cualquier ayuda o dirección que pueda darme será muy apreciada.
Esto no funcionará por la razón explicada aquí
0 votos
Seguro. Usted se refiere al máximo y al mínimo. ¿Puedo deducir que su conjunto de datos es univariado?
0 votos
Sí, se trata de una serie de purezas de medicamentos reportadas por múltiples analistas. En esencia, 50 personas midieron la pureza de una muestra 10 veces cada una y la comunicaron. 3 o 4 valores parecen visualmente atípicos y esperaba utilizar una prueba estadística para demostrar que lo son
1 votos
Un gráfico de cajas y bigotes podría ser un buen punto de partida. r-bloggers.com/summarising-data-using-box-and-whisker-plots stat.ethz.ch/R-manual/R-devel/library/graphics/html/
0 votos
...o incluso el boplots ajustados La solución a este problema, explicada aquí en el contexto de otra pregunta, es también utilizable para tu problema.
0 votos
Normalmente, se considera que un punto de datos es un valor atípico cuando está fuera de [Q1 - 1,5*rango intercuartil, Q3 + 1,5*rango intercuartil].
0 votos
La primera pregunta que debes hacerte es: ¿por qué te interesan los valores atípicos? (Puede que los valores atípicos no tengan la importancia que usted cree). La segunda pregunta es: ¿qué modelo asume para la generación de los puntos? (A continuación, puede decidir cómo decidir qué son los "valores atípicos"). No hay una solución genérica.