¿Cuál es la diferencia entre los tres términos de abajo?
- percentil
- Cuantilado
- cuartil
¿Cuál es la diferencia entre los tres términos de abajo?
Por si alguien más se ha confundido mirando esto: esto no está diciendo que un cuantil varía entre 0 y 1, y el percentil entre 0 y 100, está diciendo que estos son los dominios de las funciones cuantil(x) y percentil(x), que devuelven un valor observado, cuyo rango depende completamente de tu problema específico (por ejemplo, si estás midiendo la precipitación probablemente esté entre 0 y 10).
Comparando esta respuesta con una de Me gusta codificar a continuación, el cuantil en esta respuesta se refiere a un función cuantílica mientras que otro uso de cuantificar se refiere a la división del rango de probabilidades [0, 1] en trozos iguales. n-cuantil significa la división en n trozos
Si considera que el máximo es el 4º cuartil, le sugiero que empiece a contar considerando el mínimo como el 0º cuartil.
¿Los percentiles también se pueden escalar para que estén entre 0 y 1? Ej: ¿tiene sentido decir percentile(array, 0.5)
(la mediana)?
La parte "por ciento" de "percentil" viene de "cent" de 100. Si se escala entre 0 y 1, se tiene una proporción. Por supuesto, son equivalentes.
Para definir estos términos rigurosamente, es útil definir primero el función de cuantiles que también se conoce como el función de distribución acumulativa inversa . Recuerde que para una variable aleatoria $X$ , el función de distribución acumulativa $F_X$ se define por la ecuación $$ F_X(x) := \Pr(X \le x). $$ La función del cuantil está definida por la ecuación $$ Q(p)\,=\,\inf\left\{ x\in \mathbb{R} : p \le F(x) \right\}. $$
Ahora que hemos sacado estas definiciones del camino, podemos definir los términos:
percentil una medida utilizada en las estadísticas que indican el valor por debajo del cual un determinado porcentaje de observaciones en un grupo de observaciones caen.
Ejemplo: el 20º percentil de $X$ es el valor $Q_X(0.20)$
Cuantilado : valores tomados a intervalos regulares de la función del cuantil de una variable aleatoria. Por ejemplo, para algunos números enteros $k \geq 2$ , el $k$ -cuartiles se definen como los valores es decir. $Q_X(j/k)$ para $j = 1, 2, \ldots, k - 1$ .
Ejemplo: los 5-cuantiles de $X$ son los valores $Q_X(0.2), Q_X(0.4), Q_X(0.6), Q_X(0.8)$
cuartil un caso especial de cuantiles, en particular los 4 quantiles. Los cuartiles de $X$ son los valores $Q_X(0.25), Q_X(0.5), Q_X(0.75)$
Puede ser útil para usted elaborar un ejemplo de lo que significan estas definiciones cuando se dice $X \sim U[0,100]$ , es decir. $X$ está uniformemente distribuida de 0 a 100.
Referencias de Wikipedia:
Útil, pero una muy ligera torpeza en el medio. No hay ninguna implicación en la definición de que cualquier conjunto discreto de cuantiles en el que te centres deba ser seleccionado como regularmente espaciado en probabilidad. Por ejemplo, mirar algo como 1, 5, 10, 25(25)75, 90, 95, 99 % puntos es una parte común del resumen de variables.
@NickCox Mi definición de cuantil fue utilizar la definición de Wikipedia es.wikipedia.org/wiki/Quantile "Los cuantiles son valores tomados a intervalos regulares de la inversa de la función de distribución acumulativa (FDA) de una variable aleatoria".
Gracias por la referencia, pero sostengo que el uso de intervalos regulares no forma parte de ninguna definición. Los cuantiles no dejarían de ser cuantiles si se eligieran (digamos) 50, 75, 90, 95, 99% puntos.
De la página wiki: https://en.wikipedia.org/wiki/Quantile
Algunos q-quantiles tienen nombres especiales:
The only 2-quantile is called the median The 3-quantiles are called tertiles or terciles → T The 4-quantiles are called quartiles → Q The 5-quantiles are called quintiles → QU The 6-quantiles are called sextiles → S The 10-quantiles are called deciles → D The 12-quantiles are called duodeciles → Dd The 20-quantiles are called vigintiles → V The 100-quantiles are called percentiles → P The 1000-quantiles are called permilles → Pr
Editar: siguiente agregado como lo señaló @NickCox en los comentarios:
The 8-quantiles are called octiles
También he visto referencias a los octiles (8). Esta lista es el mejor argumento para el término único quantiles que se puede imaginar.
Gracias por la edición. No creo que estos símbolos sean nada parecido a un estándar o incluso bien elegidos; el resultado colectivo es simplemente una sopa de letras aunque es poco probable que muchos se utilicen juntos. En particular, el uso de $P$ o $Pr$ para cualquier cosa que no sea una probabilidad es una idea terrible. ¿Quién quiere tener que recordar qué sentido tiene $Q$ y $Qu$ ¿lo son?
Percentil : El porcentaje de población que se encuentra por debajo de ese valor
Quantile : Los puntos de corte que dividen el rango de la distribución de probabilidad en intervalos continuos con igual probabilidad
Hay q-1 de q cuantiles uno de cada k que satisface 0 < k < q
Cuartil : Los cuartiles son un caso especial del cuantil, los cuartiles cortan el conjunto de datos en cuatro partes iguales, es decir, q=4 para los cuantiles, por lo que tenemos Primer cuartil Q1 , segundo cuartil Q2(Mediana) y el tercer cuartil Q3
Sus definiciones entran en conflicto entre sí y con las estándar, como es.wikipedia.org/wiki/Percentile que hacen que el percentil un valor particular de la población en lugar de un "porcentaje de población".
El percentil es básicamente el porcentaje de la población que se encuentra por debajo de ese valor, por ejemplo, 200 marcas en el examen CAT es el percentil 90, lo que significa que el 90 por ciento de los candidatos tienen marcas inferiores a 200
I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.
8 votos
Una cuestión más profunda es si los cuantiles, etc., son intervalos o puntos.
10 votos
Los cuantiles se definen como puntos. A menudo hay ambigüedad entre los intervalos y los puntos para los cuartiles, etc.; no pica mucho en la práctica, ya que el contexto suele dejar claro lo que se pretende. Yo prefiero el primer cuartil (en lugar del cuartil), para el 25% más bajo, etc. aunque es demasiado esperar que la distinción sea universalmente evidente sin necesidad de explicación.
2 votos
Mi respuesta en stats.stackexchange.com/questions/235330/ tiene una lista más completa de términos de *ile, incluyendo las fechas de su primer uso. Naturalmente, las adiciones y las citas anteriores son bienvenidas.
0 votos
El cuartil se refiere a los trimestres, es decir, de 4 en 4. El pencentil se refiere a los porcentajes, es decir, de 100 en 100. El cuantil... está ahí sólo para confundir (se refiere a la cantidad).