¿Hay 99 percentiles o 100 percentiles? ¿Y son grupos de números, o líneas divisorias, o indicadores de números individuales?
Supongo que la misma pregunta se aplicaría a los cuartiles o a cualquier cuantil.
He leído que el índice de un número en un determinado percentil(p), dados n ítems, es i = (p / 100) * n
Eso me sugiere que hay 100 percentiles.. porque suponiendo que tienes 100 números(i=1 a i=100), entonces cada uno tendría un índice(1 a 100).
Si tuvieras 200 números, habría 100 percentiles, pero cada uno se referiría a un grupo de dos números. O 100 divisores excluyendo el divisor del extremo izquierdo o del extremo derecho, porque de lo contrario tendrías 101 divisores. O punteros a números individuales, de modo que el primer percentil se referiría al segundo número, (1/100)*200=2 Y el centésimo percentil se referiría al número 200 (100/100)*200=200
Aunque a veces he oído que hay 99 percentiles..
Google muestra el diccionario oxford que dice de percentil- "cada uno de los 100 grupos iguales en que puede dividirse una población según la distribución de valores de una variable determinada." y "cada uno de los 99 valores intermedios de una variable aleatoria que dividen una distribución de frecuencias en 100 grupos semejantes."
Wikipedia dice que "el percentil 20 es el valor por debajo del cual puede encontrarse el 20% de las observaciones". Pero, ¿significa realmente "el valor por debajo o igual al cual puede encontrarse el 20% de las observaciones", es decir, "el valor para el cual el 20% de los valores son <= a él"? Si fuera sólo < y no <=, entonces, por ese razonamiento, el percentil 100 sería el valor por debajo del cual puede encontrarse el 100% de los valores. He oído eso como argumento de que no puede haber percentil 100, porque no se puede tener un número en el que haya el 100% de los números por debajo de él. Pero creo que tal vez ese argumento de que no se puede tener un percentil 100 es incorrecto y se basa un error que la definición de un percentil implica <= no <. (o >= no >). Así que el percentil 100 sería el número final y sería >= 100% de los números.
5 votos
Me parece poco probable que 100 sea una respuesta razonable debido a su tratamiento asimétrico de los extremos. Se puede argumentar a favor del 99 (como en la definición que citas) o del 101.
6 votos
Históricamente, los cuantiles -como ahora decimos genéricamente- eran primero puntos de resumen, y luego, por extensión, los bins, clases o intervalos que delimitan. Así, tres cuartiles, incluida la mediana, definen cuatro intervalos, y así sucesivamente.
0 votos
@NickCox ¿Tienes una fuente para eso?
1 votos
@whuber Escribes "Me parece poco probable que 100 sea una respuesta razonable debido a su tratamiento asimétrico de los extremos." <-- ¿puedes dar más detalles?
0 votos
@whuber Usted escribe "Los casos se pueden hacer ya sea para 99 (como en la definición que usted cita) o 101" <-- aunque por ciento significa por 100, así que ¿cómo se puede tener 101? Y si 101 los numerarías 1º 2º .... 101º, o 0º 1º 100º? 0th parece problemático porque el th/st está para contar y contar está de 1. ¡Incluso en informática, usted índice de 0 pero todavía contando es 0=ningunos artículos, de 1 para el primer artículo!
0 votos
Relacionado: ¿Cuáles son algunos ejemplos de uso inverso de "percentiles"?
3 votos
Enumero los primeros usos de varios términos cuantílicos en stats.stackexchange.com/questions/235330/ . Si busca en el OED o en jstor obtendrá ejemplos de uso histórico.
0 votos
Existe un caso, quizá tan jocoso como serio, para referirse al mínimo y al máximo de la muestra como, por ejemplo, percentiles 0 y 100, pero no lo recomiendo. Tenga en cuenta que, si trabaja con percentiles, nada le obliga a calcular los 99 del 1% al 99% y que, por lo general, eso sólo tendría sentido si dispusiera de una muestra muy grande, y quisiera una descripción fina, y los empates no picaran fuerte.
0 votos
Busque en el foro menciones a un artículo de Hyndman y Fan, por ejemplo. stats.stackexchange.com/questions/367467/ En la práctica, existen muchas definiciones de cuantiles y, por tanto, de los intervalos que delimitan.
0 votos
No existe un único "diccionario Oxford". Oxford University Press publica varios. ¿Cuál ha consultado?
1 votos
No puede haber 100. O 99 o 101, dependiendo de si cuentas el máximo y el mínimo.
0 votos
La respuesta es sencilla: hay 100 percentiles, del 0 al 99. Sí, existe una terminología ambigua entre los límites de los percentiles y los grupos de percentiles. Estar en el percentil n grupo significa ser sobre el enésimo percentil límite y igual o inferior a el (n+1)º percentil límite . Nótese que bien podría no haber ningún miembro de la población en un percentil determinado límite así que tu suposición de "punteros a números individuales" es errónea.
0 votos
Como tal, supongo que se podría decir que hay es un percentil 100 límite pero hay no Percentil 100 grupo . No es de extrañar que haya confusión. La ambigüedad hace eso.
0 votos
@JeffY Eso es poco útil, sobre todo por el tono. Por no citar más que una afirmación engañosa: el primer cuartil está por debajo del primer cuartil o del cuartil inferior, aunque sólo sea por terminología convencional.
0 votos
@JeffY ¿estás de acuerdo en que si usted tiene cuartiles entonces usted tiene cuatro grupos. ver este diagrama i.imgur.com/dN3hSwq.png Tienes 0-25, 25-50, 50-75, 75-100 (y el intervalo intercuartílico es 25-75. El rango entre los dos cuartiles del medio). ¿Así que supongo que estás de acuerdo en que con los cuartiles tienes 4 grupos? Entonces, ¿por qué no estás de acuerdo / cómo no puedes estar de acuerdo, que cuando se trata de percentiles tienes 100 grupos?
0 votos
@barlop I do de acuerdo en que hay 100 grupos, del 0 al 99. Sólo digo que no existe el grupo 100: ningún miembro de la población tiene el 100% de la población. debajo de ellos. Parece que existe un posible desacuerdo/ambigüedad terminológica adicional entre cuartiles y percentiles.
0 votos
Una papelera no tiene por qué estar definida por un límite superior. Aquí hay uno: "mayor que 42". Las definiciones sólo tienen que hacer inequívoco qué valores van en cada recipiente. La idea general es que $k$ los puntos definen $k + 1$ bins reglas aquí, mientras que deja los lazos en un lado junto con alguna convención sobre los puntos en cada límite subiendo o bajando. .
0 votos
@NickCox que es un buen punto que un contenedor no tiene por qué tener un límite superior .. podría tener un límite inferior y sin límite superior, o supongo que viceversa, un límite superior y sin límite inferior. Supongo que un punto define un límite de un contenedor, en lugar del contenedor / contenedor entero. Se necesita algo más que el punto para definir el contenedor, por ejemplo, no sólo 42, sino >=42, y entonces se tiene el contenedor entero.
0 votos
@JeffY además, si estás de acuerdo en que los grupos de cuartiles van a tener el mismo tamaño, igual que los grupos de percentiles, entonces estarás de acuerdo en que entre los cuartiles inferior y superior hay "dos cuartiles medios". Por lo tanto, el IQR es el intervalo entre dos cuartiles, no un cuartil en sí mismo. Es el tamaño de dos cuartiles (50%).
0 votos
No creo que nadie esté discutiendo sobre el IQR. Mejor dejarlo a un lado.
0 votos
@NickCox Bueno, mi punto es que a pesar de que normalmente no oímos hablar de 2 cuartiles en el medio, entre los cuartiles superior e inferior, están ahí, y mi punto es que el mismo principio se aplica. a los cuartiles como percentiles que es que si se habla de grupos, entonces al igual que hay 4 grupos de cuartiles , hay 100 grupos de percentiles. Asi que eso contrarresta totalmente la afirmacion de Jeff sobre que no hay un grupo 100.
0 votos
@NickCox ¿Los cuantiles no suelen ser tan generales (sin límite superior, no indexados a una fracción del tamaño de la población)? ¿O querías decir "superior al 42%" (que implica <=100%, por lo que existe un límite superior)?
0 votos
@JeffY Sólo estoy rebatiendo una suposición tuya de que no se puede identificar un grupo superior si no se puede identificar un límite superior. "mayor que 42" es sólo un ejemplo con 42 como número arbitrario: nada que ver con cuantiles o porcentajes como tales. La cuestión es matemática: $(42, \infty)$ es un contenedor.
0 votos
Barlop: Estoy de acuerdo en que la lógica aquí es general, independientemente de qué número de cuantiles se está discutiendo. Ni siquiera tienen que estar igualmente espaciados en una escala de probabilidad acumulativa. Así, los puntos 10, 25, 50, 75, 90% son 5 puntos que definen 6 intervalos. Y así sucesivamente.
0 votos
@NickCox Ahh. Creo que entonces no me has entendido. Hay un grupo superior, es sólo su nombre estamos en desacuerdo en que creo. Lo que digo es que el "grupo del percentil 99" es el grupo superior (y el "grupo del percentil 0" es el grupo inferior). Es decir, por encima del límite del percentil 99% y en el "límite" del percentil 100% o por debajo.
0 votos
@JeffY Cometes un error que cometen algunos con formación informática. Si tienes un array/lista de 5 elementos, sería un error decir que no hay 5º elemento. La indexación es 0..4 pero si vas a mirar la cuenta del número de elementos, es 5, y el 1er elemento es el elemento con índice 0. El 5º elemento es el último, cuyo índice es 4. No puedes decir que un array de 5 elementos no tiene 5º elemento. La frase "0º elemento" es un sinsentido y te ha confundido haciéndote pensar que no hay 5º elemento en una matriz con 5 elementos. Y ese mismo error lo has aplicado aquí en este caso estadístico.
0 votos
Puede que tengas una forma coherente de pensar sobre esto, pero sería mejor explicarlo en una respuesta. Su comentario inicial parecía bastante claro, pero su terminología sólo puede considerarse no estándar.
0 votos
@barlop Me estoy rigiendo por la definición de "estar en el n-ésimo percentil" en el sentido de "(justo) por encima del n% de la población". Según esa definición, no existe "estar en el percentil 100%". Es decir, no existe un "grupo/barra del percentil 100".
1 votos
@Jeff Como le pedí a mkt (que publicó la primera respuesta aquí), te pregunto a ti: ¿puedes citar una fuente autorizada para esa definición? Es muy posible que la haya, pero sospecho que no se encuentra en la literatura estadística, porque la gran mayoría de esa literatura adopta una convención diferente para describir la distribución: a saber, preferimos trabajar con la probabilidad de que una variable aleatoria sea menor o igual que a alguna cantidad.
2 votos
@whuber Sí, parece que lo que estoy haciendo referencia se llama correctamente "rango percentil", que se utiliza en los informes de prueba-calificación & c.: es.wikipedia.org/wiki/Percentile , es.wikipedia.org/wiki/Rango_percentil , ncme.org/resources/glossary . Disculpas por aumentar la confusión. En mi defensa, la diferencia parece depender del uso de las preposiciones "en" frente a "en" (véase el primer enlace).
0 votos
@barlop Veo que la mayoría de sitios / imágenes hablan de cuartiles como puntos. 3 cuartiles. Q1 Q2 Q3. Se usan los términos "cuartil superior" y "cuartil inferior".. pero es más raro que se hable de las dos regiones intermedias como cuartiles, pero a veces se habla de - "cuartil medio inferior", cuartil medio superior". . Y a veces se hace referencia a cada grupo como cada uno de los cuatro cuartiles.
0 votos
@JeffY aquí dicen "in" pero quieren decir "at". statisticshowto.datasciencecentral.com/ "Si sabes que tu puntuación está en el percentil 90, significa que has sacado mejor nota que el 90% de las personas que hicieron el examen". Curiosamente es.wikipedia.org/wiki/Percentile dice que "cada puntuación está en el percentil 100", por lo que ve los percentiles como superpuestos, más pequeños dentro de más grandes. A diferencia del "cuartil inferior" y el "cuartil superior", que son regiones del mismo tamaño.
0 votos
@JeffY lo consiguió, arriba. Cuando era estudiante, había pruebas estandarizadas que mostraban el percentil. En matemáticas, me sentí desolado al tener una puntuación que mostraba el percentil 99. Hasta que me explicaron que en realidad era la puntuación más alta que se podía obtener. (Otras puntuaciones eran "normales", inglés era 75-80, ¿quién se acuerda?).
1 votos
@JoeTaxpayer Los que te decían eso estaban siendo coherentes si y solo si le decían a la gente del cubo de abajo que estaban en el percentil 0. No puedo saber si lo hacían, y es de suponer que no te juntaras con ningún candidato probable.