Loading [MathJax]/jax/element/mml/optable/GeneralPunctuation.js

9 votos

¿Decir 50% de los datos será entre percentil 25-75?

Supongamos que tenemos el siguiente dataframe:

       TY_MAX
141  1.004622
142  1.004645
143  1.004660
144  1.004672
145  1.004773
146  1.004820
147  1.004814
148  1.004807
149  1.004773
150  1.004820
151  1.004814
152  1.004834
153  1.005117
154  1.005023
155  1.004928
156  1.004834
157  1.004827
158  1.005023
159  1.005248
160  1.005355

25th: 1.0031185409705132
50th: 1.004634349800723
75th: 1.0046683578907745
Calculated 50th: 1.003893449430644

Estoy un poco confundido aquí. Si conseguimos 75 prcentile, el 75% de los datos debe ser menor que el percentil. Y si podemos percentil 25, el 25% de los datos debe ser menor que 25. Ahora estoy pensando en que el 50% de los datos debe ser de entre 25 y 50. Y también percentil 50, me da un valor diferente. Justo lo suficiente, lo que significa que el 50% de los datos debe estar por debajo de este valor. Pero mi pregunta es si mi enfoque correcto?

EDIT: Y también podemos decir que el 98% de los datos serán entre el 1-99 de percentil?

30voto

icelava Puntos 548

Sí.

  • El 75% de los datos están por debajo del percentil 75.
  • El 25% de los datos están por debajo del percentil 25.
  • Por lo tanto, 50% (=75%-25%) de sus datos, entre los dos, es decir, entre el 25 y el percentil 75.
  • Completamente de forma análoga, el 98% de los datos están entre el 1 y el percentil 99.
  • Y la mitad inferior de sus datos, de nuevo 50%, están por debajo del percentil 50.

Estos números pueden no ser completamente correcta, especialmente si usted tiene un bajo número de datos. Tenga en cuenta también que existen diferentes convenciones sobre cómo cuantiles y percentiles son en realidad calculada.

2voto

Martin Puntos 563

Idealmente, sí.

Los Percentiles son generalmente interpretados en términos de la distribución normal (como la normalidad es a menudo un activo subyacente, a veces escondida, supuesto en el cómputo de cualquier tipo de elementales medidas estadísticas). La distribución no tiene que ser normal, sin embargo.

De acuerdo a este sitio web...

La distribución normal estándar también puede ser útil para calcular los percentiles. Por ejemplo, la mediana es el percentil 50, el primer cuartil es el percentil 25, y el tercer cuartil es el percentil 75. En algunos casos puede ser de interés para calcular otros percentiles, por ejemplo 5 o 95. La siguiente fórmula se utiliza para calcular los percentiles de una distribución normal: X=μ+Zσ

Así, si asumimos la normalidad, podemos fácilmente calcular cualquier percentil que estamos buscando. Los Percentiles no requieren de la distribución de la hipótesis, sin embargo, y se obliga a los datos, de la que se calcula. Esto significa que los percentiles pueden proporcionar puntos de referencia significativos para la normal y distribuciones no normales. También puede utilizar los percentiles en una probabilidad de interpretación, de curso basado en las medidas que usted tiene actualmente, que podría ser bueno o malo indicadores de la verdadera distribución subyacente.

De acuerdo a este sitio...

Interpretación directa: considere el 10 de (P10) y 90 (P90) percentiles: "en vista de los datos disponibles, sabemos que la propiedad del suelo p < P_{10} 10% del tiempo, y, p < P_{90} a 90% del tiempo". Esta misma frase se puede enmarcar el uso de probabilidades o las proporciones: "en vista de los datos disponibles, suelo de propiedad p está dentro del rango de {P_{10} − P_{90}} el 80% del tiempo".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X