6 votos

Ya sea para usar r-cuadrado o r-cuadrado ajustado con un tamaño de muestra pequeño que puede representar a toda la población?

He leído en línea que sólo es necesario el uso de ajustar, -$R^2$ cuando se trabaja con una muestra en lugar de la totalidad de la población.

Los datos que estoy trabajando con información sobre una serie de vivir seminarios educativos. Cada punto de datos representa un único seminario que se celebró en el pasado, y contiene información diversa sobre el programa características.

En tratando de decidir si usar o $R^2$ o ajustar, -$R^2$, puedo ver dos diferentes caras de la misma moneda.

  1. Desde mi conjunto de datos contiene todos los seminarios que hemos tenido hasta la fecha, estoy trabajando con la totalidad de la población, por lo que debo ir con regulares de edad $R^2$.

  2. La población de interés es realmente todo lo posible seminarios, incluyendo aquellos que no han sucedido todavía, dado que mi objetivo en este modelo es para entender mejor la relación de los factores de ir hacia adelante. Por lo tanto, estoy buscando a una muestra, y debo ajustar, -$R^2$.

Que la lógica es correcta, y que la medida de correlación debo usar?

12voto

Marcus Morrisey Puntos 625

No es el caso de que uno utiliza R-cuadrado para toda la población y ajustado R-cuadrado para las muestras. Cada uno de ellos dan información diferente. R-cuadrado es la proporción de la variabilidad en los datos explicada por el modelo. Ajustado R-squared se toma en cuenta (es decir, se ajusta a) el número de términos explicativos en su modelo. R-squared nunca puede ser disminuido mediante la adición de los términos adicionales, porque no se puede explicar la menor variación con más predictores. Por otro lado, el ajustado R-squared, aumentará sólo si el agregado de los predictores en beneficio de la modelo. Conceptualmente, se puede pensar en ajustar R-cuadrado como penalizar la complejidad. Solo en caso de que agrega complejidad aumenta significativamente (es decir, más de lo que cabría esperar por el azar) el poder predictivo del modelo ajustado R-cuadrado aumento. La adición de buenos predictores de la realidad, puede disminuir ajustado R-cuadrado. La verdadera pregunta, entonces, es ¿qué estás tratando de responder con esta información?

4voto

mat_geek Puntos 1367

Yo creo que hay dos puntos de vista distintos y no hay respuesta correcta o incorrecta. Pero yo estaría más inclinado a ir con 2. Aunque en 1 usted dijo que se han incluido en cada seminario celebrado hasta la fecha, parece que el universo incluye a los futuros seminarios así.

Pero la aceptación de 2 no resuelve la cuestión entre R cuadrado y R cuadrado ajustado. La razón por la R cuadrado ajustado se incluye, en primer lugar, es que si el tamaño de los parámetros del modelo o covariables es grande en relación al tamaño de la muestra el ordinario R cuadrado tienden a sobreestimar la cantidad de variación que el modelo explica. Es el porcentaje de la varianza explicada por el modelo para los datos observados establecida pero sobreestima la cantidad de variación en el modelo se explican en un nuevo conjunto de datos de una muestra aleatoria de la población. El R cuadrado ajustado hace un esfuerzo para dar cuenta de esta tendencia. Pero si el tamaño de la muestra es muy grande en relación con el número de covariables R cuadrado y R cuadrado ajustado no diferirá mucho y la elección de R cuadrado ajustado es mucho menos importante que si el tamaño de la muestra fue sólo ligeramente mayor que el número de parámetros estimados en el modelo.

Así que no veo la opción de ajustar R cuadrado de más de R cuadrado de ser más una cuestión del tamaño relativo del tamaño de la muestra para el número de parámetros en lugar de si o no la muestra representan el enitre de la población o sólo una pieza al azar de la misma.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X