El verdadero parámetros/coeficientes de regresión
La regresión lineal supone el modelo:
$$y_i = \boldsymbol{\beta} \mathbf{x_i} +\epsilon_i$$
donde $\boldsymbol\beta$ se asume fijo y sólo el término residual $\epsilon_i$ se supone que se distribuye según alguna distribución.
Así que el verdadero parámetro/coeficiente se supone fijo, y es no se supone que están relacionados con una distribución (Es decir, en la regresión lineal, se podría pensar en modelos alternativos que sí expresan distribuciones para los coeficientes)
El estimado parámetros/coeficientes de regresión
Mientras que el verdadero $\boldsymbol{\beta}$ puede ser fija, la estimación $\boldsymbol{\hat\beta}$ puede considerarse que sigue alguna distribución (la estimación depende de una muestra/datos que varía en cada nuevo experimento, por lo que la estimación puede considerarse una variable aleatoria). Esto lleva a dos formas diferentes de expresar la estimación del parámetro, las estimaciones puntuales y las estimaciones de intervalo, y en esta diferencia se puede encontrar la intuición para informar de las estimaciones adicionales como error estándar, valor t, intervalo de confianza:
La estimación del intervalo da una idea un poco mejor de la información que contienen los datos. No es sólo una estimación para un solo parámetro de la población, sino que también transmite algo así como la fuerza de la información que llevan los datos, es decir, hasta qué punto otros valores que este solo estimación, $\boldsymbol{\hat\beta}$ podrían seguir siendo alternativas razonables para el parámetro desconocido $\boldsymbol{\beta}$ .
Más datos, o datos con menos ruido, conducen a una menor desviación de la estimación $\boldsymbol{\hat\beta}$ (y esta desviación puede estimarse a partir de los datos), lo que significa que no todas las estimaciones puntuales pueden considerarse iguales. Con más datos o menores niveles de ruido, es más probable que la estimación esté "cerca" del verdadero parámetro desconocido. Una sola estimación puntual no transmite esta desviación ni lo "cercana" que es la estimación puntual.
1 votos
¿Puede aclarar qué quiere decir que todos los programas estadísticos devuelven una "distribución de coeficientes"? Llevo utilizando software para hacer regresión con regularidad desde principios de los años 80 (e incluso algunas veces en los 70) en docenas de programas diferentes y me encuentro incapaz de entender lo que dices que hacen todos esos programas. ¿En qué forma se da esta distribución? (¿un dibujo de una densidad o cdf? como una fórmula algebraica?). ¿Puedes mostrar un ejemplo (que no sea ninguna de las cosas que enumeras en "junto con", ya que claramente se trata de algo adicional a la distribución que mencionas)
0 votos
Me siento agradecido de recibir un comentario suyo. Gracias por hacer que esta industria sea acogedora para los novatos y popular entre todos. Por favor, consulte los comentarios que aparecen a continuación para obtener una aclaración.
1 votos
Si te refieres a las respuestas, las leí antes de comentar, pero no vi nada en ellas que pudiera relacionar con lo que tu pregunta parecía sugerir y, de hecho, parecen responder a preguntas totalmente diferentes, por lo que dudo que ambas puedan estar respondiendo a lo que sea que estés preguntando (una u otra podría, pero quizás ninguna lo haga). ¿Puedes aclarar, en tu pregunta, a qué te refieres con una "distribución de coeficientes"? Si no estás seguro de cómo describirlo, ¿podrías mostrar un ejemplo?
1 votos
Sircasms, en un principio creí entender esta pregunta, pero las respuestas publicadas demuestran que otros tienen una comprensión bastante diferente de la misma. Esto explica por qué (a) has recibido respuestas diferentes y (b) la pregunta tiene muchos upvotes: evidentemente a los usuarios les gusta la pregunta, ¡pero puede que les guste un conjunto de preguntas diferentes! Las situaciones ambiguas como ésta son realmente malas, porque la gente puede ser fácilmente engañada sobre lo que se está preguntando así como sobre lo que se está respondiendo. @Glen ha hecho bien en pedirte que aclares el post.
0 votos
Ya veo la confusión. Por favor, compruebe la pregunta editada.
0 votos
Y, no creo que las dos respuestas actuales sean conflictivas o diferentes. Compartieron opiniones específicas sobre por qué la regresión lineal predijo una "distribución de beta" en lugar de un valor.
1 votos
El origen de la confusión, etc., es que estás utilizando "distribución" de una manera no estándar. En estadística, "distribución" se refiere a una distribución de probabilidad, por ejemplo, Gamma, Pareto, ..., y, según las circunstancias, a los parámetros de esa distribución. Esto no es lo que se devuelve en la tabla anterior. La tabla devuelve el valor estimado y una estimación de su precisión (el error estándar) en la estimación del verdadero parámetro poblacional subyacente. Esto no es una distribución en el sentido estadístico de la palabra.
0 votos
Lo tengo. Supongo que tuve suerte de que la gente en los dos comentarios entendiera lo que quería decir.