18 votos

¿Qué significa Theta?

Soy un novato en estadística y encontré este .

En las estadísticas, θ, la letra griega minúscula "theta", es la habitual nombre de un (vector de) parámetro(s) de alguna probabilidad general distribución. Un problema común es encontrar el valor o valores de theta. Noten que no hay ningún significado en nombrar un parámetro de esta manera. Nosotros podría llamarlo de otra manera. De hecho, muchas distribuciones tienen parámetros a los que normalmente se les da otros nombres. Por ejemplo, se es de uso común para nombrar la media y la desviación de la normalidad distribución μ (léase: 'mu') y desviación σ ('sigma'), respectivamente.

Pero todavía no sé lo que significa eso en inglés.

10 votos

$\theta$ es sólo un símbolo matemático y significa diferentes cosas en diferentes contextos. A veces $\theta$ se utiliza para referirse a un parámetro a estimar, pero no hay una respuesta real a la pregunta "¿Qué es $\theta$ ?". Eso es como preguntar "¿Qué es la letra A?". Su enlace incluso lo insinúa cuando dice "Fíjate que no tiene ningún sentido nombrar un parámetro de esta manera. También podríamos llamarlo de otra manera". .

0 votos

Es sólo una forma de nombrar un parámetro estadístico (que define la distribución de la cantidad asociada a este "parámetro") con una letra especial (distinta de las letras inglesas).

4 votos

La mayoría de nosotros consideraría esta cita como algo extremadamente sencillo, pero para avanzar tenemos que aceptar que la cuestión es no sobre cómo leer el inglés. ¿De qué podría tratarse entonces? Yo sostengo que nos pide que expliquemos el términos técnicos en la cita: aquellos con los que estamos tan familiarizados que ya no vemos lo extraños que pueden ser para los no iniciados estadísticamente. Esto nos obliga a abordar los significados de distribución y parámetros (de una distribución que es; no de una curva ajustada u otro modelo determinista).

34voto

JMW.APRN Puntos 21

No es una convención, pero a menudo $\theta$ representa el conjunto de parámetros de una distribución.

Eso fue todo en cuanto al inglés sencillo, vamos a mostrar ejemplos en su lugar.

Ejemplo 1. Quieres estudiar el lanzamiento de una chincheta antigua (las que tienen un gran fondo circular). Supones que la probabilidad de que caiga con la punta hacia abajo es un valor desconocido que llamas $\theta$ . Se podría llamar a una variable aleatoria $X$ y decir que $X=1$ cuando la chincheta cae con la punta hacia abajo y $X=0$ cuando cae punto arriba. Se escribiría el modelo

$$P(X = 1) = \theta \\ P(X = 0) = 1-\theta,$$

y le interesaría estimar $\theta$ (en este caso, la probabilidad de que la chincheta caiga en punta).

Ejemplo 2. Quieres estudiar la desintegración de un átomo radiactivo. Basándote en la literatura, sabes que la cantidad de radiactividad disminuye exponencialmente, así que decides modelar el tiempo de desintegración con una distribución exponencial. Si $t$ es el tiempo de desintegración, el modelo es

$$f(t) = \theta e^{-\theta t}.$$

Aquí $f(t)$ es una densidad de probabilidad, lo que significa que la probabilidad de que el átomo se desintegre en el intervalo de tiempo $(t, t+dt)$ es $f(t)dt$ . De nuevo, le interesará estimar $\theta$ (aquí, la tasa de desintegración).

Ejemplo 3. Quiere estudiar la precisión de un instrumento de pesaje. Basándose en la literatura, sabe que las mediciones son gaussianas, por lo que decide modelar el pesaje de un objeto estándar de 1 kg como

$$f(x) = \frac{1}{\sigma \sqrt{2\pi}} \exp \left\{ -\left( \frac{x-\mu}{2\sigma} \right)^2\right\}.$$

Aquí $x$ es la medida dada por la escala, $f(x)$ es la densidad de probabilidad, y los parámetros son $\mu$ y $\sigma$ Así que $\theta = (\mu, \sigma)$ . El parámetro $\mu$ es el peso objetivo (la balanza está sesgada si $\mu \neq 1$ ), y $\sigma$ es la desviación estándar de la medida cada vez que se pesa el objeto. De nuevo, le interesará estimar $\theta$ (aquí, el sesgo y la imprecisión de la escala).

1 votos

+1 FWIW, recientemente he publicado un ejemplo trabajado en la misma línea en stats.stackexchange.com/a/34894 . Aunque sería engañoso interpretarlo como "inglés sencillo" -no rehúye el uso de términos técnicos-, me he esforzado por explicar lo más clara y brevemente posible lo que ocurre, qué supuestos se hacen y cómo se trabaja con una familia parametrizada de distribuciones para producir una estimación basada en datos. Para algunos, esto podría ser un complemento informativo a su respuesta aquí.

1 votos

Gran respuesta. Sin embargo, estoy confundido cuando afirmas que la escala está sesgada si mu != 1. De hecho, al "normalizar", la distribución normal estándar se convierte en x ~ N(0, 1). O, en inglés, la mu = 0 y la varianza = 1. Véase, por ejemplo, es.wikipedia.org/wiki/

0 votos

Sólo quiero decir que el instrumento tiene un sesgo si indica algo más que 1 kg cuando mide un objeto de 1 kg. Tal vez la palabra "balanza" sea confusa. Aquí sólo designa el instrumento.

4voto

Zizzencs Puntos 1358

Qué $\theta$ se refiere depende del modelo con el que se trabaje. Por ejemplo, en la regresión por mínimos cuadrados ordinarios, se modela una variable dependiente (normalmente llamada Y) como una combinación lineal de una o más variables independientes (normalmente llamadas X), obteniendo algo como

$Y_i = b_0 + b_1x_1 + b_2x_2 + ... + b_px_p$

donde p es el número de variables independientes. Los parámetros que hay que estimar aquí son los $\beta s$ y $\theta$ es un nombre para todos los $\beta s$ . Pero $\theta$ es más general puede aplicarse a cualquier parámetro que queramos estimar.

3 votos

Peter, aunque no lo has dicho exactamente, me temo que esta respuesta puede dar a un novato la impresión incorrecta de que el símbolo $\theta$ siempre referirse a un vector de parámetros y, a la inversa, que ésta es la única manera de referirse a un valor de parámetros. Como indica mi comentario anterior, creo que la respuesta no es más que " $\theta$ es un símbolo matemático", por lo que no es realmente una cuestión estadística.

1 votos

@Macro Creo que, en este contexto, está claro que este es el significado de $\theta$ que Kamilski quería. Claro, cualquier símbolo puede referirse a cualquier cosa. Pero en este párrafo, Macro se refiere a ti, y no a un curso de Economía o a una parte de SAS o lo que sea.

1 votos

Ok bueno no creo que esa analogía sea realmente apta pero la tomaré como un intento de hipérbole. En cualquier caso, me estoy refiriendo a algo muy básico que es que los novatos en matemáticas suelen confundir notación como algo intrínsecamente significativo y como algo distinto de lo que es: una simple etiqueta. Lo que quería decir es que esta respuesta (creo que involuntariamente) no contribuye a disipar esa idea. Como usted sabe, $\theta$ puede referirse a otras cosas que un estadístico puede encontrar. Por ejemplo, los ángulos se suelen denotar con $\theta$ .

1voto

Dipstick Puntos 4869

En lenguaje llano:

Distribución estadística es una función matemática $f$ que te dice cuál es la probabilidad de diferentes valores de tu variable aleatoria $X$ que tiene la distribución $f$ es decir $f(x)$ produce una probabilidad de $x$ . Hay diferentes tal funciones pero por ahora consideremos $f$ como una especie de función "general".

Sin embargo, para $f$ para ser universal es decir, que se puede aplicar a diferentes datos (que comparten propiedades similares), necesita parámetros que cambian su forma para que se adapte a diferentes datos. Un ejemplo sencillo de un parámetro de este tipo es $\mu$ en distribución normal que indica dónde está el centro (media) de esta distribución y por tanto puede describir variables aleatorias con diferentes valores medios. La distribución normal tiene otro parámetro $\sigma$ y otras distribuciones también tienen al menos uno de estos parámetros. Los parámetros suelen llamarse $\theta$ donde para la distribución normal $\theta$ es una abreviatura de $\mu$ y $\sigma$ (es decir, es un vector de los dos valores).

¿Por qué es $\theta$ importante? Las distribuciones estadísticas se utilizan para aproximar las distribuciones empíricas de los datos. Digamos que tienes un conjunto de datos de las edades de un grupo de personas y que en promedio tienen 50 años y quieres aproximar la distribución de sus edades usando una distribución normal. Si la distribución normal no permitiera diferentes valores de $\mu$ (por ejemplo, si tuviera un valor fijo de este parámetro, digamos $\mu=0$ ), entonces sería inútil para estos datos. Sin embargo, como $\mu$ no es fija, la distribución normal podría utilizar diferentes valores de $\mu$ con $\mu=50$ siendo uno de ellos. Este es un ejemplo sencillo, pero hay casos más complicados en los que los valores de $\theta$ los parámetros no son tan claros y por eso hay que utilizar herramientas estadísticas para estimar (encontrar los más adecuados) $\theta$ valores.

Así que se podría decir que La estadística consiste en encontrar la mejor $\theta$ valores dados los datos (Los bayesianos dirían: dados los datos y las preconcepciones).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X