¿Cómo calcular la incertidumbre de la pendiente de la regresión lineal basándose en la incertidumbre de los datos (posiblemente en Excel/Mathematica)?
Ejemplo: Tengamos los puntos de datos (0,0), (1,2), (2,4), (3,6), (4,8), ... (8, 16), pero cada valor de y tiene una incertidumbre de 4. La mayoría de las funciones que encontré calcularían la incertidumbre como 0, ya que los puntos coinciden perfectamente con la función y=2x. Pero, como se muestra en la imagen, y=x/2 también coincide con los puntos. Es un ejemplo exagerado, pero espero que muestre lo que necesito.
EDIT: Si trato de explicar un poco más, mientras que cada punto en el ejemplo tiene un cierto valor de y, pretendemos que no sabemos si es cierto. Por ejemplo el primer punto (0,0) podría ser en realidad (0,6) o (0,-6) o cualquier cosa intermedia. Pregunto si hay algún algoritmo en alguno de los problemas populares que tenga en cuenta esto. En el ejemplo los puntos (0,6), (1,6,5), (2,7), (3,7,5), (4,8), ... (8, 10) todavía caen en el rango de incertidumbre, por lo que podrían ser los puntos correctos y la línea que conecta esos puntos tiene una ecuación: y = x/2 + 6, mientras que la ecuación que obtenemos de no factorizar las incertidumbres tiene la ecuación: y=2x + 0. Así que la incertidumbre de k es 1,5 y de n es 6.
TL;DR: En la imagen, hay una línea y=2x que está calculada usando el ajuste de mínimos cuadrados y se ajusta a los datos perfectamente. Estoy tratando de encontrar cuánto pueden cambiar k y n en y=kx + n y aún así ajustarse a los datos si conocemos la incertidumbre en los valores de y. En mi ejemplo, la incertidumbre de k es de 1,5 y en n es de 6. En la imagen está la línea de "mejor" ajuste y una línea que apenas se ajusta a los puntos.
1 votos
Si tiene incertidumbre en su $x$ Por lo general, no debería utilizar la regresión lineal ordinaria porque está sesgada (aunque las pequeñas incertidumbres darán lugar a un pequeño sesgo; tal vez no le importe tanto). ¿Las incertidumbres de tus y's son siempre constantes o varían? ¿Cómo está ajustando su línea?
0 votos
Pregunto sobre todo por la incertidumbre en y. Pero me gustaría que la solución considerara también la incertidumbre en las x. Generalmente no son constantes, pero una solución que requiera que sean constantes estaría bien también, traté de ajustar con linearfit, fit, findfit en mathematica y linest (y una función personalizada que encontré que pondera los valores por incertidumbres) en excel.
0 votos
¿Puede explicar lo más claramente posible cómo se relacionan los valores de "incertidumbre" con lo que sucedería, por ejemplo, en una repetición del experimento? es decir, ¿qué representan exactamente esas incertidumbres?
0 votos
Por ejemplo, si y es el peso, pero la balanza digital sólo tiene una precisión de +-6. (No es el mejor ejemplo con estos valores, pero por ejemplo cuando la balanza muestra 255g podría ser 255.0 o 255.9)
0 votos
¿Podría explicar cómo se relaciona eso con la primera frase de mi pregunta, por favor?
0 votos
No sé si te entiendo bien, el ejemplo sería medir la densidad, donde tendrías el volumen en el eje x y el peso en el eje y. Un ejemplo rápido: Digamos que los pesos reales son 11,63, 23,267, 34,9. Pero nuestra mala balanza sólo puede mostrar con una precisión de +-5, por lo que muestra 10, 20, 30. (Los volúmenes son 1*V0, 2*V0, 3*V0). Si tratamos de ajustar con un programa, mostrará la densidad de 10/V0 y 0 error. Pero el valor real es 11,7.
0 votos
Lo que pregunto es que estoy tratando de identificar su modelo (en el sentido probabilístico) para lo que son los números que obtenemos (tanto las observaciones como las incertidumbres), en el sentido de que si se repitiera todo el experimento (pero con el mismo $x$ '), cuál podría ser entonces la distribución de las observaciones.
0 votos
Como he dicho, si se hiciera exactamente igual la medida sería la misma. Los pesos reales 11,63g, 23,265g y 34,9g se seguirían midiendo como 10g, 20g, 30g.
0 votos
Entonces, ¿estas incertidumbres son más bien algún tipo de truncamiento/desviación? ¿Hay alguna otra consistencia en su comportamiento? (por ejemplo, si midiera un objeto de, digamos, 11,62g, ¿también estaría seguro de obtener 10g?)