8 votos

¿Puedo construir un programa que me diga si un conjunto de datos del mundo real parece lineal, logarítmico, exponencial, etc.?

Tengo un montón de conjuntos de datos del mundo real y al trazar manualmente algunos de los datos en gráficos, he descubierto que algunos conjuntos de datos parecen más bien logarítmicos y otros parecen lineales, o exponenciales (y algunos parecen un desastre :).

He estado leyendo sobre ajuste de curvas/ajuste de datos en wikipedia y si lo entiendo bien (cosa que dudo seriamente) puedo calcular una curva de mejor ajuste usando cálculos de mínimos cuadrados, pero tengo que determinar si quiero que la curva se ajuste a un patrón logarítmico, lineal o exponencial (etc) primero.

Lo que realmente me gustaría hacer es pasar un conjunto de datos a una función (soy un programador con escasos conocimientos de matemáticas) y que ésta devuelva algo como "este conjunto de datos parece más lineal que logarítmico" o "esto parece exponencial".

Mi pregunta es: ¿es eso posible, sin que un humano mire un gráfico y reconozca el patrón?

Mi opinión es: sí. Pero antes de invertir una tonelada de tiempo en averiguar cómo programar esto, sólo quiero asegurarme de que no estoy ladrando al árbol equivocado y confirmar esto con ustedes si es posible.

Lo siento si esta es una pregunta tonta, pero sólo para ser claro, no estoy buscando una respuesta de cómo hacerlo, sólo un simple sí o no va a hacer, sin embargo, si usted tiene sugerencias sobre cómo abordar el problema, que sería impresionante, por supuesto.

1 votos

Puede realizar la interpolación por mínimos cuadrados utilizando cualquier combinación de funciones de su elección.

0 votos

Incluso parece que hay una solución comercial para esto: uniphiz.com/best-fit.htm aunque no lo he probado. El programa complementario uniphiz.com/findgraph.htm puede incluso recuperar los datos de una parcela.

0 votos

Sí, puedo violar los datos para que se ajusten a cualquier línea, pero ¿cómo sé cuál tipo de la curva "se ajusta mejor

6voto

mxmissile Puntos 382

Puede que no te des cuenta, pero esta es una pregunta de estadística, para la que los estadísticos han estado estudiando... desde siempre.

Así que la respuesta sencilla a su pregunta "¿Puede hacerlo?" es que sí.

Pero, por supuesto, hay más matices.

Normalmente, los estadísticos dirán "elige primero tu modelo, uno de esos tres (lineal, exponencial o logarítmico), y luego para uno de ellos, puedo decirte cuál es la "mejor" línea". Es decir, la simple regresión lineal le dará la línea de mejor ajuste para un modelo lineal, y para los otros dos puede transformar los datos (tomar un logaritmo o una exponencial del $y$ y -entonces- hacer la regresión lineal. Parte del proceso/resultado de hacer la regresión lineal es un valor que dice cuán buena es la coincidencia (el coeficiente de correlación).

Pero tu pregunta va más en la línea de qué "modelo" es el mejor. Se podría pensar que basta con comparar los tres coeficientes de correlación y elegir el mejor. Yo también pensaría eso, excepto que no soy estadístico y algo me dice que un estadístico tendría un ataque sobre algo tan simple (probablemente también sobre mi sugerencia de usar el coeficiente de correlación). Así que, para una respuesta real, creo que un estadístico podría responder mucho mejor (hmm... ¿no hay un statistics.stackexchange?). Pero por el momento, esta es una buena primera aproximación a una respuesta.


Editar: Mientras tanto, pregunté directamente en stats.stackexchange (como sugiere Rahul). Confirman mis sospechas de que una respuesta sencilla es pero no es tan sencillo.

0 votos

Muchas gracias por su respuesta. Efectivamente mi pregunta va más en la línea de qué "modelo" es el mejor. Estoy contento con el hecho de que "¿Se puede hacer?" es que sí. Creo que tendré que contratar a un verdadero estadístico para que me ayude a implementarlo.

0 votos

@Michael, @Mitch: Hay, en efecto, un stats.stackexchange.com que puede ser una buena opción para esta pregunta.

2 votos

Como dice Mitch, el ajuste a un modelo dado es un algoritmo bien definido, por lo que se puede hacer con cada uno de un conjunto de modelos. Entonces, si tienes una buena estimación de la probabilidad de error en cada medida, puedes calcular un chi-cuadrado y elegir el modelo que tenga la menor. Las preguntas sin respuesta son: 1) ¿incluye tu conjunto de modelos el verdadero y 2) es correcto tu modelo de la probabilidad de un error? Ambas son duro preguntas.

0voto

vonbrand Puntos 15673

Puedes utilizar un programa para trazar tus datos y observar los puntos. La mayoría de los programas de trazado permiten, por ejemplo, trazados lineales, log-lineales y log-log (y posiblemente otros). Eso debería darte una idea.

Si conoces los datos, quizás haya algún modelo (¿aproximado?) de los mismos que insinúe una relación funcional concreta. En ese caso, yo establecería un ajuste por mínimos cuadrados.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X