Esta es mi primera pregunta aquí.
Como no soy un matematician pensé en preguntarle aquí para obtener consejos de cómo acercarse a algo que estoy trabajando como un pasatiempo.
Un poco de contexto
Digamos que hay es una colección de elementos con una descripción de las características y un precio. Imaginar una lista de coches y precios. Todos los coches tienen una lista de características, por ejemplo, el tamaño del motor, el color, el caballo de potencia, modelo, año, etc. Para cada marca, algo como esto:
Ford:
V8, green, manual, 200hp, 2007, $200
V6, red, automatic, 140hp, 2010, $300
V6, blue, manual, 140hp, 2005, $100
...
Yendo aún más lejos, la lista de coches con precios que se publicó con algún intervalo de tiempo que significa que tenemos acceso al histórico de datos de precios. Puede que no siempre incluyen exactamente los mismos coches.
Problema
Me gustaría entender cómo el modelo de precios para cualquier coche basado en esta información de base, lo más importante es que los coches no en la lista inicial.
Ford, v6, red, automatic, 130hp, 2009
Por lo anterior coche, es casi lo mismo que uno en la lista, sólo ligeramente diferentes en caballos de potencia y año. El precio de este, lo que se necesita?
Lo que estoy buscando es algo práctico y sencillo, pero también me gustaría escuchar acerca de los enfoques más complejos como modelar algo como esto.
Lo he intentado
Aquí es lo que he estado experimentando hasta el momento:
1) el uso de datos históricos para la búsqueda de coche X. Si no se encuentra, no de precio. Esto por supuesto es muy limitada y sólo se puede usar en combinación con un poco de tiempo de decaimiento para alterar los precios para los coches a lo largo del tiempo.
2) el uso de un coche de la característica de sistema de ponderación junto con un precio de la muestra de autos. Básicamente, que hay una base de precio y las características de alterar que con algún factor. Basado en esto cualquier coche, el precio es de la que deriva.
La primera resultó ser insuficiente y la segunda resultó no ser siempre correcto y yo no hubiera tenido el mejor enfoque para el uso de los pesos. Esto también parece ser un poco pesado en el mantenimiento de pesos, así que por eso pensé que tal vez hay alguna manera de usar los datos históricos de la estadística en alguna manera de obtener los pesos o para obtener algo. Sólo que no sé por dónde empezar.
Alguna sugerencia de cómo un problema como este podría ser abordada? Todas las ideas son más que bienvenidos.
Muchas gracias de antemano y deseando leer vuestras sugerencias!
ACTUALIZACIÓN:
Muchas gracias por la sugerencias útiles hasta ahora!
Solo quiero añadir que como un principiante como yo, sería bueno considerar también los aspectos de lo que se necesita para preparar las cosas. ¿Qué acerca de los siguientes aspectos:
- integrarse en un proyecto de software que tengo. Ya sea mediante el uso de bibliotecas existentes o algoritmo de escritura de mí mismo.
- rápido recálculo cuando los nuevos datos históricos.