1 votos

¿Qué técnicas pueden utilizarse para determinar el grado de predicción de un conjunto de datos a partir de otro?

En concreto, tengo que determinar hasta qué punto los precios de algunas casas en un año pueden predecirse a partir de los precios de algunas casas en un año anterior. El conjunto de datos está dividido en casas de varios tipos. He hecho resúmenes numéricos de cada conjunto de datos en cada año y he hecho gráficos de cuantiles normales para cada tipo de casa en cada año, pero no sé muy bien a dónde ir. Cualquier ayuda o idea sobre por dónde empezar sería muy útil.

Edición: ¿Una forma de enfocar esto sería mostrar cuán similares o diferentes son las distribuciones de los precios de los años anteriores y posteriores? ¿Similar significa más fácil de predecir y diferente significa más difícil de predecir?

1voto

que que Puntos 1435

Sebastian Ruder tiene un trabajo sobre la medición de la distancia de los conjuntos de datos de su objetivo, utilizando la optimización bayesiana:

http://ruder.io/learning-select-data/

Papel: https://arxiv.org/abs/1707.05246 "Aprender a seleccionar datos para el aprendizaje de transferencia con la optimización bayesiana"

Primer par de párrafos de la entrada del blog anterior:

"En el aprendizaje automático, la suposición tradicional es que los datos a los que se aplica nuestro modelo son los mismos que los que utilizamos para el entrenamiento. Esta suposición se demuestra falsa en cuanto pasamos al mundo real: muchas de las fuentes de datos que encontremos serán muy diferentes a nuestros datos de entrenamiento originales (lo mismo significa aquí que proceden de la misma distribución). En la práctica, esto hace que el rendimiento de nuestro modelo se deteriore considerablemente.

"La adaptación al dominio es un enfoque destacado del aprendizaje por transferencia que puede ayudar a salvar esta discrepancia entre los datos de entrenamiento y los de prueba. Los métodos de adaptación de dominio suelen tratar de identificar características que se comparten entre los dominios o aprender representaciones que son lo suficientemente generales como para ser útiles para ambos dominios. En esta entrada del blog, hablaré de la motivación y los resultados del reciente artículo que he publicado con Barbara Planck. En él, esbozamos un enfoque complementario a la adaptación de dominios: en lugar de aprender un modelo que pueda adaptarse entre los dominios, aprenderemos a seleccionar datos que sean útiles para entrenar nuestro modelo."

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X