Entiendo más o menos lo que significa "sobreajuste", pero necesito ayuda para encontrar un ejemplo del mundo real que se aplique al sobreajuste.
Respuestas
¿Demasiados anuncios?Aquí está un buen ejemplo de modelos de series temporales de elecciones presidenciales de xkcd:
Sólo ha habido 56 elecciones presidenciales y 43 presidentes. No son muchos datos de los que aprender. Cuando el espacio de predicción se amplía para incluir cosas como tener dientes postizos y el valor en puntos del Scrabble de los nombres, es bastante fácil que el modelo deje de ajustarse a las características generalizables de los datos (la señal) y empiece a coincidir con el ruido. Cuando esto ocurre, el ajuste de los datos históricos puede mejorar, pero el modelo fracasará estrepitosamente cuando se utilice para hacer inferencias sobre futuras elecciones presidenciales.
Mi favorito fue el ejemplo de Matlab sobre la población del censo de Estados Unidos en función del tiempo:
- Un modelo lineal es bastante bueno
- Un modelo cuadrático está más cerca
- Un modelo cuaternario predice la aniquilación total a partir del próximo año
(Al menos yo sinceramente esperanza este es un ejemplo de sobreajuste)
http://www.mathworks.com/help/curvefit/examples/polynomial-curve-fitting.html#zmw57dd0e115
En realidad, ha habido una tendencia a alejarse de los planos de tierra divididos y a concentrarse en la separación de la colocación Y en la consideración de la devuelve la ruta actual.
- No divida el plano de tierra, utilice un plano sólido bajo ambas secciones analógicas y digitales de la placa
- Utilizar planos de tierra de gran superficie planos de tierra para las vías de retorno de corriente de baja impedancia
- Mantenga más del 75% de la superficie para el plano de tierra
- Planos de potencia analógicos y digitales separados
- Utilice planos de tierra sólidos junto a los planos de potencia
- Localice todos los componentes y líneas componentes y líneas analógicas en el plano de potencia analógica y todos los componentes y líneas digitales en el plano de potencia digital
- No encamine No se debe pasar por encima de la división de los planos de potencia, a no ser que los trazos deban pasar por encima de los planos de potencia. pasar por la división del plano de potencia deben estar en capas adyacentes al plano de plano de tierra
- Piensa en dónde y cómo las corrientes de retorno a tierra fluyen realmente
- Divida su PCB con secciones analógicas y secciones digitales
- Colocar correctamente los componentes
Lista de comprobación del diseño de señal mixta
- Divida su PCB con secciones analógicas y digitales separadas.
- Coloque los componentes correctamente.
- A horcajadas de la partición con los convertidores A/D.
- No dividir el plano de tierra. Utilice un solo plano sólido bajo las secciones analógica y digital de la placa.
- Dirija las señales digitales sólo en la sección digital de la placa. Esto se aplica a todas las capas.
- Dirija las señales analógicas sólo en la sección analógica de la placa. Esto se aplica a todas las capas.
- Planos de potencia analógicos y digitales separados.
- No pase los cables por encima de la división de los planos de potencia.
- Las trazas que deben pasar por encima de la división del plano de potencia deben estar en capas adyacentes al plano de tierra sólido.
- Piensa en dónde y cómo fluyen realmente las corrientes de retorno a tierra.
- Utilice la disciplina de enrutamiento.
Recuerde que la clave de un diseño de PCB exitoso es la partición y el uso de la disciplina de enrutamiento, no el aislamiento de los planos de tierra. Casi siempre es mejor tener un solo plano de referencia (tierra) para su sistema.
(pegado de los siguientes enlaces para su archivo)
www.e2v.com/content/uploads/2014/09/Board-Layout.pdf
http://www.hottconsultants.com/pdf_files/june2001pcd_mixedsignal.pdf
En un Artículo del 14 de marzo de 2014 en Ciencia David Lazer, Ryan Kennedy, Gary King y Alessandro Vespignani identificaron problemas en Google Flu Trends que atribuyen al sobreajuste.
Así es como cuentan la historia, incluyendo su explicación de la naturaleza del sobreajuste y por qué causó el fracaso del algoritmo:
En febrero de 2013, ... Nature informó que la GFT predecía más del doble de la proporción de visitas al médico por enfermedades similares a la gripe (ILI) que los Centros para el Control y la Prevención de Enfermedades (CDC) ... . Esto ocurrió a pesar de que de que la GFT se creó para predecir los informes de los CDC informes de los CDC. ...
Esencialmente, la metodología fue encontrar las mejores coincidencias entre 50 millones términos de búsqueda que se ajustaran a 1152 puntos de datos. Las probabilidades de encontrar términos de búsqueda que que coincidan con la propensión de la gripe pero que sean estructuralmente estructuralmente no relacionados y que, por tanto, no predicen el futuro, eran bastante elevadas. Los desarrolladores de GFT, de hecho, informan de la eliminación de los términos de búsqueda estacional de búsqueda estacional no relacionados con la gripe pero fuertemente con los datos de los CDC, como los relativos al baloncesto de la escuela secundaria. Esto debería haber sido una advertencia de que los grandes datos eran el sobreajuste del pequeño número de casos -a preocupación habitual en el análisis de datos. Este método ad Este método ad hoc de descartar términos de búsqueda peculiares de búsqueda no funcionó cuando la GFT no la pandemia de gripe A-H1N1 de 2009, que no es estacional. no estacional de 2009.
[Énfasis añadido].