No puedo correr con los perros grandes de estadísticas que han contestado antes que yo, y tal vez mi forma de pensar es ingenuo, pero yo lo veo de esta manera...
Imagínese que usted está en un coche y vas por la carretera y girar el volante a izquierda y derecha y presionando el pedal del acelerador y los frenos frenéticamente. Sin embargo, el coche se mueve a lo largo sin problemas, se ve afectada por sus acciones. Usted sería inmediatamente la sospecha de que usted no estuviera en un coche real, y tal vez si miramos de cerca nos gustaría determinar que usted está en un viaje en el Mundo de Disney. (Si usted está en un coche real, usted estaría en peligro mortal, pero no vamos a ir allí.)
Por otro lado, si usted estaba manejando por la carretera en un coche y girar el volante ligeramente a la izquierda o a la derecha inmediatamente se tradujo en el coche en movimiento, cinta adhesiva los frenos se tradujo en una fuerte desaceleración, mientras se presiona el pedal del acelerador se tiró de nuevo en el asiento. Usted puede sospechar que estaban en un coche deportivo de altas prestaciones.
En general, usted probablemente experimentar algo entre esos dos extremos. El grado en que las variables de entrada (dirección, frenos, gas) afectan directamente el movimiento del auto da una pista acerca de la calidad del coche. Que es, la más de su coche de la varianza en movimiento que está relacionada con sus acciones el mejor el coche, y más que el coche se mueve independientemente de su control la peor del auto.
En una manera similar, usted está hablando acerca de la creación de un modelo para algunas de datos (vamos a llamar a este tipo de datos $y$), basado en algunos otros conjuntos de datos (vamos a llamarlos $x_1, x_2, ..., x_i$). Si $y$ no variar, es como un coche que no se mueve y no hay realmente ningún punto en la discusión de si el coche (modelo) funciona bien o no, así que vamos a suponer $y$ hace variar.
Así como un automóvil, un buen modelo de calidad va a tener una buena relación entre los resultados de la $y$ diferentes y las entradas $x_i$ variable. A diferencia de un coche, el $x_i$ no necesariamente causan $y$ a cambio, pero si el modelo va a ser útil la $x_i$ necesidad de cambio en una relación cercana a $y$. En otras palabras, el $x_i$ explicar parte de la varianza en $y$.
P. S. yo no era capaz de llegar con un Winnie The Pooh analogía, pero he intentado.
P. P. S. [MODIFICAR:] tenga en cuenta que estoy a abordar esta cuestión en particular. No debe confundirse en el pensamiento de que si tienes en cuenta el 100% de la varianza en el modelo funcionará de maravilla. Usted también necesita pensar más ajustada, donde su modelo es tan flexible que se ajusta a los datos de entrenamiento muy de cerca -- incluyendo sus aleatorio peculiaridades y rarezas. Para usar la analogía, usted quiere un coche que tiene una buena dirección y los frenos, pero queremos que funcione bien en el camino, no sólo en la pista de prueba de que usted está utilizando.