Soy un novato que va a empezar a leer acerca de la minería de datos. Tengo conocimientos básicos de la IA y de la estadística. Ya que muchos dicen que el aprendizaje de la máquina también juega un papel importante en la minería de datos, es necesario leer acerca de la máquina de aprendizaje antes de que yo pudiera seguir con la minería de datos?
Respuestas
¿Demasiados anuncios?Ser algo en esta posición mí mismo, voy a intentar dar un poco de perspicacia.
En primer lugar, la descarga de los Elementos de Aprendizaje Estadístico. Además presume de cálculo y álgebra lineal, y aunque es muy técnico, pero también está muy bien escrito.
En segundo lugar (o primero) mira Andrew Ng tutoriales en el aprendizaje de máquina.
En tercer lugar, obtener algunos datos, y empezar a tratar de analizar los datos. Tendrás que dividir en conjuntos de pruebas y entrenamiento, y luego construir modelos en el conjunto de entrenamiento y de prueba en contra de la prueba de conjunto. He encontrado el símbolo de intercalación paquete de R muy útil para todos los de este. Después de que su práctica, práctica, práctica (como casi todo lo demás).
Introducción a la Minería de Datos por Tan, Steinbech, Kumar es la mejor intro libro que hay
http://www.amazon.com/Introduction-Data-Mining-Pang-Ning-Tan/dp/0321321367
guardar EoSL para cuando desea profundizar. Es más de una referencia.
La minería de datos puede ser descriptivo o predictivo.
Por un lado, si usted está interesado en los datos descriptivos de la minería, la máquina de aprendizaje no ayuda.
Por otro lado, si usted está interesado en predictivo, minería de datos, la máquina de aprendizaje le ayudará a entender que intenta minimizar el riesgo desconocido (expectativa de la función de pérdida) cuando la minimización de la parte empírica de riesgo: se tendrá en cuenta el sobreajuste, la generalización de errores y la validación cruzada. Por ejemplo, por una cuestión de coherencia, el $k$-NN para un entrenamiento de la muestra de tamaño $n$ debe ser tal que:
- $k$ va al infinito al $n$ va al infinito,
- $\frac{k}{n}$ 0 $n$ va al infinito.
Yo sólo añadir otra muy buena fuente de tutoriales en la minería de datos/de la máquina de aprendizaje por Tom Mitchell.
Él lo explica muy claramente y también Se puede descargar a sus presentaciones desde su sitio web (junto con la observación de sus conferencias).