13 votos

Cómo empezar a leer acerca de la minería de datos?

Soy un novato que va a empezar a leer acerca de la minería de datos. Tengo conocimientos básicos de la IA y de la estadística. Ya que muchos dicen que el aprendizaje de la máquina también juega un papel importante en la minería de datos, es necesario leer acerca de la máquina de aprendizaje antes de que yo pudiera seguir con la minería de datos?

12voto

MGOwen Puntos 122

Ser algo en esta posición mí mismo, voy a intentar dar un poco de perspicacia.

En primer lugar, la descarga de los Elementos de Aprendizaje Estadístico. Además presume de cálculo y álgebra lineal, y aunque es muy técnico, pero también está muy bien escrito.

En segundo lugar (o primero) mira Andrew Ng tutoriales en el aprendizaje de máquina.

En tercer lugar, obtener algunos datos, y empezar a tratar de analizar los datos. Tendrás que dividir en conjuntos de pruebas y entrenamiento, y luego construir modelos en el conjunto de entrenamiento y de prueba en contra de la prueba de conjunto. He encontrado el símbolo de intercalación paquete de R muy útil para todos los de este. Después de que su práctica, práctica, práctica (como casi todo lo demás).

5voto

Dori Puntos 1325

Introducción a la Minería de Datos por Tan, Steinbech, Kumar es la mejor intro libro que hay

http://www.amazon.com/Introduction-Data-Mining-Pang-Ning-Tan/dp/0321321367

guardar EoSL para cuando desea profundizar. Es más de una referencia.

4voto

Monroecheeseman Puntos 825

La minería de datos puede ser descriptivo o predictivo.

Por un lado, si usted está interesado en los datos descriptivos de la minería, la máquina de aprendizaje no ayuda.

Por otro lado, si usted está interesado en predictivo, minería de datos, la máquina de aprendizaje le ayudará a entender que intenta minimizar el riesgo desconocido (expectativa de la función de pérdida) cuando la minimización de la parte empírica de riesgo: se tendrá en cuenta el sobreajuste, la generalización de errores y la validación cruzada. Por ejemplo, por una cuestión de coherencia, el $k$-NN para un entrenamiento de la muestra de tamaño $n$ debe ser tal que:

  • $k$ va al infinito al $n$ va al infinito,
  • $\frac{k}{n}$ 0 $n$ va al infinito.

2voto

Miroslav Sabo Puntos 1548

Yo sólo añadir otra muy buena fuente de tutoriales en la minería de datos/de la máquina de aprendizaje por Tom Mitchell.

Él lo explica muy claramente y también Se puede descargar a sus presentaciones desde su sitio web (junto con la observación de sus conferencias).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X