20 votos

Hoja de ruta para el aprendizaje del análisis de datos topológicos?

Soy un estudiante de matemáticas que se ha graduado recientemente y me será a partir de un trabajo a tiempo completo en el 'análisis de datos'.

Habiendo terminado con el trabajo decente marcas y sigue siendo increíblemente interesado en las matemáticas, yo estaba pensando de la prosecución de estudios de postgrado y/o investigación en algún momento en el futuro. Yo estaba leyendo acerca de las posibles áreas de estudio para este, cuando me encontré con topológico análisis de datos, que (según entiendo) es una aplicación de la topología algebraica para el análisis de datos.

Dada mi situación, yo estaba intrigado por el concepto y me gustaría hacer un poco de auto estudio para que yo pueda tener una comprensión de trabajo de la asignatura. Sólo he hecho básico de pregrado álgebra abstracta, el análisis y el punto de ajuste de la topología, y actualmente estoy leyendo Munkres' Topología (Capítulo 9 en adelante). ¿Cómo puedo llegar desde donde estoy ahora, para entender la teoría detrás de la TDA y ser capaz de aplicar?

Mis conocimientos sobre la ampliación de matemáticas está lejos de ser extensa y agradecería cualquier consejo sobre enlaces o textos que podría utilizar para aprender el material pertinente.

27voto

memorysticky Puntos 31

Antes de responder la pregunta que me gustaría discutir algunos puntos:

  1. Topológico de análisis de datos es aproximadamente, a medida que escribe, (algebraica) de la topología aplicada al estudio de los datos. Mientras que sin duda necesita aprender algunas de topología, el tipo de topología que usted debe aprender realmente depende del tipo de aplicaciones que usted está interesado en. Por esta razón no voy a dar una hoja de ruta, pero una sugerencia sobre cómo dibujar su propia hoja de ruta.
  2. Usted también no debe olvidar la segunda parte de la definición topológica de análisis de datos, es decir, que están estudiando los datos. Para esto sería bueno para aprender algunos datos generales sobre el análisis de los datos, y en particular de estadística (más sobre esto abajo). Para un estadístico del punto de vista topológico, análisis de datos, hay una bonita serie de columnas por Robert Adler en lo que él llama "TOPOS", disponible aquí.
  3. Usted tiene que saber sus datos. Esto podría ir sin decir, pero demasiado a menudo he visto a la gente que tira algún método en los datos para ver lo que sale de ella, sin siquiera preguntarse por qué se está utilizando ese método específico. Mientras que dependiendo de sus condiciones de trabajo puede ser más o menos tiempo para trabajar en un proyecto específico, creo que usted realmente debe tratar de asegurarse de que usted entiende los datos y el contexto de la mejor forma posible, incluso antes de empezar a pensar acerca del método que desea utilizar. Mientras que la topología proporciona una gran cantidad de diferentes métodos que pueden ser aplicados para el estudio de los datos, estos pueden no ser siempre las mejores herramientas a utilizar, y hay otras técnicas que se adaptan mejor. La línea de fondo es que no hay un método o conjunto de métodos que se adapta a todos los problemas.

Y aquí viene mi sugerencia de cómo dibujar su propia hoja de ruta:

  • Topología. Robert Ghrist del libro Elemental Aplicada de la Topología da una breve descripción de los principales métodos e ideas de la topología que se utiliza en las aplicaciones. Cada capítulo cubre un determinado tema en la topología y, a continuación, se dan ejemplos de las aplicaciones de estos. Mientras que hay otros textos aplicada a la topología que profundizar en más detalle desde el punto de vista matemático, yo sugeriría usar Ghrist del libro para tener una idea de las aplicaciones y un conjunto de ideas y, a continuación, dibuje su propia hoja de ruta de los temas que le gustaría cubrir desde allí. Dado que el texto es escueta, es posible que necesite utilizar también otros textos para aprender más sobre las matemáticas tratados en cada capítulo. Por ejemplo, para aprender más acerca de (suave) colectores (Capítulo 1), es posible que desee leer un poco más las cosas en Lee la Introducción a la suave colectores, o para aprender más acerca de Cohomology (Capítulo 6), es posible que desee consultar a Hatcher Topología Algebraica. De nuevo, no creo que existe una "talla única" respuesta a la que los textos se deben utilizar para esto, pero una vez que usted tiene una buena comprensión de qué es exactamente lo que le gustaría entender mejor, usted podría volver a pedir a la gente con más experiencia para el asesoramiento.
  • Estadísticas. Un libro que, de forma análoga a Ghrist del libro podría ayudar en el diseño de su propia hoja de ruta es Larry Wasserman de Todas las Estadísticas. También, tenga en cuenta que la aplicación de métodos estadísticos a las técnicas de análisis topológico de datos es un área activa de investigación, y si bien hay algunas bibliotecas y herramientas que pueden ser usadas para aplicaciones, esta zona está todavía en su infancia. He aquí la lista de las bibliotecas y las referencias pertinentes para herramientas estadísticas para el análisis topológico de datos, que yo sepa, en la parte superior de mi cabeza (estos son todos los relacionados con la homología persistente):

  • Los datos de la ciencia. Por último, como para la ciencia de datos más ampliamente, yo no conozco a ningún buen texto, pero usted puede tener una idea de algunos de los temas generales de la libreta de Problemas Matemáticos en Ciencia de Datos.


De lado: para terminar, doy algunas referencias adicionales a los libros/documentos y paquetes de software.

  1. Referencias topológicas de análisis de datos y computación de la topología:

    • Topología y datos, Carlsson

    • Computacional de la Topología, Edelsbrunner y Harer

    • Topología de la Informática, Zomorodian
    • La persistencia de la Teoría, Oudot (este podría ser demasiado específico, pero esto sería útil si usted desea aprender más acerca de la teoría detrás de la persistente homología)
    • Computacional de homología, Kaczynski, Mischaikow, Mrozek
  2. Bibliotecas de código abierto que aplicar algunos de los métodos de análisis topológico de datos:

    • Asignador De: Python Mapper
    • Persistente homología: algunos de los más recientes (y de mejor rendimiento) de las bibliotecas son Ripser , GUDHI, y DIPHA. Tenga en cuenta que también hay un resumen de las diferentes bibliotecas para la persistencia de la homología disponible aquí. (Descargo de responsabilidad: yo soy uno de los autores de este trabajo. También, la versión en el ArXiv es obsoleta, y que será sustituido por un up-to-fecha de la versión en las próximas semanas, por lo que podría ser mejor para ver esta vez que es actualizado).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X