No estaba claro para mí si usted se pregunte específicamente para la investigación matemática de los problemas que tienen su origen en la llamada ciencia de datos. El problema es que este término es relativamente reciente. Sin embargo, la siguiente referencia despeja mis dudas acerca de mi respuesta de Topológico de Análisis de Datos como una válida.
Usted puede encontrar varios de revisión y trabajos de investigación sobre este tema en el sitio http://cunygc.appliedtopology.nyc/pages/reading.html. Una magra visión general se puede encontrar en Wikipedia.
Para resumir mi punto, aquí voy a citar de *BOLETÍN (Nueva Serie) DE LA
SOCIEDAD MATEMÁTICA AMERICANA Volumen 46, Número 2, abril de 2009, Páginas 255-308, por Gunnar Carlson -disponible en la página así: http://www.ams.org/journals/bull/2009-46-02/S0273-0979-09-01249-X/S0273-0979-09-01249-X.pdf
Una característica importante de la ciencia moderna y la ingeniería es que los datos de diversos tipos se está produciendo a un ritmo sin precedentes. Esto es así en parte debido a los nuevos métodos experimentales, y en parte debido al aumento en la disponibilidad de alta potencia de la tecnología de computación. También es claro que la naturaleza de los datos que estamos obteniendo es significativamente diferente. Por ejemplo, ahora es a menudo el caso en que se nos da en forma de datos muy largo vectores, donde todos, pero algunas de las coordenadas que resultan ser irrelevante para la pregunta de interés, y, además, que no necesariamente saben que las coordenadas son interesantes. Una relacionada con el hecho es que la información es a menudo muy alto-dimensional, que restringe severamente nuestra capacidad de visualizar. Los datos obtenidos también es a menudo mucho más ruidoso que en el pasado y tiene más información que falta (falta de datos). Esto es así especialmente en el caso de los datos biológicos, particularmente de alto rendimiento de datos de microarrays o de otras fuentes. Nuestra capacidad para analizar este tipo de datos, tanto en términos de cantidad y la naturaleza de los datos, está claro que no es mantener el ritmo con los datos que se producen. En este artículo, vamos a discutir cómo la geometría y la topología se puede aplicar para hacer contribuciones útiles para el análisis de los diversos tipos de datos.
Este documento tendrá que tratar con un número de métodos para pensar acerca de los datos utilizando topológicamente inspirado métodos. Comenzamos con una discusión de la persistencia de homología, que es un formalismo matemático que nos permite inferir topológica de la información a partir de una muestra de un objeto geométrico, y nos muestran cómo se puede aplicar a determinados conjuntos de datos de origen natural las estadísticas de la imagen y de la neurociencia. A continuación, nos muestran que topológico métodos puede producir un tipo de imagen de conjuntos de datos, no por la integración en el espacio Euclidiano, sino más bien por la producción de un complejo simplicial asociado a cierta información inicial sobre el conjunto de datos. A continuación, demuestran que la persistencia puede ser generalizada en varias direcciones diferentes, proporcionando más de la estructura y la información acerca de los conjuntos de datos en cuestión. A continuación mostramos que la filosofía de la functoriality puede ser utilizado para la razón sobre la naturaleza de los métodos de agrupamiento, y llegamos a la conclusión de especulando acerca de teoremas uno podría esperar para probar y hablar de cómo el sujeto puede desarrollar de manera más general.
Obviamente, este ejemplo no se agote en la investigación matemática temas relacionados con la y, especialmente, se originó en ciencia de datos. Por ejemplo, la búsqueda de Estadística de Aprendizaje debe rendir más ejemplos.