5 votos

¿Hay problemas matemáticos 'serios' que surgen de la ciencia de datos?

¿Hay algún problema apropiado de matemáticas a nivel de investigación que haya surgido de la actividad conocida como "ciencia de datos"?

Pongo las citas porque realmente no está tan claro qué es para mí la "ciencia de los datos"; Soy un sketpic de ciencia de datos si quieres.

4voto

huda Puntos 309

Sin exageración alguna, que cada solución a cualquier problema fundamental de la ciencia de datos es en realidad un grave problema matemático debido a que estas soluciones se ponen en práctica en la vida real uso en las industrias donde las apuestas están en el orden de millones y miles de millones de dólares. Así que las apuestas son mucho más altos que la investigación por el puro propósito académico. Veamos algunos ejemplos de.

Enunciado del problema: en Una terminal de aeropuerto tiene muchas gradas o puerta donde entra una aeronave puede ser desembarcado y se estacionó. En un momento dado, que de estas puertas es mi mejor parque de la entrada de una aeronave?

Voy a publicar el enfoque de solución más tarde (estoy preparando), pero me gustaría indicar que este aspecto sencillo problema de esto es realmente un muy complicado problema de optimización en la aviación, que ha tomado las principales líneas aéreas años para resolver y que cuestan varios millones de dólares y sólo han logrado una solución parcial. La complicación es porque de los cientos de factores prácticos relacionados con la aviación comercial que una aerolínea se ha de considerar para llegar a una solución, debido a que el número de soluciones a partir de la cual puede buscar la mejor opción es más que el número de átomos en el universo conocido.

4voto

No estaba claro para mí si usted se pregunte específicamente para la investigación matemática de los problemas que tienen su origen en la llamada ciencia de datos. El problema es que este término es relativamente reciente. Sin embargo, la siguiente referencia despeja mis dudas acerca de mi respuesta de Topológico de Análisis de Datos como una válida.

Usted puede encontrar varios de revisión y trabajos de investigación sobre este tema en el sitio http://cunygc.appliedtopology.nyc/pages/reading.html. Una magra visión general se puede encontrar en Wikipedia.

Para resumir mi punto, aquí voy a citar de *BOLETÍN (Nueva Serie) DE LA SOCIEDAD MATEMÁTICA AMERICANA Volumen 46, Número 2, abril de 2009, Páginas 255-308, por Gunnar Carlson -disponible en la página así: http://www.ams.org/journals/bull/2009-46-02/S0273-0979-09-01249-X/S0273-0979-09-01249-X.pdf

Una característica importante de la ciencia moderna y la ingeniería es que los datos de diversos tipos se está produciendo a un ritmo sin precedentes. Esto es así en parte debido a los nuevos métodos experimentales, y en parte debido al aumento en la disponibilidad de alta potencia de la tecnología de computación. También es claro que la naturaleza de los datos que estamos obteniendo es significativamente diferente. Por ejemplo, ahora es a menudo el caso en que se nos da en forma de datos muy largo vectores, donde todos, pero algunas de las coordenadas que resultan ser irrelevante para la pregunta de interés, y, además, que no necesariamente saben que las coordenadas son interesantes. Una relacionada con el hecho es que la información es a menudo muy alto-dimensional, que restringe severamente nuestra capacidad de visualizar. Los datos obtenidos también es a menudo mucho más ruidoso que en el pasado y tiene más información que falta (falta de datos). Esto es así especialmente en el caso de los datos biológicos, particularmente de alto rendimiento de datos de microarrays o de otras fuentes. Nuestra capacidad para analizar este tipo de datos, tanto en términos de cantidad y la naturaleza de los datos, está claro que no es mantener el ritmo con los datos que se producen. En este artículo, vamos a discutir cómo la geometría y la topología se puede aplicar para hacer contribuciones útiles para el análisis de los diversos tipos de datos.

Este documento tendrá que tratar con un número de métodos para pensar acerca de los datos utilizando topológicamente inspirado métodos. Comenzamos con una discusión de la persistencia de homología, que es un formalismo matemático que nos permite inferir topológica de la información a partir de una muestra de un objeto geométrico, y nos muestran cómo se puede aplicar a determinados conjuntos de datos de origen natural las estadísticas de la imagen y de la neurociencia. A continuación, nos muestran que topológico métodos puede producir un tipo de imagen de conjuntos de datos, no por la integración en el espacio Euclidiano, sino más bien por la producción de un complejo simplicial asociado a cierta información inicial sobre el conjunto de datos. A continuación, demuestran que la persistencia puede ser generalizada en varias direcciones diferentes, proporcionando más de la estructura y la información acerca de los conjuntos de datos en cuestión. A continuación mostramos que la filosofía de la functoriality puede ser utilizado para la razón sobre la naturaleza de los métodos de agrupamiento, y llegamos a la conclusión de especulando acerca de teoremas uno podría esperar para probar y hablar de cómo el sujeto puede desarrollar de manera más general.

Obviamente, este ejemplo no se agote en la investigación matemática temas relacionados con la y, especialmente, se originó en ciencia de datos. Por ejemplo, la búsqueda de Estadística de Aprendizaje debe rendir más ejemplos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X