4 votos

¿Qué algoritmo debo usar?

Estuve leyendo muchos de aprendizaje de máquina preguntas como esta uno pero no estoy seguro de cómo aplicar a mi escenario. Yo vengo de una biología/medicina de fondo, y mis matemáticas conocimiento es limitado (última cosa que aprendí fue el cálculo de hace mucho tiempo), y algunas de las explicaciones en este sitio ir por encima de mi cabeza.

El problema

Supongamos que alguien está rellenando los formularios de todos los días. El formulario contiene varios campos (información del paciente, la historia clínica, el trabajo, etc.) Ahora supongamos que hay n pacientes que ingresan al hospital cada día (de modo que un mínimo de n formularios que se llenan cada día, cada vez que llegan). Algunas partes de la forma nunca puede cambiar (por ejemplo, género, raza, etc. como un ejemplo), pero algunas partes (por ejemplo, la historia clínica, examen, etc). Ahora necesito escribir un programa que "aprende" a partir de estos datos para que pueda anticipar cuando el paciente es probable que lleguen de nuevo, entonces la necesidad de determinar si la forma es probable que el cambio basado en la frecuencia con que cambia en el pasado, y si el "importante" partes (como la historia clínica), es poco probable que cambie, entonces la necesidad de generar un formulario en la anticipación del evento.

Cosas que he considerado

Con lo limitado conocimiento que tengo, me imagino que necesitas para calcular algún tipo de varianza para determinar cómo diferentes cada formulario de otras formas de cada paciente. Entonces pensé que había que empujar a los datos a través de algún supervisión de aprendizaje 'cosa' para detectar si hay algún tipo de patrón existe para los pacientes de llegadas, y si lo hace, entonces puedo utilizar los últimos datos sobre la varianza para determinar si un formulario debe ser generado por adelantado.

Así que, supongo que voy a necesitar varios algoritmos diferentes para cada parte de la pregunta), y he mirado en Naive Bayes, la Regresión Logística, Árboles de Decisión, y SVMs, pero me golpeé la cabeza en matemáticas complejas y casi sufrió un aneurisma (broma)... Para empezar esta búsqueda, que modelo/algoritmo debo comenzar con, y por qué funciona bien para este escenario sobre los demás? Agradecería una más prolijo (menos de matemáticas) respuesta.

4voto

Marc Claesen Puntos 9818

Esta es una buena pregunta, pero no muy concentrado, por lo que será imposible ir en cada uno de los aspectos en profundidad. Como consejo general: iniciar con modelos simples, por ejemplo, lineal, como glm, regresión logística lineal de la SVM. Estos son bastante sencillas de entender, rápido para entrenar y normalmente vienen con menos campanas y silbatos (= dolores de cabeza) que los no lineales equivalentes.

Una pregunta importante a responder antes de decidir sobre un método, es si usted sólo la atención acerca de las predicciones o si se quiere entender. Esto es esencialmente una elección entre la caja blanca modelos que son interpretables (como la regresión logística) o la caja negra de los modelos que están diseñados para ofrecer una mejor predicción del rendimiento, pero sin ser fácilmente interpretables. La mayoría de las personas con un historial médico desea caja blanca modelos, pero su utilidad depende totalmente de la tarea a la mano. Basado en su pregunta, que parecen centrarse en hacer predicciones exactas.

Un aspecto importante de la construcción de cualquier modelo es tener suficiente de datos de suficiente calidad. Algunas de las cosas que usted quiere hacer requieren una gran cantidad de datos. Por ejemplo, si desea predecir cómo las formas de cambio para un paciente determinado, esto es, inevitablemente, aprendidas basadas en visto anteriormente pacientes similares. Si desea predecir los cambios detallados esto será difícil y requeriría miles de pacientes (ya que se necesita tener bastante similares a aprender patrones subyacentes). Otra cuestión es si o no usted puede razonablemente hacer ese tipo de predicciones, por ejemplo, ¿la historia médica de proporcionar la suficiente visión para proyectar lo que sucederá en el futuro? Esto probablemente sería posible en algunos casos muy específicos (por ejemplo, un diabético que se desarrolla cuestiones cardiovasculares), pero no en general.

Como una introducción rápida, algunas palabras clave que pueden ser útiles:

  1. Si desea predecir algunos de los discretos resultados con un número finito de valores, que se ocupan de la clasificación. Normalmente, los métodos de acuerdo con la clasificación binaria (2 clases), pero se puede extender a más de dos.

  2. Si desea predecir algunos continuo resultado, usted está haciendo la regresión. Por ejemplo, la predicción del tiempo antes de que el paciente regrese.

  3. Si sólo desea obtener algún tipo de estructura dentro de los datos, que están haciendo de la agrupación. Por ejemplo, hacer grupos de pacientes similares existen? (no uno específico de los pacientes, pero en todos los datos)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X