Como la cuestión es que todavía no respondió, aquí están mis 2ct:
Creo que aquí hay dos temas diferentes, mezclado en esta pregunta:
¿Cómo puedo calcular la sensibilidad y la especificidad (o análogo medidas) de una continua prueba de diagnóstico en la predicción de un resultado continuas (por ejemplo, presión arterial) sin dichotomizing el resultado?
Supongo que usted quiere medir el rendimiento del modelo. El modelo predice continua (métrica) resultado de algún tipo de entrada (pasa a ser métrica en tu ejemplo, pero que en realidad no importa aquí). Esto es una regresión escenario, no una clasificación. Así que es mejor mirar para las medidas de desempeño para los modelos de regresión, la sensibilidad y la especificidad son , no lo que usted está buscando*.
Algunos problemas de regresión tienen una forma "natural" de la agrupación en presencia y ausencia de algo, lo que da un enlace a la clasificación. Para que usted pueda tener una distribución bimodal: muchos de los casos con ausencia, y una métrica de la distribución de valores para los casos de presencia. Pensar, por ejemplo, de una sustancia que contamina el producto. Muchas de las muestras de producto que no contiene el contaminante, pero para aquellos que lo hacen, un rango de concentraciones que se observa.
Sin embargo, este no es el caso de tu ejemplo de la presión arterial (ausencia de la presión arterial no es un sensible concepto aquí). Incluso me imagino que la presión arterial vienen en una distribución unimodal. Todo esto apunta a un problema de regresión sin cerrar enlace a la clasificación.
* Con la salvedad de que ambas palabras se utilizan en química analítica para la regresión (calibración), pero con un significado diferente: allí, la sensibilidad es la pendiente de la calibración/función de regresión, y en específico, a veces, significa que el método es totalmente selectiva, que es insensible a otras sustancias que el analito, y no sensibilidades cruzadas ocurrir.
A. D. McNaught und A. Wilkinson, eds.: Compendio de Terminología Química (la
"Libro De Oro"). Blackwell Scientific, 1997. ISBN: 0-9678550-9-8. DOI: doi:10.1351/
goldbook. URL: http://goldbook.iupac.org/.
Análogos de la sensibilidad y la especificidad para el continuo de los resultados
Por otro lado, si la naturaleza subyacente del problema es una clasificación, sin embargo, puede encontrar usted mismo lo describe mejor mediante una regresión:
- la regresión describe un grado de pertenencia a las clases (como en conjuntos difusos).
- los modelos de regresión (posterior) probabilidad de beloning a las clases (como en la logística de regresión)
- sus casos puede ser descrito como mezclas de las clases puras (muy cerca de lo "normal" de la regresión, la contaminación del ejemplo anterior)
Para estos casos, tiene sentido para extender los conceptos detrás de la sensibilidad y la especificidad de un "continuo resultado clasificadores". La idea básica es que el peso de cada caso de acuerdo a su grado de pertenencia a la clase en cuestión. Para la sensibilidad y la especificidad que se refiere a la referencia de la etiqueta, para la predicción de los valores de la predicción de la clase de las membresías. Resulta que esto conduce a una vinculación muy cercana a la regresión de tipo de medidas de desempeño.
Recientemente hemos descrito en este
C. Beleites, R. Salzer y V. Sergo:
Validación de Suave Clasificación de los Modelos de uso Parcial de la Clase de Pertenencias: Un Concepto Extendido de la Sensibilidad & Co. aplicado a la Calificación de Astrocitoma Tejidos
Chemom. Intell. Lab. Syst., 122 (2013), 12 - 22.
El enlace apunta a la página de inicio del paquete de R la implementación de la propuesta de perfromance medidas.
De nuevo, la presión arterial ejemplo en mi humilde opinión es que no se describe adecuadamente como problema de clasificación. Sin embargo, usted puede desear leer el artículo, creo que la formulación de los valores de referencia que habrá de dejar en claro que la presión arterial no es sensatez describe de una manera que es adecuado para la clasificación.
(Si usted formular un continuo grado de "presión arterial alta" que podría ser en sí mismo un modelo, y otro diferente en el problema que usted describe.)
Yo tenía sólo un rápido vistazo al papel que enlaza, pero si he entendido correctamente a los autores el uso de umbrales (dividir) para ambas estrategias de modelado: para el continuo predicción es procesado: un intervalo de predicción se calcula y se compara a un cierto umbral. En la final, tienen una escala dicotómica de predicción, y generar la república de china por la variación de la especificación para el intervalo.
Como puede especificar que desea evitar esto, el papel no parece ser muy relevante.