Tengo un conjunto de datos con el siguiente formato.
Hay un resultado binario del cáncer o no cáncer. Cada médico en el conjunto de datos se ha visto cada paciente y da una opinión independiente sobre si el paciente tiene cáncer o no. Los médicos, a continuación, dar a su nivel de la confianza de los 5, que su diagnóstico es correcto, y el nivel de confianza se muestran en los soportes.
He probado varias maneras de obtener buenas previsiones de este conjunto de datos.
Funciona bastante bien para mí simplemente el promedio a través de los médicos, haciendo caso omiso de sus niveles de confianza. En la tabla de arriba que habría de producir correcto diagnóstico para el Paciente 1 y el Paciente 2, a pesar de que tendría incorrectamente dijo que el Paciente 3, tiene cáncer, ya que por un 2-1 mayoría de los médicos cree que el Paciente 3 tiene cáncer.
También probé con un método en el que tenemos al azar muestras de dos médicos, y si no están de acuerdo el uno con el otro, a continuación, el voto decisivo va a cualquier médico es más seguro. Ese método es económico, ya que no necesitamos consultar a un montón de médicos, pero también aumenta la tasa de error bastante.
He intentado un método en el que se selecciona aleatoriamente dos médicos, y si no están de acuerdo el uno con el otro se selecciona aleatoriamente dos más. Si uno es de diagnóstico por delante al menos dos 'votos', entonces podemos resolver las cosas en favor de ese diagnóstico. Si no, seguimos muestreo de más médicos. Este método es bastante económico y no comete muchos errores.
Yo no puedo dejar de sentir que me falta algo más sofisticada manera de hacer las cosas. Por ejemplo, me pregunto si hay alguna manera de que yo pudiera dividir el conjunto de datos en conjuntos de pruebas y entrenamiento, y el trabajo de alguna manera óptima para combinar los diagnósticos, y luego ver cómo esos pesos realizar en el conjunto de prueba. Una posibilidad es algún tipo de método que me permite restar importancia a los médicos que mantienen que los errores en el juicio, y tal vez upweight diagnósticos que se realizan con alta confianza (confianza no se correlacionan con exactitud en este conjunto de datos).
Tengo varios conjuntos de datos que coinciden con esta descripción general, por lo que el tamaño de la muestra varían, y no todos los conjuntos de datos se refieren a los médicos/pacientes. Sin embargo, en este particular conjunto de datos hay 40 médicos, que cada uno vio 108 pacientes.
EDIT: Aquí hay un enlace a algunos de los pesos que el resultado de mi lectura de @jeremy-millas de la respuesta.
No ponderada, los resultados se encuentran en la primera columna. De hecho en este conjunto de datos que el máximo valor de confianza fue de 4, no 5 como yo erróneamente se dijo anteriormente. Por lo tanto seguir a @jeremy-millas del enfoque de los más altos sin ponderar la puntuación de cualquier paciente podría obtener sería de 7. Eso significaría que, literalmente, cada médico afirmó con un nivel de confianza de 4 que el paciente tenía cáncer. El menor no ponderado puntaje cualquier paciente puede obtener es de 0, lo cual significa que cada médico afirmó con un nivel de confianza de 4 que el paciente no tiene cáncer.
Ponderación por los Alfa de Cronbach. He encontrado en SPSS que hubo un total Alfa de Cronbach de 0.9807. Traté de verificar que este valor era la correcta, el cálculo de Alfa de Cronbach de una forma más manual. He creado una matriz de covarianza de los 40 a los médicos, que me pegue aquí. A continuación, basado en mi entendimiento de la Alfa de Cronbach fórmula $\alpha = \frac{K}{K-1}\left(1-\frac{\sum \sigma^2_{x_i}}{\sigma^2_T}\right)$ donde $K$ es el número de elementos (aquí los médicos son los 'elementos') he calculado $\sum \sigma^2_{x_i}$ al sumar todos los elementos de la diagonal en la matriz de covarianza, y $\sigma^2_T$ al sumar todos los elementos de la matriz de covarianza. Luego me puse a $\alpha = \frac{40}{40-1}\left(1-\frac{8.7915}{200.7112}\right)=0.9807$ I luego se calcula el 40 tipos diferentes de Alfa de Cronbach de los resultados que se producen cuando cada médico fue quitada del conjunto de datos. Yo ponderado a cualquier médico que ha contribuido negativamente a la Alfa de Cronbach en cero. Se me ocurrió pesos para el resto de los médicos proporcional a su contribución positiva a la Alfa de Cronbach.
Ponderación por el Total de los elementos de las Correlaciones. Tengo que calcular el Total de todos los Elemento de Correlaciones y, a continuación, el peso de cada médico proporcional al tamaño de su correlación.
Ponderación por los Coeficientes de Regresión.
Una cosa que yo todavía no estoy seguro acerca de cómo decir cuál es el método de trabajo "mejor" que el otro. Anteriormente había sido el cálculo de cosas como la de Peirce Habilidad de Puntuación, el cual es adecuado para los casos en los que hay un binario y predicción de un resultado binario. Sin embargo, ahora tengo las previsiones oscilan de 0 a 7 en lugar de 0 a 1. Debo de convertir a todos los ponderada de las puntuaciones > 3.50 a 1, y el promedio ponderado de las puntuaciones < 3.50 a 0?