Cuando leí acerca de cómo configurar sus datos, una cosa que muchas veces me he encontrado es que la transformación de algunos continua de datos en datos categóricos no es una buena idea, ya que puede muy bien hacer la equivocada conclusión de que si los umbrales son poco decidida.
Sin embargo, actualmente tengo algunos datos (valores de PSA para pacientes con cáncer de próstata), donde creo que el consenso general es que si usted está por debajo de 4 probablemente no la tienen, si están por encima de los que están en riesgo, y luego algo como por encima de 10 y 20, usted probablemente tiene. Algo como eso. En ese caso, ¿seguiría siendo incorrecto clasificar mi continua de los valores de PSA en los grupos de 0 a 4, de 4 a 10, y >10 ? O es realmente bueno ya que los umbrales son "determinados" por así decirlo.