Estoy utilizando el scikit-learn para realizar la regresión. Sin embargo, en mi caso necesito que la variable dependiente esté restringida en el rango de 0 a 1. La variable dependiente representa proporciones de recuento (recuentos en alguna categoría divididos por un recuento total) y no es continuo. Puedo ver dos maneras de lograr esto.
- Transformar la variable dependiente a la recta completa de los números reales y realizar una regresión normal.
- Transforme el problema de regresión en uno categórico seleccionando n clases, cada una de las cuales representa el rango (i/n) a (i+1/n).
Mi opinión es que la primera opción no funcionaría bien en la práctica y la segunda parece una fea chapuza (que podría funcionar).
¿Cuál es una buena manera de restringir la variable dependiente en la regresión (en Python)?
Regresión para un resultado (ratio o fracción) entre 0 y 1 sugirió utilizar la regresión Beta, pero no entiendo bien esta opción. ¿Podría alguien explicar qué es la regresión Beta en detalle técnico para aquellos que no usan R?