Supongamos que tengo unos datos continuos con el siguiente aspecto (se trata de un miniejemplo, no de mis datos reales):
X = [1.61247174986927 2.65691016769718 0.591138214153149
0.726195765274149 2.88156040072165 1.62455101313526
6.43225443007122 0.590263950142884 3.05416345831489
2.82441594177780 1.27093403949212 0.414863903556840
1.34369968006468 0.367816560010304 1.19023283647451
4.39095587146157 2.42508655542887 0.295173291557651
0.842110993459900 4.94140793763529],
Supongamos que tengo que ejecutar la regresión $Y_i=a+bX_i+cZ_i+e_i$ . Supongamos que necesito discretizar $X_i$ en sólo 4 valores, ¿cómo debo hacer la discretización para minimizar el impacto en la estimación de $\widehat{b}$ (por ejemplo, si $\widehat{b}$ es significativo en el marco de la $X_i$ el nuevo coeficiente frente al discretizado $X_i$ mejor que sea significativa), o vagamente, minimizar la pérdida de información.