Supongo que tu pregunta lleva implícita no sólo "¿qué puedo hacer?", sino también "¿qué debo hacer?". La primera parte es relativamente fácil de responder, en parte porque hay muchas cosas que se pueden hacer. La segunda parte requiere que determine lo que tiene más sentido en su entorno.
Para asegurarme de que entiendo su pregunta, supongamos $Y^*_i$ es la dosis del analítico en individuo $i$ y $X_i$ es alguna otra variable. Usted observa los datos $(Y_i,X_i)_i$ para $i=1,\dots,n$ donde $Y_i = \min(Y^*_i,1000)$ . Para asegurarnos de que estamos de acuerdo en cuanto a la terminología, tiene a su disposición un problema de censura . En particular, no se trata de un problema de truncamiento, que a menudo se confunde con la censura (véase esta pregunta para más información )
Usted parece estar interesado en un modelo de regresión donde su variable dependiente está censurada, como es el caso cuando es $Y_i$ .
1. Lo que no debe hacer
Antes de discutir algunas opciones, me gustaría advertir fuertemente contra el enfoque sugerido en los primeros comentarios de su post, que implica simplemente asignar valores aleatorios a los que tienen $Y_i = 1000$ . Para ilustrar intuitivamente por qué esto es problemático, supongamos que $X_i$ es el género, y supongamos que todos los hombres tienen $Y_i = 1000$ (es decir $Y_i^* > 1000$ para todos los hombres) y todas las mujeres tienen $Y_i < 1000$ (es decir $Y_i^* < 1000$ para todas las mujeres). Si se imputan aleatoriamente $Y_i^* > 1000$ (datos masculinos) utilizando $Y_i^* < 1000$ (datos femeninos) y ejecutas una regresión, no encontrarás ningún efecto del género, ¡cuando es evidente que sí lo hay! Quizás se pregunte: "Bueno, ¿y si imputo condicional a $X_i$ ?" De nuevo, persiste el mismo problema: supongamos que los varones con $Y^*_i < 1000$ tienen $Y^*_i$ que son como las hembras, pero la mitad de los machos tienen $Y^*_i > 1000$ mientras que todas las mujeres tienen $Y^*_i < 1000$ . De nuevo, hay una clara diferencia entre hombres y mujeres, pero si se imputan todos los hombres por encima de $1000$ tener $Y^*_i$ como esos machos de abajo $1000$ concluirá erróneamente que no hay diferencia entre los sexos, ¡cuando lo que se espera es que sí la haya!
La lección aquí es que un problema de censura no debe resolverse mediante imputación, a menos que se tenga una muy buena razón para creer que sí se puede.
2. Qué puede querer hacer
Como ya habrás adivinado, lo que debas hacer dependerá en gran medida de tu configuración y de lo que consideres razonable. Como primer paso, siempre puedes fijarte en $(Y_i,X_i)$ para $Y_i \leq 1000$ . Una regresión con estos datos debería estar bien, excepto que ¡hay que tener muy clara la interpretación! Aunque el coeficiente sea el efecto de $X_i$ en $Y_i$ , aquí es que el efecto para aquellos con $Y^*_i \leq 1000$ . Que eso importe o no depende de su entorno. Dado que muchos tienen $Y^*_i > 1000$ tal vez no sea una pregunta interesante.
Una clase general de modelos de regresión de este tipo se denomina Modelos Tobit y le sugiero que consulte esa página. Para más información, consulte esta nota sobre modelos censurados . Estos modelos Tobit suelen suponer que $$Y^*_i = \beta X_i + \epsilon,$$ donde $\epsilon \perp \!\!\! \perp X$ y $\epsilon \sim N(0,1)$ . Este supuesto de normalidad también puede relajarse: véase la nota anterior para relajar esa cuestión utilizando el estimador CLAD de Powell.
Otro ámbito que quizá desee explorar es el de los análisis de supervivencia donde este problema es muy frecuente.