Este tipo de datos es a menudo llamado cuantificada, especialmente cuando los números de precisión está limitada por el dispositivo de medición. Por ejemplo, una escala sólo puede mostrar números enteros de gramos o libras. Esto es particularmente común cuando una señal analógica (desde un micrófono, medidor de tensión, etc) se digitaliza. El error resultante (por ejemplo, la diferencia entre 0.012 y 0 para el primer punto de datos) se llama error de cuantización. También se podría llamar de redondeo o de discretización, aunque débilmente implica que se ha hecho durante el post-procesamiento.
El truncamiento también trabaja aquí, pero hay que distinguir entre la truncar el rango de las observaciones (por ejemplo, la conversión de cualquier cosa por encima de 10 en 10, o por debajo de los 0 a 0) y truncar los valores de las observaciones individuales.
No estoy al tanto de una manera robusta detectar la cuantización en cualquier situación. De hecho, casi todos los datos es cuantificada en cierta medida, y la cantidad de quanitization es a menudo conocido antes de tiempo desde el dispositivo de medición de las especificaciones. Sin embargo, hay algunas heurísticas que puedes intentar:
Cuántos valores tienen? Digital-a-analógico convertidores de utilizar un número fijo de bits (generalmente de 8, 12, 16 o 24), que le da $2^8, 2^{12}, 2^{16}$ o $2^{24}$ único valores, y estos valores son a menudo igualmente espaciados entre el valor máximo y el mínimo.
Hay una constante del tamaño de paso entre los valores. En otras palabras, ordenar, tirar de los duplicados, y ver si el vecino valores aumentan en la misma cantidad.
Aún así, creo que sería mejor preguntar acerca de cómo los datos se ha generado para comenzar con.
Si los datos son "ligeramente" cuantificada, por lo general no es un problema. Por ejemplo, no me preocuparía demasiado si mi sujetos humanos' pesos se registraron en (entero) libras o kilogramos. Si los datos están fuertemente cuantificada, se puede tratar como intervalo de censura de datos. Esto es particularmente común en los análisis de supervivencia, donde sólo se puede comprobar para ver si la vida de alguien o algo está funcionando en algún intervalo fijo (por ejemplo, inspecciones semanales de una fábrica). Búsqueda por intervalo de regresión si esto se ajusta a su situación.
Usted debe estar seguro de comprender la hipótesis nula subyacentes a las pruebas que se ejecutan en binned de datos. Por ejemplo, los datos distribuidos de manera uniforme a través de 10 bandejas es muy diferente de la de datos distribuidos de manera uniforme en toda la gama.