38 votos

¿Cuál es la diferencia entre censura y truncamiento?

En el libro Modelos y métodos estadísticos para datos de vida Está escrito:

Censura: Cuando una observación es incompleta debido a alguna causa aleatoria.
Truncado: Cuando el carácter incompleto de la observación se debe a un proceso de selección sistemática inherente al diseño del estudio.

¿Qué se entiende por "proceso de selección sistemática inherente al diseño del estudio" en la definición de truncamiento?

¿Cuál es la diferencia entre censura y truncamiento?

4 votos

Eche un vistazo a la respuesta ici .

5 votos

Censura: "Hemos tenido una observación en esa región en algún lugar, pero no sabemos cuál es". Truncamiento: "¿Observación? ¿Qué observación?"

0 votos

¿De dónde proceden sus definiciones?

66voto

phloopy Puntos 4285

Las definiciones varían, y a veces los dos términos se utilizan indistintamente. Intentaré explicar los usos más comunes utilizando el siguiente conjunto de datos: $$ 1\qquad 1.25\qquad 2\qquad 4 \qquad 5$$

[Censura](http://en.wikipedia.org/wiki/Censoring%28statistics%29) :_ algunas observaciones estarán censuradas, lo que significa que sólo sabemos que están por debajo (o por encima) de algún límite. Esto puede ocurrir, por ejemplo, si medimos la concentración de una sustancia química en una muestra de agua. Si la concentración es demasiado baja, el equipo del laboratorio no puede detectar la presencia de la sustancia química. Sin embargo, puede seguir estando presente, por lo que sólo sabemos que la concentración está por debajo del límite de detección del laboratorio.

Si el límite de detección es 1,5, de modo que las observaciones que caen por debajo de este límite se censuran, nuestro conjunto de datos de ejemplo pasaría a ser: $$ <1.5\qquad <1.5\qquad 2\qquad 4 \qquad 5,$$ es decir, no conocemos los valores reales de las dos primeras observaciones, sino sólo que son menores que 1,5.

[Truncado](http://en.wikipedia.org/wiki/Truncation%28statistics%29) :_ el proceso que genera los datos es tal que sólo es posible observar resultados por encima (o por debajo) del límite de truncamiento. Esto puede ocurrir, por ejemplo, si las mediciones se realizan con un detector que sólo se activa si las señales que detecta están por encima de un determinado límite. Es posible que haya muchas señales débiles, pero nunca podremos saberlo con este detector.

Si el límite de truncamiento es 1,5, nuestro conjunto de datos de ejemplo sería $$2\qquad 4 \qquad 5$$ y no sabríamos que, de hecho, hubo dos señales que no se registraron.

0 votos

Entonces, en este uso de los términos, "censurado" es engañoso si pensamos en términos de los usos no técnicos de la palabra es decir, en este sentido estadístico, significa algo así como "vago" o "que sólo se sabe que entra dentro de cierto rango", y no en algo parecido al sentido no técnico es decir, suprimido o retirado, como cuando se retira un libro de las tiendas por su contenido.

4 votos

Para poner un ejemplo concreto de truncamiento, las compañías de seguros de automóviles nunca se enteran de los accidentes en los que los daños son inferiores a la franquicia, porque la gente no los denuncia. Se trata de un truncamiento por la izquierda; nunca se tienen datos de estos siniestros. Como ejemplo de censura a la derecha, cuando un paciente enfermo decide dejar de ver a su médico o se traslada a otra ciudad, lo único que se sabe es que estaba vivo el día que se fue, pero no sabemos cuándo murió.

0 votos

@Mars: Estoy de acuerdo en que suena al revés del uso moderno no técnico, en el que "censurar" es eliminar todo rastro, y "truncar" es eliminar detalles. Pero en estadística, "censurar" se utiliza en el sentido no técnico más antiguo, en el que un censor puede eliminar pero no suprimir cualquier rastro de algo: cajas negras o desenfoques colocados sobre partes ofensivas de una foto o un vídeo, pitidos que cubren blasfemias en la radio, o cartas de soldados a casa o publicaciones de documentos clasificados en las que las partes censuradas (término más moderno "redactadas") están tachadas.

4voto

Juan Besa Puntos 793

Como perspectiva desde otro campo (la programación), censurar y truncar son dos operaciones distintas.

Cuando trabaje con un conjunto de datos sensibles, por ejemplo, números de la seguridad social y números de teléfono, podría censor o tenerlo censurado antes de conceder el acceso:

123-12-1234 => 999-99-9999
567-56-5678 => 999-99-9999
(906) 123-4567 => (000) 000-0000

Esto permite que el resto de la aplicación funcione como lo haría normalmente, con estructuras de datos similares, pero sin contenido informativo real ni difusión de información privada.

El truncamiento, por el contrario, suele consistir en cortar los valores restantes a partir de un determinado punto. Para trabajar en una aplicación, no necesito cientos de miles de registros, tal vez sólo necesito ~50 de cada uno, lo que hace que el acceso a los datos sea mucho más rápido y los conjuntos de datos más pequeños.

Una variante similar de truncamiento es cuando se inserta un valor en una columna o tipo de datos de longitud o precisión limitada:

abcdefghijklmnopqrstuv => abcdef
10.23412421345 => 10.23
10.92455311 => 10

1 votos

+1 ¡Es importante saber que censurar y truncar pueden tener significados completamente distintos fuera de la estadística!

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X