56 votos

¿Es incorrecto reformular "1 de cada 80 muertes está causada por un accidente de tráfico" como "1 de cada 80 personas muere como consecuencia de un accidente de tráfico"?

  • Declaración Uno (S1): "Una de cada 80 muertes está causada por un accidente de tráfico".
  • Declaración dos (S2): "Una de cada 80 personas muere como consecuencia de un accidente de tráfico".

Ahora bien, personalmente no veo mucha diferencia entre estas dos afirmaciones. Al escribir, las consideraría intercambiables para un público no especializado. Sin embargo, dos personas me han preguntado sobre esto y estoy buscando una perspectiva adicional.

Mi interpretación por defecto de S2 es: "De 80 personas extraídas uniformemente al azar de la población humana, esperaríamos que una de ellas muriera como resultado de un accidente de coche", y considero que esta afirmación cualificada es equivalente a S1.

Mis preguntas son las siguientes:

  • P1) ¿Es mi interpretación por defecto realmente equivalente a la afirmación uno?

  • P2) ¿Es inusual o imprudente que esta sea mi interpretación por defecto?

  • P3) Si cree que S1 y S2 son diferentes, de manera que afirmar lo segundo cuando se quiere decir lo primero es engañoso/incorrecto, ¿podría proporcionar una revisión completa de S2 que sea equivalente?

Dejemos de lado la obvia objeción de que el S1 no se refiere específicamente a las muertes humanas y asumamos que eso se entiende en el contexto. Dejemos también a un lado cualquier discusión sobre la veracidad de la propia afirmación: pretende ser ilustrativa.

Por lo que sé, los desacuerdos que he oído hasta ahora parecen centrarse en la interpretación por defecto de la primera y la segunda declaración.

Para la primera, mis retadores parecen interpretarla como 1/80 * num_deaths = número de muertes causadas por accidentes de coche, pero por alguna razón, por defecto a una interpretación diferente de la segunda a lo largo de las líneas de, "si usted tiene cualquier conjunto de 80 personas, uno de ellos se morir en un accidente de coche" (que obviamente no es una afirmación equivalente). Yo pensaría que, dada su interpretación de la S1, su valor por defecto para la S2 sería leerla como (1/80 * num_dead_people = número de personas que murieron en un accidente de coche == número de muertes causadas por un accidente de coche). No estoy seguro de por qué la discrepancia en la interpretación (su valor por defecto para S2 es una suposición mucho más fuerte), o si tienen algún sentido estadístico innato del que yo carezco.

19 votos

"si tienes cualquier conjunto de 80 personas, una de ellas morirá en un accidente de coche" - si es así como entienden esa afirmación, entonces tengo un chiste muy viejo sobre que 1 de cada 3 niños es chino que van a amor .

3 votos

Esto es muy similar a la diferencia entre prevalencia e incidencia . Como han señalado otros, "es causado" se refiere a un estado acabado, y "muere" se refiere al presente o al futuro.

0 votos

Y ya que estamos dividiendo los pelos, podrías tener un ataque al corazón mientras en un accidente de coche en el que no hay heridos.

81voto

Brent Hutto Puntos 18

Para mí, "1 de cada 80 muertes..." es, con mucho, la afirmación más clara. El denominador en su "1 de cada 80" es el conjunto de todos los eventos de muerte y esa afirmación lo hace explícito.

Hay una ambigüedad en la formulación "1 de cada 80 personas...". Realmente quieres decir "1 de cada 80 personas que muere...", pero la afirmación puede interpretarse con la misma facilidad como "1 de cada 80 personas que ahora están vivas..." o algo similar.

Estoy a favor de ser explícito sobre el conjunto de referencias en afirmaciones de probabilidad o frecuencia como ésta. Si estás hablando de la proporción de muertes, entonces di "muertes" no "personas".

31 votos

"1 de cada 80 personas que muere..." - dado que no existe la inmortalidad, podemos asumir con seguridad que el conjunto de personas que morirán es el mismo conjunto que todas las personas. Se necesitaría un calificador adicional, por ejemplo, "personas que morirán el próximo año "

17 votos

@Msalters Las declaraciones están en tiempo presente, por lo que afirman una afirmación sobre la tasa actual.

6 votos

Técnicamente, creo que "1 de cada 80 personas" es más específico, porque hay muchas más muertes que las de personas: muertes de pájaros, muertes de bacterias, muertes de pedantería, ...

67voto

cbeleites Puntos 12461

En primer lugar, mi primer pensamiento intuitivo fue: "S2 sólo puede ser igual que S1 si la tasa de mortalidad por tráfico se mantiene constante, posiblemente a lo largo de décadas", lo que ciertamente no habría sido una buena suposición en las últimas décadas. Esto ya deja entrever que una de las dificultades radica en las suposiciones temporales implícitas/no explícitas.

Yo diría que sus declaraciones tienen la forma

1 en $x$ $population$ experiencia $event$ .

En S1, la población son muertes, y la especificación temporal implícita es en la actualidad o "en un marco temporal adecuadamente amplio [para tener un número suficiente de casos] pero no demasiado amplio [para tener unas características de los accidentes de tráfico aproximadamente constantes] en torno al presente"

En S2, la población son personas. Y otros parecen leerlo no como "gente moribunda", sino como "gente viva" (que al fin y al cabo es lo que la gente hace con más frecuencia/duración). Si se lee la población como personas vivas, está claro que no una de cada 80 personas que viven ahora muere "ahora" de un accidente de coche. Así que se lee como "cuando se están muriendo [posiblemente dentro de décadas], la causa de la muerte es el accidente de coche".

Mensaje para llevar a casa: siempre hay que tener cuidado con la población y con el denominador de las fracciones en general. (Gerd Gigerenzer ha publicado un artículo en el que señala que no deletrear el denominador es una de las principales causas de confusión, sobre todo en las estadísticas y la comunicación de riesgos).

1 votos

"En S1, la población son las muertes, y la especificación temporal implícita es en el presente o "en un marco temporal adecuadamente amplio [para tener un número suficiente de casos] pero no demasiado amplio [para tener unas características de los accidentes de tráfico aproximadamente constantes] en torno al presente"- Al considerar todas las (maravillosas) respuestas que he recibido, creo que ésta es la que más da en el clavo. Me ha sorprendido doblemente la enorme variedad de formas en que la gente puede la segunda afirmación, y muchos me han abierto los ojos a esas interpretaciones, pero esta es la especificación estadística que le faltaba a mi afirmación original.

0 votos

Faulty_ram_sticks: Gracias por las flores :-) Y estas dos posibles especificaciones de población que hice a partir de S2 no son ni mucho menos las únicas, por ejemplo, se podría especificar en la línea de la respuesta de @PeterShor una población de personas nacidas en algún momento y seguir a esa (longitudinalmente). Y así sucesivamente.

0 votos

@cbeleites ¿flores? ¿qué flores? :-/

42voto

Benjamin Manns Puntos 3689

Depende de si usted es describiendo o predicción de .

"1 de cada 80 personas morirá en un accidente de coche" es un predicción. De todas las personas vivas hoy, en algún momento de su vida restante, una de cada 80 morirá así.

"1 de cada 80 muertes son causadas por un accidente de coche" es un descripción. De todas las personas que murieron en un periodo determinado (por ejemplo, el periodo de tiempo de un estudio de apoyo), 1 de cada 80 murió efectivamente en un accidente de tráfico.

Tenga en cuenta que la ventana de tiempo aquí es ambigua. Una frase implica que las muertes ya han ocurrido; la otra implica que ocurrirán algún día. Una frase implica que la población de referencia es gente que ha muerto (y que estaba viva antes); la otra implica una población de referencia de gente que está viva hoy (y que morirá en algún momento).

En realidad, se trata de afirmaciones totalmente diferentes, y probablemente sólo una de ellas esté respaldada por sus datos de origen.

Por otra parte, la ambigüedad se debe a un desajuste entre el estado de ser una persona (que ocurre continuamente) y la evento de morir (lo que ocurre en un momento dado). Siempre que se combinan las cosas de esta manera se obtiene algo que es igualmente ambiguo. Puedes resolver instantáneamente la ambigüedad utilizando dos eventos en lugar de un estado y un evento; por ejemplo, "De cada 80 personas que nacen, 1 muere en un accidente de coche".

1 votos

Además de ser una predicción, podría interpretarse extrañamente como una amenaza. Leer esta respuesta me hizo pensar en el xkcd correspondiente .

4 votos

"Hoy en día, una de cada 80 muertes está causada por un accidente de tráfico. Pero dada la rápida mejora de la tecnología de los vehículos y las carreteras, y el cambio gradual a otros modos de transporte, esperamos que esta cifra se reduzca a una de cada 120 en el año 2050, y a una de cada 150 en el 2100. En consecuencia, de las personas que viven hoy, sólo una de cada 135 morirá en un accidente de tráfico".

21voto

Jeff Handley Puntos 1907

Las dos afirmaciones son diferentes debido al sesgo de muestreo, ya que es más probable que los accidentes de coche ocurran cuando la gente es joven.

Concretemos esto planteando un escenario poco realista.

Considere las dos afirmaciones:

  • La mitad de las muertes se deben a un accidente de tráfico.
  • La mitad de las personas vivas hoy morirán en un accidente de tráfico.

Demostraremos que estas dos afirmaciones no son iguales.

Simplifiquemos mucho las cosas y supongamos que todas las personas que nacen o bien morirán de un ataque al corazón a los 80 años o de un accidente de coche a los 40. Además, supongamos que se cumple la primera afirmación, y que estamos en un estado de población estable, por lo que las muertes equilibran los nacimientos. Entonces habrá tres poblaciones de humanos, todas igual de grandes.

  • Personas menores de 40 años que morirán por un accidente de tráfico.
  • Personas menores de 40 años que morirán de un ataque al corazón.
  • Personas mayores de 40 años que morirán de un ataque al corazón.

Estas tres poblaciones tienen que ser igual de grandes, porque la tasa de personas que mueren en accidentes de tráfico (de la primera población anterior) y la tasa de personas que mueren en ataques al corazón (de la tercera población anterior) son iguales.

¿Por qué son iguales? El número de personas que mueren en accidentes de tráfico cada año es $1/40$ del número de personas de la primera población, y el número de personas que mueren por infarto es $1/40$ del número de personas de la tercera población, por lo que las dos poblaciones tienen que tener el mismo tamaño. Además, la segunda población tiene el mismo tamaño que la tercera (porque la tercera población es la segunda, 40 años después).

En este caso, sólo un tercio de las personas vivas hoy en día morirán en un accidente de tráfico, por lo que las dos afirmaciones no son iguales.

En la vida real, mi impresión es que los accidentes de tráfico se producen a una edad significativamente más temprana que la mayoría de las demás causas de muerte. Si este es el caso, habrá una diferencia sustancial entre los números de su declaración uno y dos.

Si se modifica la segunda declaración por

  • La mitad de las personas que nacen morirán en un accidente de tráfico,

entonces, bajo el supuesto de una población en estado estacionario, las dos afirmaciones serían equivalentes. Pero, por supuesto, en el mundo real no tenemos una población en estado estacionario, y un argumento similar (aunque más complicado) muestra que para una población en crecimiento, o en disminución, el sesgo de muestreo sigue haciendo que estas dos afirmaciones sean diferentes.

0 votos

"Estas tres poblaciones tienen que ser igual de grandes, porque la tasa de personas que mueren de infarto (de la primera población anterior) y la tasa de personas que mueren de infarto (de la tercera población anterior) son iguales". ¿Crees que podrías hacer esto un poco más obvio? (Además, supongo que te refieres a los accidentes de tráfico de la primera población) Por lo demás, es un gran ejemplo. Ni siquiera me había planteado que pudiera haber una diferencia entre "La mitad de las personas nacidas" y "La mitad de las personas vivas".

0 votos

@faulty_ram_sticks. Sí: el sesgo de muestreo puede ser complicado. Lo he explicado con más detalle ... Espero que esto sea lo suficientemente bueno ahora. Y gracias por detectar mi error tipográfico.

5 votos

Esta es una maravillosa pregunta de sesgo de muestreo. El hecho de que las primeras 8 respuestas no hayan captado el sesgo de muestreo demuestra que es realmente complicado. Puede que la utilice cuando enseñe probabilidad.

11voto

¿Mi interpretación por defecto es realmente equivalente a la primera afirmación?

No.

Digamos que tenemos 800 personas. 400 murieron: 5 por un accidente de coche, las otras 395 se olvidaron de respirar. S1 es ahora verdadera: 5/400=1/80. S2 es falsa: 5/800=1/80.

El problema es que técnicamente la S2 es ambigua porque no especifica cuántas muertes hubo en total, mientras que la S1 sí. Alternativamente, S1 tiene un dato más (total de muertes) y un dato menos (total de personas). Tomados al pie de la letra, describen proporciones diferentes.

¿Es inusual o imprudente que esta sea mi interpretación por defecto?

En realidad no estoy de acuerdo con tu interpretación, pero creo que no importa. Probablemente, el contexto haría evidente lo que se quiere decir.

  • Por un lado, obviamente todas las personas mueren, por lo que está implícito que el total de personas = el total de muertes. Por tanto, si se habla de tasas de mortalidad en general, se aplica su interpretación por defecto.
  • Por otro lado, si se trata de un conjunto de datos limitado en el que no se da por supuesto que todos mueran, mi interpretación anterior es más acertada. Pero no parece difícil que el lector lo pase por alto.

Te preguntarás dónde podrías encontrar personas que no mueren. Por un lado, podríamos estar trabajando con un conjunto de datos estadísticos que sólo hace un seguimiento de las personas durante 5 años, por lo que hay que ignorar a los que siguen vivos al final del estudio, ya que no se sabe de qué van a morir. Otra posibilidad es que se desconozca la causa de la muerte, en cuyo caso no se puede asignar realmente a los coches o a los no coches.

Si cree que S1 y S2 son diferentes, de manera que afirmar lo segundo cuando se quiere decir lo primero es engañoso/incorrecto, ¿podría proporcionar una revisión completa de S2 que sea equivalente?

"Una de cada 80 personas que muere, lo hace como consecuencia de un accidente de tráfico", lo que equivale a reformular la S1.

0 votos

Esta respuesta imita el argumento semántico de Brent Hutto, que habla de una ambigüedad porque no está claro que cuando se dice "1 de cada x personas muere como consecuencia de y" se quiera decir la mortalidad tasa por la causa específica de la muerte $y$ o la proporción del total de las muertes que se deban a la causa $y$ . Técnicamente hablando, la frase debería ser como "1 de cada x personas muere, durante el periodo z, como consecuencia de y" para que se interprete lógicamente que se refiere a una tasa de mortalidad. Entonces, ¿la ambigüedad no se debe más bien a que la gente no siempre interpreta de forma lógica? Sí, lo es.

0 votos

Pero eso era sólo una nota lateral. Lo que quería decir es que esta respuesta sólo apunta a una cuestión semántica, pero no tiene en cuenta la cuestión estadística, que consiste en que la probabilidad de que una muerte se deba a un accidente de tráfico no es constante e independiente del tiempo. Esto hace que sea diferente cuando nos referimos a "es causado" (el pasado) y "(morirá)" (el presente o el futuro).

0 votos

"Causa de la muerte" es un término médico-legal que tarda un tiempo latente en establecerse médicamente, en informarse y en recogerse. Sólo se puede afirmar en retrospectiva cuando la probabilidad de omitir una causa de muerte es pequeña o, de lo contrario, se corrigen los datos que faltan, por ejemplo, incluyendo los informes tardíos del periodo de tiempo anterior. Por tanto, una afirmación estadísticamente correcta sería algo así: "En región geográfica de recogida de datos durante período de tiempo las probabilidades de muerte atribuibles a los accidentes de tráfico fue Se calcula que una de cada 80 muertes".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X