9 votos

Versus (vs.): cómo usar correctamente esta palabra en el análisis de datos

Esta pregunta es probablemente más sobre el idioma inglés que sobre estadísticas, pero he decidido hacerla aquí de todos modos.

Cuando comparamos dos grupos de muestras, digamos Tratamiento vs. Control, y calculamos no solo los valores p, sino también el tamaño del efecto (o cambio porcentual), queremos saber cuál es el punto de referencia. En el caso de Tratamiento-Control es bastante obvio. Por lo tanto, comprendemos que si el cambio porcentual es positivo, en promedio, los valores en el grupo de Tratamiento son mayores que en el grupo de Control. Pero ¿qué pasa si alguien escribe "Grupo A vs. Grupo B". ¿Podemos hacer una suposición sobre cuál es el punto de referencia solo por el orden de los grupos en la declaración: lado derecho de *vs* (Grupo B) o lado izquierdo (Grupo A)?

Otro ejemplo: Medí dos variables X y Y para una muestra, y los representé en un gráfico de dispersión, un punto por observación, la variable X en el eje x, y la variable Y en el eje y. ¿Cómo describir adecuadamente el gráfico: "Y vs. X" o "X vs. Y", ¿o ambas declaraciones son idénticas?

No encontré una etiqueta adecuada para esta pregunta e intenté crear una etiqueta "lenguaje-estadístico" pero no tengo suficiente reputación. Si crees que sería útil y puedes ayudar, por favor hazlo.

0 votos

@Tim, si crees que sí, ¿podrías al menos sugerir otro foro para hacer esta pregunta?

2 votos

Puedo ver una pregunta de estadísticas allí, más o menos. Básicamente, la pregunta es cómo interpretar contrastes en modelos estadísticos.

1 votos

12voto

Nick Cox Puntos 22819

En cuanto a trazar: considero natural y convencional decir -- para gráficos de dispersión, gráficos de línea, y demás -- que trazo Y versus X y en cada caso siempre menciono primero la respuesta y luego la otra variable. Por lo tanto yo (digo que yo) trazo temperatura versus o contra tiempo, y rendimiento de trigo versus o contra lluvia.

¿Por qué natural? Siempre que afirmas que existe tal relación, la idea es que (en los ejemplos dados) la temperatura depende de, o es una función de, el tiempo, en lugar de viceversa; y el rendimiento de trigo depende de, o es una función de, la lluvia, en lugar de viceversa. (Las relaciones que involucran bucles de retroalimentación pueden ser una excepción a este principio sin socavarlo).

Por lo tanto, la distinción está vinculada con una fuerte convención de que la respuesta (resultado, efecto, variable dependiente) se representa en el eje vertical o de $y$ y la otra variable en el eje horizontal o de $x$. También está vinculada con una fuerte convención en discusiones matemáticas de usar frases como $y$ es una función de $x$, donde la respuesta se menciona primero.

Sin embargo, es cierto que al menos en parte estamos hablando de convenciones aquí, en lugar de preguntas en las que se puede identificar una lógica inevitable. Me sorprendió empezar a escuchar el uso opuesto de versus hace aproximadamente una década. No recuerdo exactamente cuándo escuché versus siendo usado en el sentido identificado aquí, pero sospecho que fue en la ciencia de la escuela secundaria en la década de 1960: al igual que con muchos usos, mis profesores de ciencias tendían a usar el lenguaje que les resultaba natural, en lugar de reflexionar sobre su uso o explicarlo. Esta es la forma en que se transmite gran parte del lenguaje científico, a pesar de los miles y miles de libros de texto.

También en cuanto a trazar: existen muchas excepciones incluso en gráficos de dispersión y de línea a la convención de tener la respuesta en el eje de $y$. En las ciencias de la Tierra y ambientales, es común que la profundidad debajo o la altura sobre la superficie esté en el eje de $y$: ¿qué podría ser más vertical? Así es como las personas en esos campos piensan en nucleos, sondeos y trazas similares por debajo del suelo o en la atmósfera.

Detalle: vs por versus es una contracción, no una abreviatura; muchos (británicos) guías de estilo de inglés aconsejan no usar un punto en estos casos.

EDIT 12 de abril de 2018/14 de mayo de 2020 Wild y Seber (2000, pp. 107-108) en su texto introductorio excepcionalmente bueno lo explican de esta manera: 'Al trazar, es convencional usar el eje vertical para representar la variable de respuesta $Y$ y el eje horizontal para representar la variable explicativa $X$. (Esto es lo que convencionalmente se entiende cuando decimos que "Trazamos $Y$ versus $X$").'

Sin embargo, en el mismo capítulo utilizan la convención opuesta para versus en leyendas en la p.102 y p.111 y la convención que promueven en la p.109. Ver también pp.140, 527, 534, 537.

De esto se desprenden tres puntos: (a) Hay explicaciones de la convención que promuevo en la literatura. (b) Estamos hablando de convenciones, no reglas. (c) Autores de primer nivel pueden ser igual de inconsistentes que cualquier otra persona en detalles menores.

Wild, C.J. y Seber, G.A.F. 2000. Chance Encounters: A First Course in Data Analysis and Inference. Nueva York: John Wiley.

2 votos

Encontré que el punto después de "vs" se usa en inglés americano en oposición al inglés británico.

1 votos

Para ser honestos, creo que 'versus' es ambiguo. Probablemente digo "X vs. Y" tanto o más que lo contrario. "Against" está más consistentemente alineado con Y en X. Para estar seguros, las personas probablemente siempre deben tener etiquetas de ejes y leyendas de figuras, etc.

1 votos

Para ser claro, a pesar de mi comentario algo escéptico anterior, creo que esta es una muy buena respuesta y la voté positivamente hace tiempo.

4voto

Sean Hanley Puntos 2428

En meta.CV, @Glen_b argumenta que "versus" no es realmente un término técnico en estadística. Estoy de acuerdo. Creo que típicamente se usa de manera suelta y coloquial. Cuando se usa en un contexto estadístico, el término en su mayoría denota comparación (en lugar de su significado relacionado con la competencia en deportes).

Por lo tanto, es natural aplicar "versus" al discutir la comparación de condiciones o grupos. En relación con el tema de interpretar el signo en el tamaño del efecto (diferencia de medias), argumentaría que nuestra comprensión de que la media del tratamiento es mayor cuando 'tratamiento vs. control' es positivo se debe principalmente a nuestra comprensión de la naturaleza de los tratamientos y controles más que a que este entendimiento sea llevado por el significado de "versus". Si se hace referencia a la comparación de 'grupo A vs. grupo B', no hay nada intrínseco a la condición de grupo A que indique si su estado es el predeterminado o la condición de contraste. Como resultado, esa situación sería ambigua. Debido a que la resta no es conmutativa/se desplaza de izquierda a derecha, creo que la interpretación de una diferencia positiva significaría que el primer grupo mencionado es más grande tendría preferencia. Sin embargo, creo que la situación es inherentemente ambigua y debemos tener cuidado de indicar explícitamente cuál es más grande. Por ejemplo, 'comparamos A vs. B y encontramos que A es significativamente más grande con una diferencia de medias estandarizada de d'.

Por otro lado, cuando hacemos un gráfico de dispersión, en realidad no estamos comparando X e Y. En realidad, estamos examinando la relación entre ellos. Como resultado, es un poco incorrecto usar "versus" en ese contexto. (N.B., lo digo todo el tiempo.) En cuanto a mi propio uso personal, pienso en 'X vs. Y' como más análogo a la correlación (es decir, no direccional) que a la regresión1 (donde el orden es significativo). Nuevamente, creo que este uso es ambiguo y es nuestra responsabilidad ser explícitos a través del uso de etiquetas de ejes y leyendas de figuras, etc.

Mi punto general aquí es que todo este lenguaje es, o potencialmente es, ambiguo. Creo que está bien decirlo, pero debemos complementarlo de alguna manera para que el significado sea claro.

1. Utilizo el término "contra" (como en 'Grafiqué Y contra X') de manera más intencional. En ese caso, Y va en el eje y/o es la variable de respuesta.

2voto

le_andrew Puntos 1004

Versus simplemente significa "diferencia". No implica ningún tipo de relación de tratamiento de referencia. Tienes una media para el Grupo A y una media para el Grupo B. Probar A frente a B verifica si las diferencias en las medias son significativamente mayores que cero. Probar B frente a A es lo mismo. Las relaciones causales o identificar a uno de los grupos como referencia implica información cualitativa extra-estadística.

2 votos

¿Tienes una fuente para citar esta definición? Difiere ligeramente de las definiciones estándar de versus, que generalmente lo equiparan con "en contra" u "opuesto a".

0 votos

Gracias. También vi la definición de "en contra". Creo que hay algunos matices aquí. ¿Algún pensamiento sobre el ejemplo de diagrama de dispersión? ¿Esas declaraciones también no son distinguibles?

1 votos

En cuanto a la pregunta sobre el diagrama de dispersión, esa es una pregunta en inglés. Realmente no puedo responder a eso además de decir que normalmente veo las variables dependientes a la izquierda de las descripciones.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X