3 votos

Prueba de diferencia de proporciones con muestras no aleatorias/autoseleccionadas

Supongamos que tengo dos versiones de un correo electrónico y cada una contiene un enlace. Asigno aleatoriamente dos grupos para que reciban los respectivos correos electrónicos de tamaños $N_1$ y $N_2$ (es decir, grupo $i$ recibe correo electrónico $i$ para $i=1,2$ ). Denotemos el número de grupo $i$ destinatarios que abren el correo electrónico como $n_i$ para $i=1,2$ . Además, denota el número de grupo $i$ destinatarios que hicieron clic en el enlace después de abrir los correos electrónicos en los grupos respectivos como $c_i$ para $i=1,2$ . Me interesa saber si la proporción $\frac{c_i}{n_i}$ es diferente para los dos correos electrónicos/grupos. Dos preguntas:

  1. ¿Puedo aplicar una norma $z$ dado que las muestras no son aleatorias, es decir, los destinatarios se autoseleccionan al abrir los correos electrónicos.
  2. Si es así, entiendo que estaría utilizando $n_1$ y $n_2$ como tamaños de muestra. ¿Es correcto?

He intentado buscar respuestas en Internet, pero no sé muy bien cómo formular esta pregunta de forma concisa. Cualquier artículo de revista o referencia de libro de texto sería de gran ayuda. Gracias de antemano.

3voto

jldugger Puntos 7490

Puede que le resulte útil (y pertinente) modelizar esta situación suponiendo que entre las personas que abren estos correos electrónicos, (1) las decisiones de hacer clic son independientes y (2) esas decisiones se toman con probabilidades fijas $p_i$ que puede variar según el tipo de correo electrónico.

El primer supuesto no es controvertido (a menos que envíe correos electrónicos en bloque a grupos de personas afines). La segunda debería probarse, pero al menos podemos utilizarla para proceder a algunos análisis.

También asumo los destinatarios no tienen conocimiento de los tipos de correos electrónicos : es decir, superficialmente parecen idénticos, de modo que la decisión de abrir el correo electrónico es independiente de su tipo.

La elección aleatoria de los destinatarios de estos correos electrónicos garantiza la obtención de muestras aleatorias de dos poblaciones (solapadas): las que abrirían correos electrónicos del tipo 1 y las que abrirían correos electrónicos del tipo 2. Suponiendo que estas poblaciones sean grandes en comparación con el número de correos electrónicos enviados La falta de independencia en el muestreo (nadie tiene ninguna posibilidad de recibir ambos tipos de correos electrónicos) no tiene consecuencias.

Estos supuestos le colocan en la situación de libro de texto de comparar dos probabilidades (hipotéticas) $p_i$ en dos poblaciones basado en un experimento Binomial de dos muestras con tamaños de muestra $n_1$ y $n_2,$ confirmando así las afirmaciones (1) y (2) de la pregunta.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X