No puedo reproducir las cifras exactas que arroja esta calculadora, pero el resultado se parece bastante al que se obtendría con power.prop.test()
para una potencia del 50% en una prueba de dos caras, utilizando las estimaciones muestrales de las dos proporciones, p. ej.
power.prop.test(p1=26/190, p2=25/200, power=.5, sig.level=.1)
(El resultado es 4390 por grupo, así que 8780 en total o 8390 visitantes más de los que ya tiene, la diferencia de 15 observaciones podría explicarse fácilmente por un error de redondeo en alguna parte -incluso en el sitio web- o algún otro detalle computacional).
Si esto es realmente lo que es, parece que hay un defecto fundamental en el enfoque, ya que asume implícitamente que las proporciones que obtuviste de tu muestra son realmente las proporciones reales, lo que parece anular todo el sentido de hacer un experimento en primer lugar. De hecho, no se sabe si la diferencia "alcanzará" la significación, ya que podría muy bien descubrir que los resultados son muy diferentes después de haber recogido más datos (tal vez la diferencia sea menor o incluso vaya en la otra dirección).
Intuitivamente, esto debería ser fácil de comprender si se tiene en cuenta que el tamaño de muestra recomendado es más de 20 veces el tamaño de la muestra que ya se tiene. Los datos que tiene se verán empequeñecidos por estos nuevos datos y, en efecto, tendrá un experimento completamente nuevo que podría ir en cualquier dirección (especialmente porque ya está claro que el efecto no es muy fuerte y los datos que ya tiene no son concluyentes; de lo contrario, ya podría rechazar la hipótesis nula).
Para una idea similar, expresada con más cuidado en un contexto completamente diferente, puede consultar Kraemer H.C., Mintz J., Noda A., Tinklenberg J., & Yesavage J.A. (2006). Caution regarding the use of pilot studies to guide power calculations for study proposals. Archivos de Psiquiatría General, 63 (5), 484-489.
En cualquier caso, la información proporcionada en la página de la calculadora es muy escasa e insuficiente para servir de base a un análisis de potencia adecuado. Incluso si estuviera dispuesto a ignorar el punto que acabo de comentar, como mínimo necesitaría el nivel de potencia deseado (junto con el tamaño del efecto y el nivel de error) para calcular el tamaño de la muestra, y no parece que se mencione en ninguna parte.