Soy nuevo en estadística y estoy probando con conjuntos de datos aleatorios, un análisis que estoy haciendo es tratar de encontrar si hay una relación entre dos variables, la duración y el éxito donde la duración es variable numérica continua y la otra, el éxito es categórica.
La distribución de la variable duración no es normal, por lo que creo que estoy haciendo una prueba no paramétrica, ¿qué opinas?
- Tamaño del conjunto de datos: 45957 para ambas variables
Dada la distribución de la columna "duración", tengo esta figura:
Ahora quiero analizar cual es la mejor duración/longitud de tiempo para tener una campaña exitosa, visualizo la duración con todos los tipos de estado:
Con la relación anterior, no hay conclusión aparente, por lo que asumo que el éxito, es el éxito y el resto de las categorías son el fracaso, tengo esta viz
Ahora, quiero estar seguro, quiero realizar una prueba para llegar a una determinada conclusión.
Nunca he realizado una prueba estadística en la vida real, así que no sé qué hacer y cómo proceder en la práctica.