No estoy seguro de a qué lugar pertenece esta pregunta: Cross Validated, o El lugar de trabajo. Pero mi pregunta está vagamente relacionada con la estadística.
Esta pregunta (o supongo que preguntas) surgió durante mi trabajo como "becario de ciencias de los datos". Estaba construyendo este modelo de regresión lineal y examinando el gráfico de residuos. Vi una clara señal de heteroscedasticidad. Recuerdo que la heteroscedasticidad distorsiona muchas estadísticas de prueba, como el intervalo de confianza y la prueba t. Así que utilicé los mínimos cuadrados ponderados, siguiendo lo que había aprendido en la universidad. Mi jefe lo vio y me aconsejó que no lo hiciera porque "estaba complicando las cosas", lo cual no era una razón muy convincente para mí.
Otro ejemplo sería "eliminar una variable explicativa porque su valor p es insignificante". Para mí, este consejo no tiene sentido desde un punto de vista lógico. Según lo que he aprendido, un valor p insignificante puede deberse a diferentes razones: el azar, el uso de un modelo equivocado, la violación de los supuestos, etc.
Otro ejemplo es que he utilizado la validación cruzada k-fold para evaluar mi modelo. De acuerdo con el resultado, $CV_{model 1}$ es mucho mejor que $CV_{model 2}$ . Pero tenemos una menor $R^2$ para el modelo 1, y la razón tiene algo que ver con la intercepción . Mi supervisor, sin embargo, parece preferir el modelo 2 porque tiene mayor $R^2$ . Sus razones (como $R^2$ es robusto, o la validación cruzada es un enfoque de aprendizaje automático, no un enfoque estadístico) no parecen ser lo suficientemente convincentes como para hacerme cambiar de opinión.
Como alguien que acaba de graduarse de la universidad, estoy muy confundido. Me apasiona aplicar una estadística correcta para resolver problemas del mundo real, pero no sé cuál de las siguientes afirmaciones es cierta:
- Las estadísticas que aprendí por mi cuenta están mal, así que sólo estoy cometiendo errores.
- Hay una gran diferencia entre la estadística teórica y la construcción de modelos en las empresas. Y aunque la teoría estadística es correcta, la gente no la sigue.
- El gestor no está utilizando las estadísticas correctamente.
Actualización a 17/4/2017: He decidido hacer un doctorado en estadística. Gracias a todos por su respuesta.
1 votos
En relación con tu pregunta están los comentarios (sobre todo los del final) debajo de esta respuesta: stats.stackexchange.com/questions/229193/
0 votos
Este debate también puede ser relevante . En la práctica, a veces se pueden utilizar modelos en los que los datos violan algunos supuestos requeridos (por ejemplo, Naive Bayes en las variables dependientes) y aún así obtener resultados interesantes. Pero entonces hay que tener mucho cuidado con las conclusiones que se sacan, y ahí es donde está el principal problema: a la mayoría de la gente no le importa el significado de los resultados mientras se obtengan resultados. Publicar o perecer...
1 votos
Las respuestas "tú tienes razón y él está equivocado" son probablemente correctas y se aplican a tu caso. De todos modos, ten en cuenta que a veces la respuesta puede ser "él está equivocado, pero su manera equivocada funciona para sus propósitos - tal vez funciona incluso mejor que la manera correcta para sus propósitos no estadísticos de dirigir el negocio". Creo que esto ocurre a menudo con todo tipo de conocimientos científicos, no sólo con la estadística. Tal vez en SE Workplace puedan darte ejemplos no estadísticos.
3 votos
@Aksakal: Por lo que describe el OP estadísticamente lo más probable es que tenga razón. Su anécdota personal, es sólo una anécdota. Puedo contrarrestarla diciendo que me trasladé a un trabajo en el que se hacían pruebas A/B con sólo 30 muestras; mostrar cálculos básicos de potencia cambió toda la mentalidad de los equipos sobre los tamaños de las muestras y la toma de decisiones. Volviendo a la pregunta del PO, estoy de acuerdo en que lo descrito no significa que el supervisor del PO haya tomado una decisión equivocada. Los flujos de trabajo de las empresas tienen una inercia particular asociada a ellos y el "chico nuevo" tiene que demostrar que es un predicador antes de convertirse en profeta...
1 votos
@usr11852, mi comentario fue un despotrique :) pero tiene un punto, creo: para alguien que es nuevo en el campo, es más seguro asumir que un jefe sabe más. con la experiencia puede relajar esta suposición, tal vez dar más peso a su propia opinión y menos a la del jefe. para un interno el peso de la opinión propia debe ser cerca de CERO.
0 votos
@Aksakal: Claro, no hay problema.
0 votos
No se puede tener todo: - Una solución "buena" - Una solución barata - Una solución rápida Lo que es bueno y barato no puede ser rápido. Lo que es bueno y rápido no puede ser barato. Lo que es barato y rápido no puede ser "bueno". Quizás tu jefe sólo quería una solución rápida y no una buena y precisa.