Estoy buscando un paquete de software estadístico que pueda utilizar en un curso de introducción a la estadística para un programa de estudios de ciencias sociales. Los estudiantes no tienen conocimientos previos de estadística y tampoco tienen experiencia con los lenguajes de programación. El objetivo es introducirles en los conceptos estadísticos básicos (como las medias, la varianza, la suma de los cuadrados, los valores p... y, por último, la regresión lineal) y permitirles realizar análisis básicos por su cuenta utilizando conjuntos de datos de ejemplo. El curso debería consistir en aprender conceptos haciendo estadística en lugar de memorizar fórmulas (aunque creo que las fórmulas son importantes).
Por lo tanto, estoy buscando una alternativa a la sintaxis habitual (como R normal) o al software de apuntar y hacer clic (como SPSS o Rcmdr). El software debe ser fácil de aprender y debe tener una interfaz gráfica de usuario clara que visualice los conjuntos de datos y ofrezca los gráficos y tablas estándar. Lo mejor sería que visualizara todos los pasos de un análisis (por ejemplo, lectura y manipulación de datos, cálculo de medidas descriptivas, elaboración de tablas y gráficos descriptivos, cálculo de medidas inferenciales, trazado de gráficos inferenciales, exportación a un informe).
¿Tienes sugerencias de software estadístico (de código abierto o gratuito) que sea adecuado para aprender y practicar por primera vez la estadística?
EDITAR
Gracias por sus sugerencias. He investigado gretl y otros dos programas que he encontrado durante mi propia investigación en línea: RapidMiner y Laboratorio de Estadística .[1]
He descubierto que gretl
La interfaz y los resultados de Rcmdr son más claros y específicos que los de Rcmdr, SPSS o Stata, por ejemplo. Por lo tanto, es una herramienta bien calificada para comenzar a enseñar estadística desde mi punto de vista.
Sin embargo, las interfaces gráficas de flujo de RapidMiner
y Statistical Lab
me han impresionado porque visualizan los pasos individuales de un análisis estadístico (empezando por la carga de datos). Creo que esto podría ser útil para muchos estudiantes que tienen dificultades con el enfoque habitual de las explicaciones matemáticas. Por supuesto, RapidMiner me parece demasiado sobrecargado de funciones, menús y botones para los principiantes, mientras que el Statistical Lab está mucho más centrado. La gran ventaja del Statistical Lab es la consola "R-Calculator" con un "R-code Wizard" que ayuda a producir la sintaxis real de R, ya que el Statistical Lab se basa en R
para sus cálculos.
Finalmente, decidí empezar con el Laboratorio de Estadística en el primer semestre mientras se introducen los conceptos básicos y se pasa a RStudio (y Rcmdr) en el segundo semestre.
[1]: Gnumeric, SciPy, Scilab, GNU Octave y otros similares me parecen menos dirigidos a las ciencias sociales.
0 votos
Tengo curiosidad: ¿Cuál fue la razón por la que no te gustó, digamos, R?
0 votos
En realidad, ¡me gusta R! Pero creo que es demasiado para un curso de introducción centrado en la estadística y el aprendizaje de la sintaxis. Además, no me convence el uso de menús de apuntar y hacer clic en un curso de introducción a la estadística porque en muchos casos los estudiantes tienden a aferrarse a esta práctica indeseable (que reduce la reproducibilidad) demasiado tiempo. Además, me gustaría enseñarles sintaxis (por ejemplo, R o Stata) como paso siguiente en el siguiente semestre.
8 votos
@Matthias: Creo que si tus alumnos vienen/apuntan desde/hacia un campo de las ciencias sociales, enseñarles R como primer paso en Estadística es una exageración. La mayoría de ellos tendrán problemas con el concepto de consola, comandos, sintaxis, etc. y pasarás más tiempo repasando "conceptos de programación" (qué es 'función', 'bucle', etc.) que "estadística". Me baso en mi experiencia anterior, cuando hice tutoriales para un curso de Estadística 101 en un departamento de Ciencias Sociales; la gente se perdió el objetivo de las clases porque se centraron más en conseguir que R funcionara para ellos que en explorar sus datos.
1 votos
@user11852: Puede que tengas razón pero es triste que los institutos manden a los alumnos sin ningún tipo de exposición a la programación. O las universidades que permiten esta brecha. No debería llegar ningún alumno a una clase universitaria que no sepa lo que es un bucle o una función. Retrasar la exposición sólo empuja el problema a otra parte.
0 votos
@curious_cat: Este es un debate realmente grande; a grandes rasgos estoy de acuerdo con lo que dices. Sin embargo, hay un momento y un lugar para todo y creo que una clase de Stats 101 para estudiantes de Ciencias Sociales no es el "momento y lugar" para cerrar la "brecha de programación".
2 votos
@user11852: La otra opción menos aceptable podría ser que los departamentos de Estadística insistieran en que las clases de "Estadística 101 para las Ciencias Sociales" tuvieran como prerrequisito alguna experiencia en programación o una clase de recuperación de la misma. Hoy en día, cuando casi todas las asignaturas están tan orientadas a la computación, no hay ninguna razón para que la asignatura Programming-101 no sea la primera que todos tomen.
1 votos
@curious_cat: Estás predicando a los conversos; yo hice CS para mi licenciatura. Probablemente sí, una clase básica de programación/CS sería beneficiosa para la mayoría de los estudiantes y creo que la mayoría de los planes de estudio de Ciencias Físicas ya tienen una. ¿Pero es necesaria para los estudiantes de Humanidades? Tal vez, pero probablemente no sea tan importante como aprender a aplicar técnicas estadísticas formales simples e interpretar los resultados.
6 votos
Por si sirve de algo, he utilizado R con éxito en mi curso de introducción a la estadística para ciencias políticas. He utilizado RStudio . También tenía "laboratorios" semanales en los que permitía a los alumnos trabajar juntos en pequeñas tareas, mientras yo iba de un lado a otro y respondía a las preguntas. Con un código de ejemplo bien comentado, los estudiantes lo hacían bien y apenas se quejaban. De hecho, se quejaron mucho menos de R que el semestre anterior, cuando usé Stata. Como Stata no es gratis, los estudiantes tenían que venir a las horas de laboratorio para hacer su trabajo -- lo odiaban.
6 votos
Creo que R en conjunto con RStudio puede ser un excelente enfoque. Además, sienta las bases para una práctica de investigación reproducible, a diferencia de los sistemas de menús. Yo recomendaría dar varias plantillas de código que los estudiantes pueden cargar en RStudio desde la web (RStudio lo hace fácil) y dejar que los estudiantes hagan el trabajo de cambiar los nombres de las variables y los modelos estadísticos a lo que se necesita para el problema en cuestión.
0 votos
@argumento_no_numérico: ¿Qué tal te ha ido? Tienes feedback o evaluación de la calidad de tu elección o de lo que estás haciendo ahora con el material.
0 votos
Se trata de un hilo antiguo que, comprensiblemente, ha generado mucho interés, pero ni la pregunta ni las respuestas hasta la fecha me convencen de que sea una buena pregunta según los estándares actuales. Es demasiado amplia e invita a hacer afirmaciones basadas en la opinión personal (o en las circunstancias personales). La mayoría de las respuestas plantean cuestiones muy diferentes, como por ejemplo si deberíamos enseñar también programación. Las respuestas podrían variar enormemente en función de si este es el primer y último curso de estadística que hacen los estudiantes o si es probable que los estudiantes se dediquen a la estadística durante el resto de sus carreras.
0 votos
,,, y de hecho diferentes estudiantes en el mismo curso podrían entrar en cualquiera de los dos epígrafes, y de hecho los estudiantes pueden no conocer su propio futuro. La decisión de la OP de utilizar un programa diferente en cada semestre plantea la cuestión de si eso funcionó bien.