13 votos

¿Qué software estadístico es adecuado para impartir un curso de introducción a la estadística en ciencias sociales?

Estoy buscando un paquete de software estadístico que pueda utilizar en un curso de introducción a la estadística para un programa de estudios de ciencias sociales. Los estudiantes no tienen conocimientos previos de estadística y tampoco tienen experiencia con los lenguajes de programación. El objetivo es introducirles en los conceptos estadísticos básicos (como las medias, la varianza, la suma de los cuadrados, los valores p... y, por último, la regresión lineal) y permitirles realizar análisis básicos por su cuenta utilizando conjuntos de datos de ejemplo. El curso debería consistir en aprender conceptos haciendo estadística en lugar de memorizar fórmulas (aunque creo que las fórmulas son importantes).

Por lo tanto, estoy buscando una alternativa a la sintaxis habitual (como R normal) o al software de apuntar y hacer clic (como SPSS o Rcmdr). El software debe ser fácil de aprender y debe tener una interfaz gráfica de usuario clara que visualice los conjuntos de datos y ofrezca los gráficos y tablas estándar. Lo mejor sería que visualizara todos los pasos de un análisis (por ejemplo, lectura y manipulación de datos, cálculo de medidas descriptivas, elaboración de tablas y gráficos descriptivos, cálculo de medidas inferenciales, trazado de gráficos inferenciales, exportación a un informe).

¿Tienes sugerencias de software estadístico (de código abierto o gratuito) que sea adecuado para aprender y practicar por primera vez la estadística?

EDITAR
Gracias por sus sugerencias. He investigado gretl y otros dos programas que he encontrado durante mi propia investigación en línea: RapidMiner y Laboratorio de Estadística .[1]
He descubierto que gretl La interfaz y los resultados de Rcmdr son más claros y específicos que los de Rcmdr, SPSS o Stata, por ejemplo. Por lo tanto, es una herramienta bien calificada para comenzar a enseñar estadística desde mi punto de vista.
Sin embargo, las interfaces gráficas de flujo de RapidMiner y Statistical Lab me han impresionado porque visualizan los pasos individuales de un análisis estadístico (empezando por la carga de datos). Creo que esto podría ser útil para muchos estudiantes que tienen dificultades con el enfoque habitual de las explicaciones matemáticas. Por supuesto, RapidMiner me parece demasiado sobrecargado de funciones, menús y botones para los principiantes, mientras que el Statistical Lab está mucho más centrado. La gran ventaja del Statistical Lab es la consola "R-Calculator" con un "R-code Wizard" que ayuda a producir la sintaxis real de R, ya que el Statistical Lab se basa en R para sus cálculos.
Finalmente, decidí empezar con el Laboratorio de Estadística en el primer semestre mientras se introducen los conceptos básicos y se pasa a RStudio (y Rcmdr) en el segundo semestre.

[1]: Gnumeric, SciPy, Scilab, GNU Octave y otros similares me parecen menos dirigidos a las ciencias sociales.

0 votos

Tengo curiosidad: ¿Cuál fue la razón por la que no te gustó, digamos, R?

0 votos

En realidad, ¡me gusta R! Pero creo que es demasiado para un curso de introducción centrado en la estadística y el aprendizaje de la sintaxis. Además, no me convence el uso de menús de apuntar y hacer clic en un curso de introducción a la estadística porque en muchos casos los estudiantes tienden a aferrarse a esta práctica indeseable (que reduce la reproducibilidad) demasiado tiempo. Además, me gustaría enseñarles sintaxis (por ejemplo, R o Stata) como paso siguiente en el siguiente semestre.

8 votos

@Matthias: Creo que si tus alumnos vienen/apuntan desde/hacia un campo de las ciencias sociales, enseñarles R como primer paso en Estadística es una exageración. La mayoría de ellos tendrán problemas con el concepto de consola, comandos, sintaxis, etc. y pasarás más tiempo repasando "conceptos de programación" (qué es 'función', 'bucle', etc.) que "estadística". Me baso en mi experiencia anterior, cuando hice tutoriales para un curso de Estadística 101 en un departamento de Ciencias Sociales; la gente se perdió el objetivo de las clases porque se centraron más en conseguir que R funcionara para ellos que en explorar sus datos.

13voto

Michał Kwiatkowski Puntos 2777

¿Tal vez Gretl? http://gretl.sourceforge.net/

Es gratuito y se utiliza en nuestra Universidad para las estadísticas de grado.

9 votos

+1. Excelente sugerencia. Siempre he encontrado la interfaz gráfica de Gretl intuitiva y directa, y la información que proporciona es precisa y sin demasiados adornos que podrían desanimar a algunos estudiantes menos "técnicos". Además, es gratuito, está bien documentado y tiene una consola R por si alguien quiere ver algo más "profundo".

9voto

jws121295 Puntos 36

Yo evitaría la mayoría de las cosas "famosas", MatLab , Arce , Mathematica , JMP , SAS o Minitab porque cuando sus estudiantes se gradúan tienen que pagar miles de dólares al año para utilizarlo profesionalmente. Cada empresa suele tener su herramienta favorita, y si les enseñas una herramienta por la que su empresa no va a pagar, su habilidad se desperdicia. Tampoco me gustan las librerías propietarias, ya que enseñan a los usuarios a pulsar botones y si el usuario quiere ir a otro sitio (JMP o lo que sea) no hay transferencia de aprendizaje.

Python incluido SciPy/NumPy es bastante bueno. Es de código abierto y está bien soportado. Tiene una gramática fácil de aprender. Todavía es interpretado, por lo que no es muy rápido, pero si no saben nada de scripts u hojas de cálculo, es mucho más rápido de lo que podrían necesitar. PythonXY es una buena versión, tiene buenas librerías y soporte. También me gusta que la programación GUI es posible a través de ella. La construcción de aplicaciones independientes en Windows es un poco difícil, pero probablemente waaaay por encima del nivel de sus estudiantes. (editar) Sage y Cython mejorar sustancialmente la propuesta de valor de Python. La interfaz y la usabilidad han mejorado sustancialmente. Un código compilado que es 1000 veces más rápido que un código interpretado bastante bueno me parece genial (o increíble). EDITAR: Me he divertido usando el Anaconda (también conocido como conda), y también son muy fáciles de usar.

No soy un gran fan de Perl . Está un poco anticuado. Se trata de analizar y procesar texto más que de matemáticas/ciencia. No me malinterpretes, puede hacer matemáticas/ciencia, pero si sabes VBA entonces MSWord puede hacer matemáticas/ciencia. Ser capaz no es lo mismo que tener un trabajo particular como su enfoque principal.

Me gusta R aunque no lo hagas, porque está siendo desarrollado agresivamente por doctores cualificados en matemáticas/estadística. Esto significa que aunque la gramática pueda ser klugy, va a tener bibliotecas que están al día, y probadas sin errores. (En general)

Excel no es un mal comienzo. Una vez que se conoce una hoja de cálculo, resulta más fácil utilizar cualquier otra. En un entorno empresarial, casi todas las empresas tienen MicroSloth office así que Excel no es una mala idea. No me gustan sus scripts, pero eso es sólo preferencia, todavía puedo usarlo. Cuesta alrededor de 150 dólares americanos comparado con los 5000 dólares americanos de algunos de los otros softwares así que su coste de entrada para la gente normal es más razonable.

JMP script El lenguaje es ajeno. No se traduce a otro software (que no sea SAS). Aléjese de él. La única característica redimible del lenguaje es que puede (en algún sentido limitado) ejecutar código "R". Si usted está codificando en "R" sólo tiene que utilizar "R" y "RStudio".

No he utilizado MathCAD por lo que no puedo hablar de su relevancia. Creo que es más simbólico, menos sobre la importación de datos externos. Es más barato, hasta ahora. No es gratuito y abierto. La facilidad en él no se traduce en facilidad en otro idioma. ( EDITAR ) También en esta categoría está EES que tampoco me impresiona fuera de una ventana de uso muy estrecha.

EDITAR : Me ha impresionado un poco LabVIEW . Es lo suficientemente simple de usar que un par de horas puede conseguir alguien capaz. Se ejecuta muy rápido, como literalmente 1000x más rápido que MatLab para literalmente el mismo ( MathScript ) código. Si usted tiene un poco de peso, vale la pena un poco de consideración. Cuesta dinero, pero algo en la vecindad de 1/5 del hierro grande convencional.

Mucha suerte

EDIT: Yo no usaría Statistical LAboratory porque incluso cuando seleccionas "english" para el idioma sale en alemán, y no se desinstala en windows 7. Ambas debilidades administrativas hacen que sea un no-go para mí. No puedo manejarlo, y cuando intenté quitarlo falló.

Por ensayo y error descubrí la configuración del menú para que se muestre en inglés. Parece ser una interfaz relativamente simple (y por lo tanto útil y consistente) en algunas bibliotecas de R para el procesamiento y visualización de datos. Tendré que investigar más, así que en este momento "el jurado aún no ha decidido".

EDITAR más:

->Aquí<- es un enlace divertido a otra discusión sobre herramientas y bancos de trabajo.

2 votos

También hay RPy rpy.sourceforge.net R como una biblioteca para Python, de modo que se obtienen los aspectos actualizados y sin errores de R con la simplicidad sintáctica de Python.

2 votos

"entrenan a los usuarios para apretar botones y si el usuario quiere ir a otro sitio (JMP o lo que sea) no hay arrastre de aprendizaje". SAS, un programa propietario, no entrena especialmente bien para "apretar botones", y tener problemas para pasar de un lenguaje a otro no es una característica exclusiva del software propietario. Por ejemplo, me sentí más cómodo pasando de SysStat a JMP que de Python a R.

0 votos

@Epigrad - Lo veo apagar los cerebros de los ingenieros todo el tiempo. Docenas y docenas de personas. Me alegro de que le hayas encontrado utilidad, pero espero firmemente que seas un caso atípico y que la tendencia general de daño no cambie sustancialmente por tu experiencia.

1voto

Robert Jones Puntos 423

Podrías intentar usar Gnumeric, una hoja de cálculo muy bien pensada, también hay una hoja de cálculo de Open Office. Siempre que les expliques las dificultades de utilizar hojas de cálculo, en particular Excel, después de la universidad en su vida práctica posterior puede que no tengan el lujo de algo como SPSS, pero aún podrían obtener un servicio útil de estos productos gratuitos que no son demasiado exigentes en cuanto a conocimientos de matemáticas y programación. Muchos entornos de oficina contienen Excel por defecto.

Echa un vistazo:

http://groups.google.com/group/sci.stat.math/browse_thread/thread/26fe9a9a0d91139d# - Estadísticas y Excel 2007

y buscar referencias similares como

http://groups.google.com/group/comp.soft-sys.stat.spss/browse_frm/thread/3940bcd6c6266f1b/d85edd4978e53568?hl=en#d85edd4978e53568 Keeling, Kellie B. y Pavur, Robert J. (2007). A comparative study of the reliability of nine statistical software packages. Computational Statistics & Data Analysis, 51, 3811-3831.

1voto

TheRookierLearner Puntos 202

He estado CalEst . La licencia es barata, como 10 dólares y proporciona tanto cálculos/gráficos como grandes simulaciones/actividades para que los estudiantes practiquen. Además, en su página web, tienen algunas herramientas, principalmente sobre distribuciones que pueden ser útiles.

0 votos

Esta respuesta es un poco corta. ¿Podría explicar mejor por qué propone este software y qué ventajas tiene en comparación con la competencia?

1voto

Marie Puntos 3

Hemos empezado a utilizar Rguroo. Este software es de reciente aparición. Está basado en R, pero no se requieren conocimientos de codificación en R. Además, es una aplicación web, por lo que basta con acceder a ella en un navegador; no es necesario instalarla ni descargarla. Mis alumnos pueden guardar su trabajo en cualquier momento y volver a completarlo. La interfaz gráfica de usuario es muy intuitiva y los resultados son excelentes.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X