4 votos

Principiante en predicción/estadística: ¿Por dónde empiezo?

Me disculpo sinceramente si ya existe otro hilo que responda a esta pregunta. Estoy tan increíblemente fuera de mi liga aquí que ni siquiera sé qué palabras clave para buscar :-).

Soy programador informático de profesión y, aunque tengo conocimientos básicos de matemáticas, la estadística nunca ha sido lo mío.

Actualmente trabajo en una escuela y acabo de terminar de desarrollar un conjunto básico de herramientas para ayudar a recopilar y analizar automáticamente datos sobre los comportamientos de nuestros alumnos (se trata de una escuela para niños con autismo y otras discapacidades). Por lo tanto, tenemos un par de años de datos para cosas como: dado Billy, con qué frecuencia tuvo Agresiones, Comportamientos Autolesivos, Caídas, etc. Probablemente entre 6 y 10 "entradas" (creo que es el término correcto) por alumno. Añadiremos más en el futuro.

Lo que me intriga es lo siguiente: Por ejemplo, sería interesante poder predecir cuándo es probable que Billy tenga una larga cadena de agresiones, dado que estos x otros factores han aumentado últimamente. O bien, hay una tendencia creciente de este comportamiento que está muy lejos de sus valores anteriores, que debe levantar una gran bandera roja.

He estado buscando en Google y parece que esto pertenece al ámbito de la "minería estadística de datos"; he encontrado algunos tutoriales breves en Sitio web de Andrew Moore pero no son lo suficientemente detallados como para que aprenda algo.

Me doy cuenta de que esto es parecido a que alguien entre en Stack Overflow y diga "Oye, dime cómo escribir el próximo Facebook". Así que, si este es el tipo de cosas que sólo puedo hacer con años y años de experiencia estadística, sólo házmelo saber y seguiré mi camino. Sin embargo, también sé que aunque alguien no podría entrar en SO y escribir el próximo Facebook en unas semanas, probablemente podríamos indicarle la dirección correcta para crear un sitio básico para el negocio de su padre, aunque fuera un sitio bastante básico. Del mismo modo, no estoy tratando de crear un genio de la IA capaz de predecir el comportamiento de los estudiantes hasta el milisegundo; más bien, sólo tengo curiosidad por saber si hay alguna fruta madura que un tipo como yo podría recoger en unas pocas semanas o meses de lectura diligente que podría hacer algunos usos interesantes de estos nuevos datos que hemos desbloqueado.

Estoy abierto a tutoriales en línea, libros, libros de texto, vídeos, programas y bibliotecas de código abierto, etc.

3voto

Marton Puntos 299

Uno de mis colegas de StatSoft ha elaborado esta serie de vídeos.

http://www.statsoft.com/textbook/data-mining-techniques/

Los enlaces a los libros de texto también son útiles.

¡¡Buena suerte!!

1voto

Gulzar Nazim Puntos 35342

"Detección de anomalías": suele denominarse detección de valores atípicos. Puede encontrar muchas referencias en Google.

"¿pueden más agresiones predecir más conductas autolesivas?" -- Puedes probar con una de las cosas básicas: la correlación entre distintas variables o características (tú las has llamado "inputs").

Los datos serán más fáciles de analizar si tienen el formato, por ejemplo, "número de xxx incidentes por semana", es decir, si sus variables se medirán en la misma escala temporal.

1voto

daniel Puntos 831

Parece que tiene unos datos maravillosos con los que trabajar. Una persona sugirió probar los análisis en R, y sin duda es una opción potente. Con tus conocimientos de programación, puede ser muy adecuado para ti. Personalmente, prefiero un programa como SPSS, que está diseñado específicamente para el análisis sencillo de datos de ciencias sociales. Si no conoce el programa, le sugiero el "SPSS Survival Manual" de Julie Pallant, que contiene instrucciones básicas para los análisis más comunes.

Independientemente del software, parece que el uso de correlaciones, regresiones y algunas series temporales podría ayudarle a investigar sus variables. Si te parece abrumador aprender todas las estadísticas en poco tiempo, te sugiero que hagas publicidad del hecho de que tienes datos con los que trabajar. Estoy seguro de que los estudiantes de psicología o de posgrado de una universidad cercana aprovecharían la oportunidad para ayudarte a realizar análisis y, posiblemente, publicar resultados útiles. Mucha suerte.

0voto

pirho Puntos 1387

Entiendo que quiere modelizar datos longitudinales. Un punto de partida puede ser este tutorial http://www.ats.ucla.edu/stat/r/examples/alda/ch2.htm utiliza el paquete estadístico de código abierto R.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X