Estoy empezando a jugar con las redes neuronales por diversión después de jugar con algo de regresión lineal básica. Soy profesor de inglés, así que no tengo conocimientos de matemáticas y tratar de leer un libro sobre este tema me supera. Pensé que esta sería una mejor vía para obtener algunas preguntas básicas contestadas (aunque sospecho que no hay una respuesta fácil). Sólo busco una orientación general en términos sencillos. Estoy utilizando una versión de prueba de un complemento de Excel llamado NEURO XL. Me disculpo si estas preguntas son demasiado "elementales".
Mi primer proyecto está relacionado con la predicción de la puntuación verbal de un estudiante en el SAT en base a una serie de resultados de los exámenes, el GPA, las puntuaciones de los exámenes de práctica, etc., así como algunos datos cualitativos (género: M=1
, F=0
; tomó clases de preparación para el SAT: Y=1
, N=0
; practica deportes universitarios: Y=1
, N=0
).
En total, tengo 21 variables que me gustaría introducir en la red, siendo la salida la puntuación real (200-800).
Tengo 9000 registros de datos que abarcan muchos años/alumnos. Estas son mis preguntas:
1) ¿Cuántos registros de los 9000 debo utilizar para entrenar la red? 1a. ¿Debería aleatorizar completamente la selección de estos datos de entrenamiento o implicarme más y asegurarme de incluir una variedad de puntuaciones de salida y un amplio rango de cada una de las variables de entrada?
2) Si divido los datos en un número par, digamos 9 $\times$ 1000 (o el número que sea) y creé una red para cada una, luego probé los resultados de cada una de estas 9 en los otros 8 conjuntos para ver cuál tenía el MSE más bajo en todas las muestras, ¿sería esta una forma válida de "elegir" la mejor red si quisiera predecir las puntuaciones de mis estudiantes entrantes (no incluidos en estos datos en absoluto)?
3) Dado que las puntuaciones de las pruebas que estoy utilizando como entradas varían en la escala (algunas están en 1-100 y otras en 1-20, por ejemplo), ¿debo normalizar todas las entradas a sus respectivas puntuaciones z? ¿Cuándo es recomendable o no?
4) Estoy prediciendo la puntuación real, pero en realidad, NO me preocupa tanto la puntuación exacta sino más bien un rango. ¿Sería mi red más precisa si agrupara las puntuaciones de salida en cubos y luego tratara de predecir este número en lugar de la puntuación real?
Por ejemplo
750-800 = 10
700-740 = 9
etc.
¿Hay alguna ventaja en hacer esto o debería seguir adelante e intentar predecir la puntuación exacta?
Y si lo único que me importaba era si la puntuación era superior o inferior a 600. Entonces, ¿podría simplemente hacer la salida 0 (por debajo de 600) o 1 (por encima de 600)?
5a) He leído en algún sitio que no es bueno utilizar 0 y 1, sino 0,1 y 0,9, ¿por qué?
5b) ¿Qué tal -1(por debajo de 600), 0(exactamente 600), 1(por encima de 600), funcionaría esto?
5c) ¿La red siempre dará como resultado -1, 0, 1 - o dará como resultado fracciones que luego tendré que redondear hacia arriba o hacia abajo para finalizar la predicción?
5d) Una vez que haya encontrado la "mejor" red de la pregunta 3, ¿podría jugar con los diferentes parámetros (número de épocas, número de neuronas en la capa oculta, impulso, tasa de aprendizaje, etc.) para optimizarla aún más?
6a) ¿Qué pasa con la función de activación? ¿Servirá la función Log-sigmoide o debo probar las otras opciones que tiene mi software (umbral, tangente hiperbólica, log-sigmoide de base cero)?
6b) ¿Cuál es la diferencia entre log-sigmoide y log-sigmoide de base cero?
3 votos
Si tus conocimientos de machine learning o estadística son bajos te sugiero que evites la red neuronal y utilices una herramienta más sencilla. Por ejemplo, random forest.
1 votos
Estoy de acuerdo en que debería evitar las redes neuronales por completo, pero no considero que el bosque aleatorio sea una herramienta más sencilla. Yo recomendaría k-nearest neighbours o Naive Bayes.
0 votos
Aunque esta pregunta es interesante, hay un problema fundamental en ella: contiene demasiadas preguntas y, por tanto, debería marcarse como demasiado amplia. ¿Y qué pasa con eso?
0 votos
Por favor, escriba un título más informativo.