3 votos

Preprocesamiento antes del reconocimiento de dígitos para NN y CNN entrenadas con el conjunto de datos MNIST

Estoy tratando de clasificar los dígitos de la escritura a mano, escritos por mí y algunos amigos, mediante el uso de NN y CNN. Para entrenar la NN, se utiliza el conjunto de datos MNIST. El problema es que la NN entrenada con el conjunto de datos MNIST no da resultados satisfactorios en mi conjunto de datos. He utilizado algunas bibliotecas en Python y MATLAB con diferentes configuraciones como se indica a continuación.

En Python he utilizado este código con el ajuste;

  • NN de 3 capas con # de entradas = 784, # de neuronas ocultas = 30, # de salidas = 10

  • Función de coste = entropía cruzada

  • de épocas = 30

  • Tamaño del lote = 10

  • Tasa de aprendizaje = 0,5

se entrena con el conjunto de entrenamiento MNIST, y los resultados de las pruebas son los siguientes:

resultado de la prueba en MNIST = 96% Resultado de la prueba en mi propio conjunto de datos = 80%.

En MATLAB he utilizado caja de herramientas de aprendizaje profundo con varios ajustes, incluida la normalización, similar a la anterior y la mejor precisión de la NN es de alrededor del 75%.Tanto la NN como la CNN se utilizan en MATLAB.

He intentado asemejar mi propio conjunto de datos al de MNIST. Los resultados anteriores se han obtenido a partir de un conjunto de datos preprocesados. Aquí están los preprocesos aplicados a mi conjunto de datos:

  • Cada dígito se recorta por separado y se redimensiona a 28 x 28 mediante interpolación bicúbica
  • Las trayectorias se centran en los valores medios de MNIST mediante el uso de un cuadro delimitador en MATLAB
  • El fondo es 0 y el valor más alto del píxel es 1, como en el MNIST

No sabía qué hacer más. Todavía hay algunas diferencias como el contraste, etc., pero los ensayos de mejora del contraste no pudieron aumentar la precisión.

Aquí hay algunos dígitos de MNIST y de mi propio conjunto de datos para compararlos visualmente.

MNIST digits

my own dataset

Como puede ver, hay una clara diferencia de contraste. Creo que el problema de precisión se debe a la falta de similitud entre MNIST y mi propio conjunto de datos. ¿Cómo puedo solucionar este problema?

Hay una pregunta similar en aquí pero su conjunto de datos es una colección de dígitos impresos, no como los míos.

Editar: También he probado la versión binarizada de mi propio conjunto de datos en la NN entrenada con MNIST binarizado y MNIST por defecto. El umbral de binarización es de 0,05.

Aquí hay una imagen de ejemplo en forma de matriz del conjunto de datos MNIST y de mi propio conjunto de datos, respectivamente. Ambas son 5.

MNIST

 Columns 1 through 10

             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0    0.1176    0.1412
             0         0         0         0         0         0         0    0.1922    0.9333    0.9922
             0         0         0         0         0         0         0    0.0706    0.8588    0.9922
             0         0         0         0         0         0         0         0    0.3137    0.6118
             0         0         0         0         0         0         0         0         0    0.0549
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0    0.0902    0.2588
             0         0         0         0         0         0    0.0706    0.6706    0.8588    0.9922
             0         0         0         0    0.2157    0.6745    0.8863    0.9922    0.9922    0.9922
             0         0         0         0    0.5333    0.9922    0.9922    0.9922    0.8314    0.5294
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0

      Columns 11 through 20

             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0    0.0118    0.0706    0.0706    0.0706    0.4941    0.5333    0.6863    0.1020
        0.3686    0.6039    0.6667    0.9922    0.9922    0.9922    0.9922    0.9922    0.8824    0.6745
        0.9922    0.9922    0.9922    0.9922    0.9922    0.9922    0.9922    0.9843    0.3647    0.3216
        0.9922    0.9922    0.9922    0.9922    0.7765    0.7137    0.9686    0.9451         0         0
        0.4196    0.9922    0.9922    0.8039    0.0431         0    0.1686    0.6039         0         0
        0.0039    0.6039    0.9922    0.3529         0         0         0         0         0         0
             0    0.5451    0.9922    0.7451    0.0078         0         0         0         0         0
             0    0.0431    0.7451    0.9922    0.2745         0         0         0         0         0
             0         0    0.1373    0.9451    0.8824    0.6275    0.4235    0.0039         0         0
             0         0         0    0.3176    0.9412    0.9922    0.9922    0.4667    0.0980         0
             0         0         0         0    0.1765    0.7294    0.9922    0.9922    0.5882    0.1059
             0         0         0         0         0    0.0627    0.3647    0.9882    0.9922    0.7333
             0         0         0         0         0         0         0    0.9765    0.9922    0.9765
             0         0         0         0    0.1804    0.5098    0.7176    0.9922    0.9922    0.8118
             0         0    0.1529    0.5804    0.8980    0.9922    0.9922    0.9922    0.9804    0.7137
        0.0941    0.4471    0.8667    0.9922    0.9922    0.9922    0.9922    0.7882    0.3059         0
        0.8353    0.9922    0.9922    0.9922    0.9922    0.7765    0.3176    0.0078         0         0
        0.9922    0.9922    0.9922    0.7647    0.3137    0.0353         0         0         0         0
        0.9922    0.9569    0.5216    0.0431         0         0         0         0         0         0
        0.5176    0.0627         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0

      Columns 21 through 28

             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
        0.6510    1.0000    0.9686    0.4980         0         0         0         0
        0.9922    0.9490    0.7647    0.2510         0         0         0         0
        0.3216    0.2196    0.1529         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
        0.2510         0         0         0         0         0         0         0
        0.0078         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0

Mi propio conjunto de datos

Columns 1 through 10

             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0    0.4000    0.5569
             0         0         0         0         0         0         0         0    0.9961    0.9922
             0         0         0         0         0         0         0         0    0.6745    0.9882
             0         0         0         0         0         0         0         0    0.0824    0.8745
             0         0         0         0         0         0         0         0         0    0.4784
             0         0         0         0         0         0         0         0         0    0.4824
             0         0         0         0         0         0         0         0    0.0824    0.8745
             0         0         0         0         0         0         0    0.0824    0.8392    0.9922
             0         0         0         0         0         0         0    0.2392    0.9922    0.6706
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0    0.4431    0.3608
             0         0         0         0         0         0         0    0.3216    0.9922    0.5922
             0         0         0         0         0         0         0    0.3216    1.0000    0.9922
             0         0         0         0         0         0         0         0    0.2784    0.5922
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0

      Columns 11 through 20

             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0    0.2000    0.5176    0.8392    0.9922    0.9961    0.9922    0.7961    0.6353
        0.7961    0.7961    0.9922    0.9882    0.9922    0.9882    0.5922    0.2745         0         0
        0.9569    0.7961    0.5569    0.4000    0.3216         0         0         0         0         0
        0.7961         0         0         0         0         0         0         0         0         0
        0.9176    0.1176         0         0         0         0         0         0         0         0
        0.9922    0.1961         0         0         0         0         0         0         0         0
        0.9961    0.3569    0.2000    0.2000    0.2000    0.0392         0         0         0         0
        0.9922    0.9882    0.9922    0.9882    0.9922    0.6745    0.3216         0         0         0
        0.7961    0.6353    0.4000    0.4000    0.7961    0.8745    0.9961    0.9922    0.2000    0.0392
             0         0         0         0         0    0.0784    0.4392    0.7529    0.9922    0.8314
             0         0         0         0         0         0         0         0    0.4000    0.7961
             0         0         0         0         0         0         0         0         0    0.0784
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0    0.0824    0.4000    0.4000    0.7176
        0.9176    0.5961    0.6000    0.7569    0.6784    0.9922    0.9961    0.9922    0.9961    0.8353
        0.5922    0.9098    0.9922    0.8314    0.7529    0.5922    0.5137    0.1961    0.1961    0.0392
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0         0         0

      Columns 21 through 28

             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
        0.1608         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
        0.1608         0         0         0         0         0         0         0
        0.9176    0.2000         0         0         0         0         0         0
        0.8353    0.9098    0.3216         0         0         0         0         0
        0.2431    0.7961    0.9176    0.4392         0         0         0         0
             0    0.0784    0.8353    0.9882         0         0         0         0
             0         0    0.6000    0.9922         0         0         0         0
             0    0.1608    0.9137    0.8314         0         0         0         0
        0.1216    0.6784    0.9569    0.1569         0         0         0         0
        0.9137    0.8314    0.3176         0         0         0         0         0
        0.5569    0.0784         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0
             0         0         0         0         0         0         0         0

-1voto

TwentyMiles Puntos 2111

¿Ha centrado las imágenes de su conjunto de datos por el centro de masa? El conjunto de datos MNIST original lo utiliza como un paso de preprocesamiento.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X