Quiero desarrollar un modelo para recortar las ecuaciones de las preguntas de Matemáticas, ya que la gente como yo está luchando mucho por hacerlo manualmente para el propósito de la investigación. Quiero saber si se puede hacer esto y, en caso de que se pueda, cuál de todas las soluciones posibles para los modelos de reconocimiento de objetos producirá los mejores resultados. Texto imágenes.
Como existe la API de reconocimiento de objetos de tensorflow, RCNN, Fast RCNN, Faster RCNN, YOLO (v-1,2,3,4,5).
Y si hay algún otro, por favor, sugiéralo. Lo que quiero hacer es detectar las zonas grises de las ecuaciones en esta imagen .
Nota : La región gris que se muestra en la imagen es sólo para demostrar. Mis imágenes reales son simples preguntas recortadas de libros con fondo y letras negras (la mayoría de los libros)