Tengo millones de documentos generados por los usuarios que contienen especificaciones de teléfonos inteligentes. Quiero obtener ciertas propiedades de esos documentos, por ejemplo Sistema operativo, resolución de la pantalla, procesador, RAM, resolución de la cámara. Ejemplo de documento:
GSM / HSPA / LTE
Dimensions 142.1 x 71.8 x 7.9 mm (5.59 x 2.83 x 0.31 in)
Weight 146 g (5.15 oz)
SIM Optional Dual SIM (Micro-SIM, dual stand-by)
Type Super AMOLED capacitive touchscreen, 16M colors
Size 5.0 inches (~67.5% screen-to-body ratio)
Resolution 720 x 1280 pixels (~294 ppi pixel density)
Multitouch Yes
OS Android OS, v5.1 (Lollipop)
Chipset Qualcomm MSM8916 Snapdragon 410
CPU Quad-core 1.2 GHz Cortex-A53
GPU Adreno 306
Card slot microSD, up to 128 GB
Internal 8 GB, 1.5 GB RAM
Primary 13 MP, 4128 x 3096 pixels, autofocus, LED flash
Features Geo-tagging, touch focus, face detection
Video 1080p@30fps
Secondary 5 MP, LED flash
De ese documento, quiero tener esto:
OS: Android
Display resolution: 720 x 1280
Processor: Quad-core 1.2 GHz Cortex-A53
RAM: 1.5GB
Camera resolution: 13MP, 5MP
Tenga en cuenta que mi documento no siempre será tan bueno, de hecho es uno de el más estructurado documento. ¿Cuál es el nombre del problema que quiero resolver? ¿Es un problema de "reconocimiento de entidades con nombre"?