Tengo un conjunto de datos de texto de tal manera que para cada documento del texto tengo más características como la categoría del documento, la subcategoría del documento y algunas características anónimas que son flotantes. Puedo modelar un modelo teniendo en cuenta sólo las características TF-IDF del texto de cada documento, pero no utilizaré otra información relevante codificada en otras características. Una forma podría ser añadir estas características al texto del documento y luego hacer TF-IDF, lo cual es obviamente incorrecto.
¿Puede alguien ayudarme a entender cómo puedo utilizar estas otras características del conjunto de datos junto con el texto para construir un modelo?