6 votos

Paquetes de pitón para la imputación de datos numéricos

Estoy trabajando con datos numéricos multivariados con muchos valores perdidos (por lo que eliminar todas las entradas o columnas con datos perdidos no es una opción).

¿Existe un paquete Python para la imputación de datos?

Me interesan principalmente los métodos basados en la regresión lineal (más la estimación de la varianza de la variable pronosticada).

3voto

Nick Russo Puntos 51

scikit-learn tiene una clase de "Imputador" que deberías investigar.

EDITORIAL: Parece que esta clase no soporta la imputación de un modelo lineal. Siempre se puede intentar modificar el código de Sklearn para que lo soporte, tal vez incluso enviar una solicitud de extracción: https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/preprocessing/imputation.py

EDITORIAL 2: Parece que tendrás mejor suerte con las facultades de imputación más versátiles disponibles en el Naranja biblioteca.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X