4 votos

Tratamiento de los valores nulos en la regresión lineal, que se supone que son mayores que los valores no nulos

Actualmente estoy haciendo una regresión lineal, en la que intento predecir los precios de la vivienda en función de diferentes variables que describen las características espaciales de la misma (como la distancia a la ciudad más cercana, la carretera más próxima, etc.).

Mi problema es que uno de los conjuntos de datos originales sólo ha calculado la distancia a la carretera más cercana si la carretera se encuentra en un radio de 2 km de la casa, por lo que cualquier casa que no tenga una carretera más cercana a 2 km ha obtenido un valor NULL en lugar de la distancia.

Por lo tanto, me preguntaba si es posible sustituir estos valores nulos, por ejemplo, por algún valor superior a 2 km.

0 votos

Esto será complicado... Primero necesito que me expliques por qué tu foto de perfil es Thyra Frank

2 votos

Hay una etiqueta en este sitio intervalo de censura que contiene algunos hilos que pueden ser de su interés.

1voto

Ashok Puntos 108

Mi sugerencia sería incluir un maniquí si los valores faltan. Si es significativo se puede concluir que vivir a más de 2 km de una carretera (disminuye, probablemente) el valor de la vivienda.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X