Estaba jugando con el uso de pagerank en los gráficos para hacer inferencias y los resultados parecían bastante buenos, pero pensé que los resultados mejorarían si eliminaba los nodos de puntuación más baja (que tienden a no ser buenos resultados en general).
Pensé que esto mejoraría los resultados, pero parece que está ocurriendo lo contrario, mis inferencias son muy inexactas ahora.
Así que mi pregunta, en general, ¿es mejor mantener el universo lo más grande posible al hacer inferencias o lo más probable es que esté haciendo algo mal aquí?
Gracias,
Nota: Soy un poco nuevo en matemáticas así que estoy preguntando esto no sólo específica a pagerank pero a otro tipo de inferencia / ranking de algo. Siempre he pensado que limpiar los datos es bueno, pero ahora no estoy seguro.