el agrupamiento es realmente doloroso - muchos dicen que no es correcto hacerlo, muchos otros, ofrecen la agrupación observando la respuesta, de todos modos vas a sentir un poco incómodo:)
A partir de los comentarios veo que es geográficas de datos que desea utilizar como variable predictora (códigos postales). A continuación, considere la posibilidad de kriging - lo he utilizado para un problema similar - predicción de el precio de la vivienda de la dirección única y estaba muy satisfecho, especialmente desde que se resolvió uno de los más importantes del problema - la predicción de los resultados en el caso de un nuevo predictor de nivel (desde el predictor se vuelve continuo, no categórica, usted será capaz de predecir el precio de entrega aún no había entrega de un código POSTAL determinado). Hermosos mapas de calor es otro bono.
Aquí es un buen conferencia (con buen acento italiano) por Fabio Veronesi con ejemplos de kriging con R.
http://www.fabioveronesi.net/r-course/lesson4.html
Uno de los problemas que se enfrentan es la geocodificación de las coordenadas GPS, y usted puede utilizar la función de geocodificación de ggmap paquete en R (utilizando el servicio gratuito de Google hasta cierto límite de consultas por día, me preguntó durante una semana para conseguir todo hecho).
http://cran.r-project.org/web/packages/ggmap/ggmap.pdf
Esperemos que esto era útil, feliz predecir.