Supongamos que tengo una base de datos con alrededor de un millón de palabras y quiero hacerme una idea intuitiva de cómo se distribuye exactamente una palabra concreta, bastante infrecuente, en estos datos. Mi objetivo es poder ver claramente si esta palabra tiende a agruparse o si su distribución es relativamente uniforme. ¿Cuáles serían algunos buenos métodos para visualizar esto?
Por ejemplo, he visto algo que parece útil. Es básicamente una tira (rectángulo largo) en la que cada instancia de algo está representada por una línea vertical roja muy fina. El problema es que no sé cómo se llaman, y por lo tanto no puedo averiguar cómo hacer algo como esto en R.
Cualquier ayuda para encontrar la función R adecuada para ello, o cualquier otra sugerencia sobre buenas formas de visualizar este tipo de datos, sería muy apreciada.