He estado leyendo un montón de artículos sobre la PNL que utilizan el truco de hashing, y me encontré con un montón de frases como : "Tomamos k funciones hashing para hacer hash de palabras o bi-gramas".
Y después nunca mencionan qué funciones utilizan exactamente, y sin una implementación abierta no puedo comprobarlo por mi cuenta.
¿Existe alguna convención sobre la función hash que yo desconozca (es decir, las funciones k deberían ser obvias para el lector), por ejemplo, existe alguna función hash canónica que haga que la referencia sea opcional? ¿O se trata de un problema de diseño crítico que se evita intencionadamente (o no)? O, por último, ¿se trata de una elección sin gran impacto en el resultado (creo que es poco probable)?