¿Qué acerca del uso re
y set
y la configuración de una bandera ( de aquí el 0 y el 1) en python- re
extraerá todos los nombres (primera y última) de BENNETT MCCARL & ARNETTE BENNETT
sin &
. Por la coincidencia de patrón re
es de la más alta prioridad - se puede usar re
cómo desea.
import re
def sorter(val):
words = re.findall(r'\w+',val)
uniques = set(words)
if len(words)>len(uniques):
return 1
else:
return 0
Y llame a sorter( !N! )
Ver cómo regex
las apropiaciones de las palabras en la DEMOSTRACIÓN en VIVO
Tenga en cuenta que todas estas respuestas tratar el problema suponiendo que los datos se desinfecta es decir, tener un adecuado espacio entre las palabras , pero ¿y si sus datos son algo como BENNETTMCCARL&ARNETTEBENNETT
, a continuación, todos estos sería un fracaso. En ese caso, puede que necesite utilizar el Sufijo Árbol de algoritmo y, afortunadamente, python tiene alguna biblioteca como aquí.