El estadístico t tiene mucho sentido como estadística de prueba; mucha gente lo encuentra intuitivo. Si cito un estadístico t de 0,5 o 5,5, te dice algo: cuántos errores estándar separan las medias.
La dificultad -al menos con la no normalidad moderada- no es tanto el uso de la estadística como el uso de la distribución t para su distribución bajo el nulo. La estadística es bastante sensata.
Por supuesto, si se esperan colas mucho más pesadas que la normalidad, un estadístico más robusto lo haría mejor, pero el estadístico t no es muy sensible a las desviaciones leves de la normalidad (por ejemplo, es menos sensible que el estadístico de la razón de varianza).
Si quiere utilizar sólo el numerador de la estadística, es estupendo, tiene perfecto sentido como estadística de permutación, si está interesado en una diferencia de medias. Si está interesado en un sentido más general del cambio de ubicación, abre una plétora de otras posibilidades.
Tienes razón al pensar que hay mucha libertad para elegir una estadística y adaptarla a las circunstancias particulares: contra qué alternativas quieres poder, o a qué posibles problemas te gustaría ser robusto (la contaminación, por ejemplo, puede afectar a la potencia).
En realidad, casi no hay restricciones: eres libre de elegir casi cualquier cosa, incluidas las estadísticas inútiles de las pruebas. Por supuesto, hay algunas consideraciones que deberías tener en cuenta a la hora de elegir las pruebas, pero eres libre de no hacerlo.
--
Dicho esto, hay algunos criterios que pueden aplicarse en diversas circunstancias.
Por ejemplo, si está especialmente interesado en un tipo específico de hipótesis, puede utilizar un estadístico que lo refleje; por ejemplo, si quiere probar una diferencia en las medias de la población, a menudo tiene sentido hacer que su estadístico de prueba esté relacionado con una diferencia en las medias de la muestra.
Si sabe algo sobre el tipo de distribución que podría tener -colas pesadas, o asimétricas, o teóricamente de colas ligeras pero con cierto grado de contaminación, o bimodal, ... puede idear un estadístico de prueba que podría funcionar bien en tales circunstancias, por ejemplo, eligiendo un estadístico que debería funcionar bien en la situación prevista pero que tiene cierta solidez ante la contaminación.
--
La simulación es una forma de investigar la potencia en diversas situaciones.