Actualmente estoy experimentando con gridsearch para entrenar a una máquina de soporte vectorial. Entiendo que, si he parámetro gamma y C, la función R melodía.svm realiza un 10-fold cross validation para todas las combinaciones de estos 2 parámetros.
Como yo no sabía cómo empezar, he tratado de obtener alguna información sobre ella, por ejemplo la wikipedia2 sugiere valores que no son lineales, por ejemplo, C en el rango {10, 100, 1000}.
Hasta ahora puedo usar los ejemplos de mi segundo enlace de wikipedia, que es:
gammas = 2^(-15:3)
costs = 2^(-5:15)
Que se traduce en 399 combinaciones.
Esto se lleva muy, muy largo (~2000 muestras). Por ejemplo, para el núcleo "radial" mi mejor resultado es el gamma = 0.5 y coste = 2.
No puedo obtener el mismo resultado si acabo de utilizar valores como (1, 2, 3, 4, ... 10) por los costos y la (0, 0.5, 1, 1.5, 2) para gammas? Sé que este ejemplo se construye porque ya sé el resultado.
Mi pregunta:
Pero, ¿por qué este exponencial de la escala?
Hay tantos valores entre 0 y 1 que creo que esto es una pérdida de tiempo de cálculo y sólo unos números muy grandes que no podía encontrar un resultado exacto de todos modos. Esto sólo tendría sentido para mí si este fue utilizado para encontrar un rango menor, digamos que saber que el mejor costo es de 2^3 y, a continuación, realizamos la búsqueda en torno a eso. Pero en ninguna parte se menciona que se realiza de esa manera.