1 votos

R- Problemas para entender qué función de pérdida utiliza el algoritmo Genmatch (emparejamiento genético).

Tengo problemas para entender qué función de pérdida se minimiza para garantizar que convergemos hacia el mejor conjunto de pesos en la función Genmatch de R. He leído el artículo al respecto y, si lo he entendido bien, parece decir cosas contradictorias en la misma página.

1) Primero dice que se minimiza una versión generalizada de la distancia mahalanobis. Esto no tiene mucho sentido, ya que esta métrica de distancia sólo sirve para medir la distancia entre 2 sujetos, y no tiene en cuenta el equilibrio general entre 2 poblaciones. Si minimiza la distancia media entre las dos poblaciones, esto no se indica en el artículo, y tampoco parece indicarse en ningún otro lugar. Extracto:

enter image description here

2) A continuación, en la misma página, se indica que el equilibrio global se maximiza utilizando los valores p de las pruebas t y KS. Esto me parece más lógico. Pero no estoy seguro de cómo influye la distancia de Mahalanobis mencionada anteriormente. Extracto: enter image description here

Si alguien sabe qué función de pérdida se está utilizando por favor hágamelo saber

Enlace a la ponencia: https://www.mitpressjournals.org/doi/10.1162/REST_a_00318

2voto

Noah Puntos 85

La función de pérdida es, en efecto, el valor p mínimo resultante de un conjunto de pruebas de equilibrio en la muestra emparejada. La muestra se forma realizando el emparejamiento. La métrica de distancia utilizada para el emparejamiento es la GMD. La GMD incorpora un vector de ponderaciones (una por cada covariable). Estos pesos son las variables sobre las que se produce la optimización.

De forma progresiva, el algoritmo estima un conjunto de ponderaciones, calcula la GMD de cada par de individuos utilizando esas ponderaciones, empareja los pares de unidades con GMD pequeñas y, a continuación, realiza las pruebas de equilibrio en la muestra emparejada. El valor p más pequeño de estas pruebas de equilibrio es el valor de la función de pérdida para ese conjunto de ponderaciones. A continuación, se prueba con un nuevo conjunto de ponderaciones y se vuelve a evaluar el valor p más pequeño. El resultado del algoritmo es un conjunto de ponderaciones "óptimas", que puede utilizar para calcular la GMD en su muestra, realizar el emparejamiento en la GMD y, a continuación, estimar el efecto del tratamiento en la muestra emparejada.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X