Ponderación en el análisis de la secuencia
Hasta el momento, no han encontrado trabajos que aborden el tema de la ponderación para el análisis de la secuencia (usando por ejemplo el óptimo algoritmo de coincidencia). Análisis de la secuencia normalmente implica varios pasos:
- configuración o para el cálculo de la sustitución y de la inserción/deleción de los costos,
- cálculo de la distancia de las matrices y
- siguiendo los análisis de agrupamiento o discrepancia análisis[1].
Al menos, el R-paquete TraMineR (ver Gabadinho et al. 2010 y Gabadinho et al. De 2011, pág. 11) y el programa Stata-ado SEQCOMP por Laurent Lesnard hace posible incluir los pesos en el paso 1 y 3.
Además, Lesnard explícitamente recomienda el uso de pesos de muestra para los pasos 1 y 3:
"Las ponderaciones muestrales sólo debe utilizarse para calcular las matrices de transición, y, en consecuencia, costes de sustitución. En lugar de contar el número de transiciones, es simplemente el promedio ponderado de número de transiciones que deben ser tomados en cuenta. El la coincidencia de procedimiento en sí mismo, es decir, la comparación de pares de secuencias, no no requiere ningún pesos; es, por definición, un uno a un procedimiento. Sin embargo, de la muestra los pesos deben ser encendidos en la interpretación de los resultados, por ejemplo, si el análisis de cluster es utilizado, el tamaño de los clusters obtenidos debe ser ponderado."
Lesnard (2010: 415, nota 12)
Preguntas abiertas
Sin embargo, no parece haber un consenso en la literatura cuando y que los pesos son necesarias o útiles.
- ¿Cuál crees que es el mejor fundamento para la aplicación de los pesos en el análisis de la secuencia?
- Cuando se debe de secuencias de ser ponderado?
- ¿El uso transversal de los pesos de muestreo o longitudinal pesos de contabilidad para el muestreo de probabilidades así como el panel de desgaste?
- ¿Cómo se aplican los pesos si usted tiene desequilibrada de datos de panel?
- El uso de pesas en TraMineR está bien documentado; pero, ¿tiene ejemplos para el uso de las pesas con Stata-ado?
Referencias
- Gabadinho, Alexis, Gilbert Ritschard, Matías Studer y Nicolas S. Müller (2010): la Minería de datos de la secuencia en R con la TraMineR paquete: Una guía del usuario, La universidad de Ginebra.
- Gabadinho, Alexis, Gilbert Ritschard, Nicolas S. Müller y Matías Studer(2011): Análisis y la visualización de secuencias del estado en R con TraMineR, en: Revista de Estadística de Software, Vol. 40, Nº 4, pp 1-37.
- Lesnard, Laurent (2010): Ajuste de Costos en optimizadas para Descubrir Contemporáneas Socio-Temporal de los Patrones, en: Sociológica y Métodos de Investigación, Vol. 38, Nº 3, pp 389-419.
- Studer, Matías, Gilbert Ritschard, Alexis Gabadinho y Nicolas S. Müller (2011): Análisis de discrepancias de Secuencias del Estado, en: Sociológica y Métodos de Investigación. Vol. 40, Nº 3, pp 471-510.
[1] Ver Studer et al. (2011) para una presentación de análisis de discrepancias que es un ANOVA como enfoque para la distancia de las matrices.