7 votos

Cuándo y cómo utilizar pesos para la secuencia de análisis en las ciencias sociales?

Ponderación en el análisis de la secuencia

Hasta el momento, no han encontrado trabajos que aborden el tema de la ponderación para el análisis de la secuencia (usando por ejemplo el óptimo algoritmo de coincidencia). Análisis de la secuencia normalmente implica varios pasos:

  1. configuración o para el cálculo de la sustitución y de la inserción/deleción de los costos,
  2. cálculo de la distancia de las matrices y
  3. siguiendo los análisis de agrupamiento o discrepancia análisis[1].

Al menos, el R-paquete TraMineR (ver Gabadinho et al. 2010 y Gabadinho et al. De 2011, pág. 11) y el programa Stata-ado SEQCOMP por Laurent Lesnard hace posible incluir los pesos en el paso 1 y 3.
Además, Lesnard explícitamente recomienda el uso de pesos de muestra para los pasos 1 y 3:

"Las ponderaciones muestrales sólo debe utilizarse para calcular las matrices de transición, y, en consecuencia, costes de sustitución. En lugar de contar el número de transiciones, es simplemente el promedio ponderado de número de transiciones que deben ser tomados en cuenta. El la coincidencia de procedimiento en sí mismo, es decir, la comparación de pares de secuencias, no no requiere ningún pesos; es, por definición, un uno a un procedimiento. Sin embargo, de la muestra los pesos deben ser encendidos en la interpretación de los resultados, por ejemplo, si el análisis de cluster es utilizado, el tamaño de los clusters obtenidos debe ser ponderado."
Lesnard (2010: 415, nota 12)

Preguntas abiertas

Sin embargo, no parece haber un consenso en la literatura cuando y que los pesos son necesarias o útiles.

  • ¿Cuál crees que es el mejor fundamento para la aplicación de los pesos en el análisis de la secuencia?
  • Cuando se debe de secuencias de ser ponderado?
  • ¿El uso transversal de los pesos de muestreo o longitudinal pesos de contabilidad para el muestreo de probabilidades así como el panel de desgaste?
  • ¿Cómo se aplican los pesos si usted tiene desequilibrada de datos de panel?
  • El uso de pesas en TraMineR está bien documentado; pero, ¿tiene ejemplos para el uso de las pesas con Stata-ado?

Referencias

  • Gabadinho, Alexis, Gilbert Ritschard, Matías Studer y Nicolas S. Müller (2010): la Minería de datos de la secuencia en R con la TraMineR paquete: Una guía del usuario, La universidad de Ginebra.
  • Gabadinho, Alexis, Gilbert Ritschard, Nicolas S. Müller y Matías Studer(2011): Análisis y la visualización de secuencias del estado en R con TraMineR, en: Revista de Estadística de Software, Vol. 40, Nº 4, pp 1-37.
  • Lesnard, Laurent (2010): Ajuste de Costos en optimizadas para Descubrir Contemporáneas Socio-Temporal de los Patrones, en: Sociológica y Métodos de Investigación, Vol. 38, Nº 3, pp 389-419.
  • Studer, Matías, Gilbert Ritschard, Alexis Gabadinho y Nicolas S. Müller (2011): Análisis de discrepancias de Secuencias del Estado, en: Sociológica y Métodos de Investigación. Vol. 40, Nº 3, pp 471-510.

[1] Ver Studer et al. (2011) para una presentación de análisis de discrepancias que es un ANOVA como enfoque para la distancia de las matrices.

2voto

serhio Puntos 101

Supongo que usted está usando los pesos de muestreo para corregir por sesgo de representatividad. Por favor, tenga en cuenta que algunos de los "proveedores de datos" requieren de la utilización de los pesos en sus publicaciones.

En mi opinión, siempre se debe utilizar pesos para el análisis descriptivo con el fin de obtener resultados objetivos. Creo que hay más consenso para este tipo de análisis. Análisis descriptivo incluye un análisis de cluster, las secuencias de visualización, cálculo de tasas de transiciones (y, por tanto, la sustitución de los costos basados en ellos), por ejemplo. Para ponderado análisis de cluster, se puede echar un vistazo a la WeightedCluster biblioteca y manual.

Con respecto a los pesos a utilizar, yo recomendaría usar longitudinal de pesos, ya que las secuencias se definen para el conjunto del período, pero depende de el peso exacto de la definición. Para una respuesta más general, es necesario responder a las siguientes preguntas:

  • Lo que muestra qué tengo (¿a qué hora, y así sucesivamente)?
  • para que la población no quiero generalizar?

En algunos paneles longitudinales de pesos utilice el modelo definido por la onda t y generalizar a la población en onda uno. Esto es lo que usted desea si usted quiere seguir la evolución en la onda.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X