1 votos

Análisis de componentes principales: ¿utilización de la varianza como variable?

Estoy siguiendo los métodos de una colaboradora para analizar un conjunto de grabaciones de audio, y he descubierto que está utilizando el análisis de componentes principales de una manera inesperada. Estoy confundido por su enfoque, y agradecería comentarios sobre si esta es la manera correcta de pensar y utilizar PCA.

Dispongo de varias grabaciones de audio, cada una de ellas de diferentes oradores, y el objetivo final es utilizar un análisis de variantes canónicas para asignar estas grabaciones al orador correcto en función de un conjunto reducido de variables. Para obtener estas variables, divido cada grabación en 80 fotogramas y tomo 20 medidas diferentes para cada fotograma. (Para que quede claro, estas 20 variables son coeficientes cepstrales de mel-frecuencia, pero se puede pensar en ellas como parámetros acústicos típicos como el tono y la amplitud para que quede más claro). Esto me deja con 80×20 mediciones para cada grabación, y quiero reducirlas a un conjunto más pequeño de variables que realmente utilizaré para comparar distintas grabaciones en mi futuro análisis de variantes canónicas. Para mí, el uso de PCA parece un enfoque razonable aquí, y mi colaborador está de acuerdo. Sin embargo, lo que hace, bajo el título "PCA", es calcular el valor propio de cada variable a través de los 80 cuadros, y retener este valor de varianza. Como sólo hay una variable, sólo hay un componente principal, y sólo un valor de varianza (que explica el 100% de la varianza). Por lo tanto, se queda con las mismas 20 variables, pero con la varianza a través de los fotogramas como valor para cada variable. A continuación, procede a reducir estas 20 variables mediante el análisis de variantes canónicas (también se podría imaginar que las reduce con otro ACP, sin clasificación).

Estoy 1) confundido en cuanto a por qué esto se denomina PCA cuando todo lo que está haciendo es tomar la varianza de sus mediciones y 2) no estoy seguro de si este es un enfoque válido para reducir el número de variables en el conjunto de datos. Esto no encaja con la forma en que suelo utilizar PCA, y no estoy seguro de si es simplemente mi inexperiencia o porque este es un uso inadecuado de PCA.

Mi colaborador es mayor y está muy ocupado. Puedo plantearle estas preguntas directamente, pero quería agotar primero todas las demás opciones, incluida la de apelar al universo de las estadísticas en general. ¿Qué es lo que no entiendo aquí?

Editar: Hay un papel publicado con este método, pero no se proporcionan los detalles de por qué los autores redujeron los marcos múltiples a una sola medición de la varianza y no se menciona este paso (aunque al observar los datos está claro que esto es lo que ocurrió).

Realizar un ACP sobre los datos de las series temporales podría ser otro enfoque útil. Sin embargo, no estoy seguro de que tenga sentido utilizar los datos de todos mis hablantes para reducir las dimensiones, ya que en última instancia estoy buscando diferencias consistentes entre los hablantes, cuyas variables pueden estar subestructuradas de diferentes maneras. Mi conjunto de datos consta de múltiples grabaciones de varios hablantes; en el análisis de las variantes canónicas, agruparé según el hablante.

0voto

user3780835 Puntos 11

Resumir los cuadros MFCC (n_mfcc, n_timesteps) para un clip entero se hace con bastante frecuencia (al menos antes del aprendizaje profundo). El resumen más común es tomar la media y la desviación estándar a través del tiempo (para cada coeficiente MFCC). El resultado es un vector de características (2, n_mfcc) - a menudo aplanado a un vector 1D (2xn_mfcc,). Entonces se puede utilizar cualquier clasificador ML, como LogisticRegression o RandomForest.

Sin embargo, esto no tiene nada que ver con el PCA.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X