Estoy tratando de entender algunos conceptos sobre las Transformadas de Fourier (principalmente en el contexto del procesamiento de señales).
Imaginemos una señal muestreada a 10kHz y que el tamaño de la FFT es 1000. Si 1000 muestras se procesan a través de esta FFT (solo reales, asumiendo ventana rectangular), y si tomamos la amplitud del resultado (solo la primera mitad y descartando la fase), esto da 500 bins de ancho 10Hz (excepto el primero), ya que la frecuencia máxima/Nyquist es de 5000Hz.
Así que:
- bin 0, centrado en 0Hz va desde 0Hz a 5Hz
- bin 1, centrado en 10Hz va desde 5Hz a 15Hz
- bin 2, centrado en 20Hz va desde 15Hz a 25Hz
- bin 3, centrado en 30Hz va desde 25Hz a 35Hz
- (y así sucesivamente...)
Aunque tal espectro se puede representar como una línea, tiendo a pensar en esto como un histograma, una especie de "integral" (estoy usando este término de forma flexible, siéntete libre de corregirme), representando la energía que cae dentro del rango de cada bin.
Por lo tanto, si el objetivo fuera encontrar la energía correspondiente a un bin más amplio (digamos 15Hz a 35Hz), yo "sumaría" los valores de los bins 2 y 3 (o tomaría la raíz cuadrada de la suma de los valores al cuadrado). En primer lugar, ¿tiene sentido agrupar los bins de esta manera, para obtener un único valor para un grupo contiguo de bins (o es completamente absurdo, y nada se puede decir del rango de 15Hz a 35Hz a partir de esos dos bins)?
Luego, digamos que alguien quiere saber la "energía" entre dos frecuencias que no caen en los delimitadores de los bins, digamos 5Hz a 6Hz y 151Hz a 3002Hz. He escuchado que podría ser posible usar la interpolación lineal:
- Para 5->6Hz, tomar la décima parte del valor para el bin de 5->15Hz,
- Para 151->3002Hz, tomar la cuarta parte del valor para 145->155Hz (4/10 para ir de 151 a 155), todos los bins de 155Hz a 2995Hz y siete décimas del bin de 2995->3005Hz (7/10 para ir de 2995 a 3002).
No estoy seguro de si esto es correcto. Si bien el margen de error puede ser bajo en la banda de 151->3002Hz, porque los dos bins incompletos en los bordes podrían ser despreciables en comparación con el número de bins completos en el medio, parece que cualquier valor obtenido para 5->6Hz usando este método podría estar bastante alejado del valor real que habría sido para ese bin si se hubiera usado un tamaño de FFT más grande (y por lo tanto hubiera tenido bins más estrechos que permitieran que 5->6Hz caiga en bins reales).
¿Tiene sentido este tipo de interpolación matemáticamente, especialmente para frecuencias más bajas? ¿Funcionaría para bandas aún más estrechas, por ejemplo, de 5.1Hz a 5.3Hz?
Gracias.