2 votos

Cuantificar la eficacia de la corrección de la línea de base en los espectros Raman

He producido varios miles de espectros Raman utilizando técnicas de imagen hiperespectral. Estos sufren una importante interferencia fluorescente que produce una línea de base curvada e inclinada. Utilizando Matlab, he intentado varias técnicas de sustracción de la línea de base, pero no puedo decir cuantitativamente cuál es la que funciona mejor; más allá de una inspección visual, no estoy seguro de cómo compararlas.

¿Existe alguna forma cuantitativa de evaluar el rendimiento de una sustracción de base? ¿O lo mejor que podemos hacer es una inspección visual?

Gracias por tomarse el tiempo de considerar esto.

Editar: He añadido un espectro de ejemplo junto con uno con una línea de base corregida.

Gracias por sus sugerencias en cuanto a los métodos de corrección de la línea de base, sin embargo, ya he utilizado varios métodos diferentes con éxito. Mi intención era descubrir si había una forma de medir el rendimiento de las distintas técnicas para evaluar cuál es la más eficaz.

Gracias de nuevo por su consideración.

Editar 2: Sólo quiero aclarar que no estoy buscando métodos para la corrección de la línea de base. He utilizado varios que me han dado resultados variados - estos incluyen el ajuste polinomial, el ajuste por piezas, ModPoly, la sustracción de líneas de base savitzky-golay iterativamente suavizadas, y WPLS. Lo que busco es una forma de cuantificar su rendimiento, ¿hay alguna métrica que pueda utilizarse para ello?

6voto

Owen Puntos 284

¿Podría mencionar también el método de corrección? Su fondo de autofluorescencia es realmente enorme y su relación señal/ruido es baja. Uno de los métodos más citados en la corrección automatizada del fondo se basa efectivamente en el ajuste polinómico, aunque poco pero más sofisticado que el simple ajuste de mínimos cuadrados. Merece la pena leer este artículo.

Método automatizado para la sustracción de la fluorescencia de los espectros Raman biológicos https://journals.sagepub.com/doi/abs/10.1366/000370203322554518

enter image description here

Otra opción sencilla es que se puede elegir un rango espectral donde aplicar una línea de base polinómica. Digamos que de 0 a 1200 aplicas un polinomio de grado 5, pero de 1200 en adelante eliges el polinomio de grado 6. Sin embargo, tienes miles de espectros y no está claro si la forma del fondo es similar en cada caso o no.

Adenda: Me temo que no hay una forma sólida de comparar los enfoques de corrección de la línea de base. La razón es que no se conoce el "verdadero" modelo de la autofluorescencia. Esto también lo dice Ed en los comentarios. Él es un destacado espectroscopista. En estos casos, deberías simular una línea de base como la de estos autores y hacer una comparación. Haga una línea de base sintética por polinomios con digamos n=5, complíquela mezclando ciertas regiones con polinomios n=6, 3, 2, y luego pruebe sus enfoques. No agregue ningún pico a la línea de base, y sólo compruebe qué técnica muestra menos residuos. ¿Hay una tendencia en los residuos? La tendencia también es importante. Los residuos deben estar dispersos. ¿Qué técnica has utilizado en tu caso?

Como alternativa, puedes probar con un compuesto fluorescente conocido, la rodamina G, y recoger un espectro de fluorescencia. En este caso, conocerás la verdadera forma del espectro. Utilícelo como modelo real y pruebe sus correcciones de la línea de base.

Un consejo general que nos dio un profesor, autor de una monografía sobre espectroscopia Raman, fue que un ajuste cada vez mejor no indica la realidad. El modelo puede ser completamente erróneo pero puede tener un coeficiente de correlación cercano a la unidad. Por lo tanto, el ajuste de un polinomio o cualquier corrección experimental de la línea de base es sólo un enfoque utilitario, que está cambiando la estética y la apariencia cosmética de un espectro Raman. No hay nada fundamental.

3voto

alexandrul Puntos 1190

Un poco tarde para la fiesta pero aquí vamos:

Estoy totalmente de acuerdo con @MFarooq en que no tenemos la información de referencia de cómo debería ser el espectro corregido para comparar directamente los enfoques de corrección de la línea de base (es decir, fuera de escenarios muy especiales y a menudo bastante artificiales).

Podemos decir, sin embargo, que la prueba está en el pudín si no hacemos la corrección automatizada de la línea de base por el bien de corrección de la línea de base sino que como etapa de preprocesamiento para eliminar una distorsión conocida de los espectros (el fondo) antes de un modelo de predicción . En ese caso, podemos comparar la capacidad de predicción de los modelos que obtenemos en base a los distintos enfoques de corrección de la línea de base.

Esto significa básicamente que tratamos la elección de la corrección de la línea de base como un hiperparámetro del modelo general. Por desgracia, el tamaño de las muestras (números) que he tenido para estos estudios bioespectroscópicos no fueron suficientes para permitir una comparación significativa de la calidad predictiva que es la base para tal optimización de hiperparámetros. (Sin embargo, mucha gente hace alegremente números masivos de comparaciones de modelos, siendo felizmente inconscientes de que el tamaño de su muestra apenas permite distinguir los modelos "prácticamente perfectos, vas a conseguir el premio al mejor clasificador y un estipendio de fundación de spin-off" de los modelos "apenas me atrevo a mostrar esto en la reunión del grupo").

Basado en eso, yo recomendaría

  • utilizar su conocimiento espectroscópico experto para juzgar la corrección de la línea de base y
  • ser muy conservador en cuanto a la complejidad de la línea de base.

Por supuesto, si se encuentra en la feliz situación de contar con un número de muestras suficiente para permitir tales comparaciones: adelante.

(Creo que veo un poco de luz al final del túnel, pero todavía no he llegado del todo).


Dicho esto,

  • Creo que es importante darse cuenta de que para muchos modelos de análisis de datos La corrección de la línea de base no es tan importante porque pueden incorporar su propia corrección de base Si se consideran los modelos bilineales (es decir, $ \mathbf Y = \mathbf B \mathbf X), pueden contener su propia corrección polinómica de la línea de base. Como ejemplo muy fácil, considere un patrón de coeficiente -1/2, +1, -1/2. Este patrón mide la intensidad en la posición media sobre una línea de base lineal que pasa por el primer y el último punto. Esto corresponde a la observación de @MFarooq de que la corrección de la línea de base suele ser más bien cosmética.

  • Además, para ser bueno (útil), el La corrección de la línea de base debe ser lo suficientemente segura para que tengamos una ganancia neta de información . En mi opinión, esto no está ni mucho menos garantizado: He realizado simulaciones muy sencillas de una "banda Raman" sobre un fondo perfectamente plano con el correspondiente ruido de Poisson. ¡Ajustando y restando una línea de base lineal fuera de esa banda en una situación que era a) ridículamente fácil a ojo en términos de decir lo que es señal y lo que es línea de base, y b) usando muchos más puntos de datos para ajustar la línea de base de lo que normalmente hacemos, todavía observé que la sustracción de esta línea de base ajustada disminuyó la SNR de la intensidad integral de mi "banda Raman" fácilmente por un factor 2 en comparación con la sustracción de la verdadera línea de base!

  • Mi opinión muy personal sobre las líneas de base polinómicas automatizadas para los tejidos biológicos* es que considerar mucho de lo que he visto al respecto sobredimensionado Las líneas de base resultantes son demasiado onduladas en comparación con la estructura que (no) esperaría en el fondo por debajo del espectro Raman, y demasiado onduladas en comparación con lo que creo que podemos permitirnos teniendo en cuenta el nivel de ruido de disparo que supone una señal de 200 cuentas sobre un fondo de 4000 cuentas.
    Aun así, utilizo líneas de base polinómicas si no tengo nada mejor (EMSC, ver más abajo), y a menudo encuentro que los polinomios locales permiten líneas de base con menos grados de libertad (equivalentes) en general: pueden "concentrar" la curvatura en una región, lo que a veces es útil.

    * Estoy hablando de biológico tejidos porque ahí está mi experiencia con el Raman. Sin embargo, no espero que otros tejidos (pensando en el algodón) sean totalmente diferentes con respecto a los aspectos generales que considero aquí.

  • En mi tesis doctoral comparé varios enfoques de preprocesamiento para la clasificación de los espectros del infrarrojo medio de los tejidos biológicos mediante la selección de regiones espectrales seguida de LDA: la corrección de la línea de base no importaba.

  • Tenga en cuenta que no todo el fondo que perturba las mediciones Raman es fluorescencia. Aunque eso no importa para la corrección algorítmica, puede ofrecer formas ópticas de deshacerse de alguna parte del fondo ópticamente . Eso tendría un beneficio adicional en la relación señal/ruido: el fondo es ligero, por lo que sí produce ruido de disparo, y ese ruido de disparo aumenta (absolutamente) con la luz total.
    Por tanto, aunque se pudiera sustraer perfectamente el espectro de fondo correcto, seguiría quedando el ruido adicional causado por esa luz adicional. Por lo tanto, un La corrección matemática del fondo medido nunca puede ser tan buena como evitar (ópticamente) ese fondo en primer lugar.

    Dos posibilidades que, según mi experiencia, pueden suponer una gran diferencia en este caso son la medición en inmersión (que también proporciona una mayor eficiencia de recogida con una mayor NA) y una mayor confocalidad: ambas reducen la luz parásita, y una mayor confocalidad también puede ayudar contra la fluorescencia. La primera por tener menores cambios en el índice de refracción y la segunda por excluir la luz que viene de direcciones equivocadas.

  • Si el fondo es fluorescente, puede ser posible blanquearlo con el láser de excitación. Si se recogen los espectros mientras se hace esto, es posible que se consiga una estimación del fondo fluorescente (al menos del componente que sí blanquea).

  • Esto me lleva finalmente a un enfoque de corrección de la línea de base que creo que destaca entre los muchos algoritmos de ajuste de la línea de base totalmente basados en datos (lo siento, no puedo guardarme esta opinión aunque entiendo perfectamente que no estás pidiendo que te recomienden qué corrección de la línea de base utilizar): EMSC describe el espectro como compuesto por polinomios u otros términos "matemáticos" más espectros de referencia. Así, se pueden combinar de forma muy elegante términos polinómicos de referencia con espectros de sustrato o de fluorescencia (incluso se pueden incluir espectros de lo que no se debe restar como línea de base). La gran ventaja de este enfoque es que permite incorporar mucho más conocimiento/información externa que "la línea de base debe ser un polinomio".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X