reconocimiento de picos para señales

3
JOURNAL OF PDS 1 RECONOCIMEINTO DE PICOS PARA SEÑALES MALDI Felipe Andino M., Electrónica y Control, EPN; Daniel Suntaxi S., Electrónica y Control, EPN Resumen—En este documento se procederá a analizar señales MALDI, y después procesarlas decimandolas, extrayendo los picos de dichas señales decimadas y finalmente analizar los picos relevantes o los mismos que se encuentran por encima de cierto umbral fijado previamente. Index Terms—MALDI, MALDI-TOF, downsampling, upsam- pling, Pick.picking. I. I NTRODUCCIÓN M ALDI es una técnica de ionización suave utilizada en espectrometría de masas. Se denomina MALDI por sus siglas en inglés Matrix-Assisted Laser Desorption / Ionization (desorción/ionización láser asistida por matriz) y TOF por el detector de iones que se acopla al MALDI y cuyo nombre procede también de sus siglas en inglés Time-Of-Flight [1][2]. MALDI-TOF permite el análisis de biomoléculas (biopo- límeros como las proteínas, los péptidos, los azúcares y los lípidos) y moléculas orgánicas grandes (como los polímeros, y otras macromoléculas) que tienden a hacerse frágiles y fragmentarse cuando son ionizadas por métodos más conven- cionales. A las señales MALDI se debe realizar un proceso de modificación de la frecuencia que puede ser decimación (downsampling) o interpolación (upsampling), para este caso se realizará downsamplig [3]. Una vez realizado la decimación se debe realizar el siguiente algoritmo Pick-picking que significa la extracción de picos, ya sea todo el espectro o de regiones seleccionadas. No se consideran todos los picos solo se determinan los más relevantes de la señal, los cuales se filtran. También hay un valor mínimo de umbral: las señales más débiles se ignoran [4]. II. DOWNSAMPLING Se procede a realizar una modificación en frecuencia de la señal, disminuyendo la cantidad de muestras(downsampling) para realizar posteriormente un procesamiento de la señal ya modificada con menos muestras y así tener un tiempo de procesamiento más rápido. Para una comprensión entre tiempo de procesamiento y confiabilidad de los datos obtenidos, realizaremos un algoritmo que nos permita de cada diez muestras; eliminar nueve y mantener una, y así tener una nueva muestra diez veces menor a la muestra original. Además utilizaremos el comando downsample proporcionado por MATLAB. Finalmente com- pararemos los resultados obtenidos entre nuestro algoritmo de decimación y la función downsample. II-A. ALGORITMO DESARROLLADO El algoritmo desarrollado toma la muestra y elimina los valores consecutivos que se repiten, después con la muestra total reducida, se procederá a obtener una muestra diez veces menor a la muestra total, por lo que se procede a tomar un ran- go equivalente a diez muestras de las cuales se elimina nueve y se conserva una , representando los datos más relevantes. Como se aprecia en la siguiente gráfica: Figura 1. (a) Muestra, (b) Decimación, (c) Pick-picking, (d) Picos Relevantes. Una consideración importante en el algoritmo desarrollado, es que el procedimiento de la decimación es aleatorio, por lo que si se vuelve a ejecutar el algoritmo se obtendrán valores diferentes. II-B. DOWNSAMPLE Matlab cuenta con la función downsample. Esta función disminuye una muestra a otra de menor tamaño dado un factor, en nuestro caso diez veces menor. Figura 2. (a) Muestra, (b) Decimación, (c) Pick-picking, (d) Picos Relevantes.

Upload: daniel19938

Post on 01-Feb-2016

19 views

Category:

Documents


0 download

DESCRIPTION

Procesamiento Digital de SeñalesMatlab

TRANSCRIPT

Page 1: Reconocimiento de picos para señales

JOURNAL OF PDS 1

RECONOCIMEINTO DE PICOS PARA SEÑALESMALDI

Felipe Andino M., Electrónica y Control, EPN; Daniel Suntaxi S., Electrónica y Control, EPN

Resumen—En este documento se procederá a analizar señalesMALDI, y después procesarlas decimandolas, extrayendo lospicos de dichas señales decimadas y finalmente analizar los picosrelevantes o los mismos que se encuentran por encima de ciertoumbral fijado previamente.

Index Terms—MALDI, MALDI-TOF, downsampling, upsam-pling, Pick.picking.

I. INTRODUCCIÓN

MALDI es una técnica de ionización suave utilizada enespectrometría de masas. Se denomina MALDI por sus

siglas en inglés Matrix-Assisted Laser Desorption / Ionization(desorción/ionización láser asistida por matriz) y TOF por eldetector de iones que se acopla al MALDI y cuyo nombreprocede también de sus siglas en inglés Time-Of-Flight [1][2].

MALDI-TOF permite el análisis de biomoléculas (biopo-límeros como las proteínas, los péptidos, los azúcares y loslípidos) y moléculas orgánicas grandes (como los polímeros,y otras macromoléculas) que tienden a hacerse frágiles yfragmentarse cuando son ionizadas por métodos más conven-cionales.

A las señales MALDI se debe realizar un proceso demodificación de la frecuencia que puede ser decimación(downsampling) o interpolación (upsampling), para este casose realizará downsamplig [3].

Una vez realizado la decimación se debe realizar el siguientealgoritmo Pick-picking que significa la extracción de picos,ya sea todo el espectro o de regiones seleccionadas. Nose consideran todos los picos solo se determinan los másrelevantes de la señal, los cuales se filtran. También hay unvalor mínimo de umbral: las señales más débiles se ignoran[4].

II. DOWNSAMPLING

Se procede a realizar una modificación en frecuencia de laseñal, disminuyendo la cantidad de muestras(downsampling)para realizar posteriormente un procesamiento de la señal yamodificada con menos muestras y así tener un tiempo deprocesamiento más rápido.

Para una comprensión entre tiempo de procesamiento yconfiabilidad de los datos obtenidos, realizaremos un algoritmoque nos permita de cada diez muestras; eliminar nueve ymantener una, y así tener una nueva muestra diez vecesmenor a la muestra original. Además utilizaremos el comandodownsample proporcionado por MATLAB. Finalmente com-pararemos los resultados obtenidos entre nuestro algoritmo dedecimación y la función downsample.

II-A. ALGORITMO DESARROLLADOEl algoritmo desarrollado toma la muestra y elimina los

valores consecutivos que se repiten, después con la muestratotal reducida, se procederá a obtener una muestra diez vecesmenor a la muestra total, por lo que se procede a tomar un ran-go equivalente a diez muestras de las cuales se elimina nuevey se conserva una , representando los datos más relevantes.Como se aprecia en la siguiente gráfica:

Figura 1. (a) Muestra, (b) Decimación, (c) Pick-picking, (d) Picos Relevantes.

Una consideración importante en el algoritmo desarrollado,es que el procedimiento de la decimación es aleatorio, por loque si se vuelve a ejecutar el algoritmo se obtendrán valoresdiferentes.

II-B. DOWNSAMPLEMatlab cuenta con la función downsample. Esta función

disminuye una muestra a otra de menor tamaño dado un factor,en nuestro caso diez veces menor.

Figura 2. (a) Muestra, (b) Decimación, (c) Pick-picking, (d) Picos Relevantes.

Page 2: Reconocimiento de picos para señales

JOURNAL OF PDS 2

II-C. COMPARACIÓN DE LOS RESULTADOS

Observando la Figura 1 y la Figura 2, se concluye queal realizar el proceso de la decimación o el downsampling,obteniendo una muestra diez veces menor a la original, nose logra apreciar gran diferencia entre las dos figuras, máscuando se selecciona los picos más relevantes, se concluye queel proceso de downsampling utilizando la función de Matlabconserva más muestras significativas, por lo que al ejecutar elalgoritmo desarrollado para discernir los picos mas relevantes,la muestra obtenida con el downsampling nos otorga máscantidad de picos significativos.

Anteriormente se mencionó que el algoritmo desarrolladoes aleatorio, por lo que los valores obtenidos de la muestradecimada será diferente cada vez que se ejecute este algoritmo,al igual que la función de Matlab(downsample), la diferenciaexperimental radica en que la función de matlab procesamucho más rápido que el algoritmo desarrollado.

Finalmente, no se podría dirigir el proceso de dismi-nuir la cantidad de datos para procesar los picos relevan-tes, pero tomando en cuenta los picos significativos obteni-dos(confiabilidad de los datos) y el tiempo de procesamiento,se optó por el segundo método, es decir, la función de matlab,para el siguiente paso de procesar las 78 muestras de 10000datos.

III. ANÁLISIS DE LOS PICOS

Después de elegir el método más conveniente para el análi-sis de nuestra muestra completa, procesamos las 78 muestrasde 10000 valores cada una.

Figura 3. (a) Muestra, (b) Decimación, (c) Pick-picking, (d) Picos Relevantes.

En la gráfica se aprecia primero, la muestra total de 780000valores, después con la función downsample de Matlab seredujo la muestra a diez veces menos, obteniendo una muestramas procesable de 78000 valores.

Después se observa el efecto de realizar el pick-picking dela muestra decimada, como se observa en el tercer gráfico.De diferentes colores (78 exactamente) se logran apreciartodas las muestras decimadas y realizadas el respectivo pick-picking, de aquí se concluye que existen varios picos dediferente proporción, algunos demasiados pequeños como paradescartarlos, de aquí es donde se elige un umbral a a partirdel cual se consideran los picos relevantes, la consideracióndel umbral esta entre 0 y el Valor del pico Máximo.

Figura 4. Picos Relevantes

La Figura 4 muestra los picos más relevantes, es deciraquellos que se encuentran por encima del umbral (paranuestra aplicación a 0.8 del Pico máximo), donde se obtiene deigual manera una cantidad enorme de datos, donde se apreciael comportamiento de la muestra analizada.

Con tantos picos en cuestión y de las 78 muestras debenexistir picos que se repitan y estos al final podrían considerarselos picos totalmente relevantes y aquellos que marquen elcomportamiento general de esta.

IV. PICOS REPETIDOSDentro de las muestras de los picos relevantes, el siguiente

paso es detectar los picos que se repiten y a su vez contabilizarlas veces que lo hacen, es decir tener un gráfico que nos ayudea observar los picos repetidos y la frecuencia con que lo hacen,para al final lograr obtener una comprensión de como se estacomportando la muestra.

Figura 5. Picos Repetidos

Observando el gráfico se llega a concluir que entre 650y 700 se obtiene las muestras más representativas, ya queaquí están los picos más relevantes, esta zona es en dondese concentran los picos más comunes entre todas las muestrasy en 655 es donde la frecuencia de las muestras es mayor, seobtienen 4 valores que se repiten en todo el rango de muestras.

La mayoría de los picos que se repiten, muestran uncomportamiento de máximo 2 veces, lo que quiere decir queen su gran mayoría los picos solamente se repiten una vez, apartir del umbral seleccionado.

Page 3: Reconocimiento de picos para señales

JOURNAL OF PDS 3

V. CONCLUSIONES

El proceso de downsampling o decimación reduce lavelocidad de datos o el tamaño de los datos. El factorde decimación es generalmente un número entero o unafracción racional mayor que uno. Este factor multiplica eltiempo de muestreo o divide la frecuencia de muestreo.De esta manera se obtiene la décima parte de la muestratotal sin causar mayores variaciones en la muestra origi-nal con una mayor facilidad de procesamiento de datos.Por medio del proceso de downsampling incluido en laherramienta Matlab se conservan las muestras más signi-ficativas; al ejecutar este algoritmo las muestras obtenidasotorgan la mayor cantidad de picos significativos.Observando el gráfico se llega a concluir que entre650 y 700 se obtiene la mayor cantidad de muestrassignificativas. Aquí se observan los picos más relevantes,esta zona es en donde se concentran los picos máscomunes entre todas las muestras.En la posición 655 se puede observar que la frecuenciamostrada es la mayor de las muestras, dado que aquí seobtienen 4 valores que se repiten en todo el rango demuestras.

VI. BIBLIOGRAFÍA

[1] An overview of Module II: MALDI-TOF MSAnalysis http://iitb.vlab.co.in/?sub=41&brch=118&sim=786&cnt=1373Tomado,mayo2015[2] Analysis of mass spectrometric data: peak pickingand map alignment, Eva Lange, Universitat Berlin,2008 enlace: http://www.diss.fu-berlin.de/diss/servlets/MCRFileNodeServlet/FUDISS_derivate_000000004356/thesis.pdf[3] Procesamiento Digital de señales, Francisco Gómez,Ingeniería Informática http://arantxa.ii.uam.es/~taao1/teoria/tema5/tema5.pdf[4] http://www.inmr.net/Help3/ref/picking.html,tomado.05/05/2015