GENERACION

CAPITULO III


GENERACION


Esta etapa comprende el proceso de obtención de la información del tomógrafo computado, su representación en el espacio bidimensional y el procesamiento digital de estas imágenes de manera de proveer el material apropiado para una representación en tres dimensiones lo más fidedigna posible.

§ 3.1 Adquisición de Datos

El problema de adquirir los datos desde el tomógrafo fue uno de los mayores obstáculos en la realización de este sistema. Antes de hacer un estudio detallado de las distintas alternativas existentes es importante notar que la selección de un método de adquisición sobre otro condiciona en gran medida el trabajo posterior que se deberá realizar con las imágenes. Es así que hemos ordenado los distintos métodos de adquisición en según su "deseabilidad".

Básicamente, existen tres formas posibles de extraer la información del equipo TAC:

  1. Salida numérica via drive
  2. Digitalización directa de la pantalla del tomógrafo
  3. Digitalización de las placas mediante scanner

3.1.1 Salida Numérica via Drive

Consiste en grabar en diskette, la información numérica que define las imágenes obtenidas en el estudio, previo a su borrado del disco rígido del equipo TAC (Ilustración 3).

Este método de transporte es el mas deseado, ya que se consigue toda la información que maneja el tomógrafo (incluidos ciertos parámetros que sino deberán ser estimados) y no se introduce ruido en el proceso de adquisición.

Para implementar este método es necesario disponer de:

3.1.2 Digitalización Directa de la Pantalla del Tomógrafo

Consiste en interceptar la señal de video que recibe el monitor del TAC y enviarla a la computadora personal a través de una placa digitalizadora (Ilustración 4).

Si bien este método es menos directo que el anterior, es muy deseable ya que, fundamentalmente, se mantiene la relación espacial entre los distintos cortes. Esto es, entre el corte C(n) y el C(n+1) existe una relación espacial de manera tal que C(n+1) esta exactamente sobre (o bajo) C(n).

Como la imagen en la pantalla del tomógrafo esta siempre encuadrada de la misma manera (para un mismo estudio, naturalmente) esta coherencia espacial nos libera de la necesidad de encuadrar las distintas imágenes manualmente.

Además, los tomógrafos generalmente generan la imagen a intervalos regulares de tiempo, por lo que sería factible diseñar el sistema de reconocimiento para que funcione automáticamente, de manera sincronizada con el tomógrafo.

Como aspecto negativo se puede mencionar la introducción de ruido en el proceso de digitalización (la mayoría de los equipos TAC trabajan con una resolución de 12 bits, mientras que los digitalizadores comunes disponen de sólo 8).

Para implementar este sistema hace falta disponer de una placa de adquisición de datos que se adecue a las especificaciones técnicas del sistema de video del tomógrafo (que por lo general, no son compatibles con ninguno de los sistemas mas conocidos como NTSC, PAL o SECAM).

Luego, es imprescindible contar con los medios para construir la placa digitalizadora y montar la PC de modo que reciba la señal de video simultáneamente con el monitor del TAC.

Es relativamente más fácil acceder a las especificaciones técnicas de la señal de video que obtener el formato propietario de grabación. Esto se debe al hecho de que, en nuestro país, el mantenimiento de estos equipos se realiza a nivel de hardware, y todo aquello que respecta al formato y método de almacenamiento, es desconocido por los técnicos de las empresas locales distribuidoras de TAC. No obstante, debido a los costos relativamente altos de estas placas no pudimos disponer de ellas. Utilizamos, entonces, el método descripto a continuación.

3.1.3 Digitalización de las Placas Mediante Scanner

Este método consiste en obtener, via scanner, las imágenes impresas en placas tomográficas (Ilustración 5).

Si bien este método es mucho mas artesanal y menos perfecto que los anteriores, utilizando un scanner de tonos de grises se puede obtener una buena calidad en la imagen.

Con este método se introducen una serie de errores de registración entre los distintos cortes. Estos son debidos a pequeñas diferencias en la orientación y ubicación de las placas en el momento del scaneo.

Estas diferencias pueden ser de traslación como así también de orientación. Mas adelante se explicará nuestra solución a estos problemas.

§ 3.2 Representación de las Imágenes 2D

Si utilizamos los sistemas de adquisición descritos en (3.1.1) o (3.1.2), es directa la traducción de la información a un formato manejable por nosotros.

En el caso de utilizar el método descripto en (3.1.1), se debería implementar un sistema simple de lectura en "formato TAC" y escritura en "formato PC + estructura standard" (PCX,TIFF, etc).

Si se utiliza el sistema de adquisición presentado en (3.1.2), se debería implementar el driver para la placa digitalizadora y simplemente almacenar la información, tal cual viene, en un formato adecuado.

Si se emplea, en cambio, la modalidad de adquisición presentada en (3.1.3), debemos corregir los problemas de registración antes de continuar.

Que queremos decir con "registración"?

En la (Ilustración1-A) se observaba la ubicación espacial de cada uno de los cortes axiales realizados por el tomógrafo, a partir de los cuales se conforman las imágenes bidimensionales.

En la (Ilustración1-B) se observa una imagen bidimensional generada por el tomógrafo que corresponde a un determinado corte de un estudio. Imágenes similares a esta son las que muestra la pantalla del tomógrafo y las que se deberían observar en cada una de nuestras representaciones una vez realizado el proceso de adquisición.

Al scanear las placas, se introducen errores geométricos de traslación y de orientación (rotación) en las imágenes. En la (Ilustración 6-A) se muestran los efectos de estos errores. En esta figura tenemos un objeto elipsoidal hipotético que nos ilustra esquemáticamente la necesidad de referir las imágenes a un sistema coordenado o de punto fijo previo a su procesamiento.

Esta figura dá una idea de la importancia de mantener una coherencia espacial entre los distintos estratos o cortes realizados, de modo de poder recrear la imagen tridimensionalmente.

El objetivo primario es, entonces, aplicar una serie de transformaciones a los distintos cortes (slices) de un estudio tomográfico para obtener una colección de imágenes con una suerte de coherencia espacial (Ilustración 6-B).

3.2.1 Identificación del Punto en Común (Punto Pivote)

Como primer paso se debe identificar, en cada imagen, un punto "común" (facilmente identificable en todas). Es conveniente seleccionar vértices de ángulos agudos y de alta intensidad, de modo que sea simple distinguirlo en las distintas imágenes (Ilustración7-A).

Al anotar para cada corte la posición (relativa al 0,0 de la imagen -esquina superior izquierda-) del punto pivote, y relacionando todas las medidas y/o cantidades con este punto, en realidad estamos definiendo un sistema global de coordenadas para todos los cortes (origen (x, y) universal).

Este concepto de coordenada de referencia o punto común se ilustra en la (Ilustración 7-B) donde se ha elegido arbitrariamente como punto pivote un borde agudo en la información de refencia de cada placa tomográfica.

Con este procedimiento se "registran" todos los slices del estudio a este punto o sistema global y logramos que una coherencia tridimensional sea posible entre los mismos lo cual permite relacionarlos espacialmente para representar el objeto lógico en 3D.

3.2.2 Determinación de la Región de Interés (ROI)

Es necesario disminuir el volumen de información que se va a procesar, tanto para aislar los posibles objetos de interés, como para aumentar la performance.

Dentro de cada corte se debe filtrar o depurar la imagen para reducir la cantidad de datos a procesar y para eliminar gráficos de control (como barras de intensidades, escalas, nombre, fechas etc.) introducidos por los equipos de TAC.

Se selecciona entonces el mínimo rectángulo que contenga toda la información relevante (Ilustración 7-A) y se especifican las coordenadas de este relativas al punto pivote.

Es importante notar que, de haber utilizado cualquiera de los sistemas de adquisición descritos en (3.1.1) o (3.1.2), este proceso se hubiera simplificado mucho, ya que con solo definir un ROI "tipo" sería suficiente (que podría estar parametrizado según el tipo de estudio a encarar, -cabeza, cadera, etc-).

3.2.3 Determinación del Volumen de Interés (VOI)

Al pasar de 2D a 3D es necesario asegurase de no recortar ninguna parte del objeto que se desea estudiar.

Esto se consigue seleccionando la máxima región de interés de la colección de todas las imágenes bidimensionales, y definiendo así un volumen de interés como la extrusión de este ROI a lo largo de un eje perpendicular a los planos que contienen las imágenes (Ilustración 7-B).

Se descarta, entonces, todo el material "sobrante" y se define al VOI como la zona donde continuará el estudio. Todo el procesamiento que se ha de realizar a los distintos slices se circunscribe, de ahora en más, al volumen de interés definido.

§ 3.3 Transformaciones de la Imagen

Así como a cada elemento de imagen bidimensional se le denomina pixel (picture element), a cada elemento de espacio tridimensional se lo conoce como voxel. Es decir, cada voxel representa un volumen paralepípedo de datos, que comúnmente es considerado con aristas de igual longitud, con lo cual se definen voxels cúbicos.

En el caso particular de este trabajo, cada voxel del VOI representa la densidad del tejido pero, según el método de adquisición utilizado es posible que se haya introducido cierto nivel de ruido.

Se busca entonces mejorar las imágenes mediante el filtrado. Existen para este propósito distintos tipos de algoritmos. En las dos secciones siguientes se describe brevemente el funcionamiento de algunas transformaciones y en el párrafo siguiente los filtros y se explican conveniencias en la implementación de los mismos.

3.3.1 Transformada de Fourier

Si f(x,y) es contínua e integrable, y F(u,v) es integrable, se tiene que el siguiente par de transformadas de Fourier existen

y

Donde y es la transformada inversa o antitransformada de Fourier.

Suponemos que la función f(x,y) es dicretizada en una secuencia:

Tomando M intevalos de para x , y N intervalos para y. Para simplificar la notación, de ahora en más usaremos las variables x e y como si fuesen discretas, esto es:

Con la notación convenida arriba, tenemos que la transformada discreta de Fourier de un imagen, f(x,y), es otra imagen, F(u,v), cuyos valores son complejos, definidos en una misma región, y se obtienen con la siguiente fórmula:

Se puede demostrar por directa sustitución [GON87], que la transformada discreta de Fourier siempre existe, por lo que no tenemos que preocuparnos en que f(x,y) sea continua e integrable.

En un arreglo cuadrado tenemos que M y N son iguales, lo que permite reducir la fórmula (3.3.1-4) a:

Puede ser demostrado [GON87] que los incrementos en los intervalos espaciales y de frecuencia están relacionados por:

y

La transformada de Fourier es particularmente util en el procesamiento digital de imágenes debido a las propiedades que cumple y a los atributos que posee, tanto ésta como su inversa (Antitransformada de Fourier).

Para simplificar la explicación vamos a desarrollar en cada caso solo la transformada directa de Fourier, dejando al lector la libertad de remitirse a la bibliografia del trabajo [GON87][MAS89] o simplemente hacer la analogía para el caso de la antitransformada. Entre todas las propiedades de la transformada de Fourier, las siguientes son de real importancia en el procesamiento de imágenes:

3.3.1.1 Separabilidad

La transformada discreta de Fourier puede ser expresada en una fórmula que permite separarla perfectamente en dos sumatorias :

La utilidad de esta propiedad radica en que F(u,v) puede ser obtenida en dos pasos por sucesivas aplicaciones de la transformada de Fourier unidimensional

En la (Fig. 3.3.1-1) se esquematiza esta propiedad de separabilidad de la transformada de Fourier a través de sucesivas transformadas unidimensionales

3.3.1.2 Translación

La propiedad de translación de la transformada de Fourier está dada por:

y

Donde la doble flecha es usada para indicar la correspondencia entre la función y su transformada. La ecuación (3.3.1-9A) muestra que multiplicar la función original por el término exponencial indicado y tomar la transformada de este producto, equivale a desplazar el origen del plano de frecuencia al punto ("Modulación")

Eligiendo un punto de desplazamiento apropiado, podemos simplificar considerablemente los cómputos. Si tomamos dicho punto como (N/2,N/2) obtenemos:

Por lo tanto, el origen de la transformada de Fourier puede ser desplazado al centro de su correspondiente cuadrado [N X N] de frecuencia multiplicando f(x,y) por el término .

Es importante notar en la ecuación (3.3.1-9B) que un desplazamiento en f(x,y) no afecta la magnitud de la transformada de Fourier, ya que

3.3.1.3 Periodicidad y Simetría Conjugada

La transformada discreta de Fourier y su inversa son periódicas de período N. Esto es:

La validez de esta propiedad puede ser demostrada directamente sustituyendo en la ecuación (3.3.1-11). Solo se necesita un período de la transformación para completar F(u,v) en el dominio espacial.

Si f(x,y) es real, la transformada de Fourier también posee simetría conjugada, ya que:

o más interesante aún

3.3.1.4 Rotación

Si introducimos coordenadas polares: , , y ; f(x,y) y F(u,v) ahora son , respectivamente. Se puede demostrar por directa sustitución, ya sea en la transformada de Fourier continua o discreta, que

En otras palabras, si f(x,y) es rotada un ángulo alpha; F(u,v) es rotada el mismo ángulo.

3.3.1.5 Distribución y Escalamiento (Linearidad)

Es consecuencia directa de la definición de transformada, contínua o discreta, que

y, en general, que

En otras palabras, la transformada de Fourier (y su inversa) son distributivas respecto a la suma pero no a la multiplicación.

Se puede demostrar también, [GON87] que para dos escalares a y b,

y

3.3.1.6 Laplaciano

El Laplaciano de una función de dos variables, f(x,y), está definido como

Es consecuencia de la definición de transformada bidimensional de Fourier que

El operador Laplaciano es útil para detectar bordes en una imagen, como se verá mas adelante.

3.3.1.7 Convolución y Correlación

Consideraremos dos relaciones entre transformadas de Fourier que constituyen un nexo básico entre los dominios espaciales y de frecuencia. Estas relaciones, llamadas convolución y correlación, son de fundamental importancia para comprender las técnicas de procesamiento de imágenes basadas en la transformada de Fourier.

El producto de convolución de dos funciones discretas, f(x,y) y g(x,y), denotado , se define como

La importancia de la convolución en el dominio de frecuencia radica en el hecho de que; si f(x,y) tiene como transformada de Fourier a F(u,v) y g(x,y) a G(u,v), entonces tiene como transformada F(u, v)G(u, v). Formalmente,

Este principio es conocido como Teorema de Convolución.

Utilizando este es posible calcular la convolución de dos funciones multiplicando solo sus transformadas que, eventualmente, podrían ser obtenidas con el algoritmo de la Transformada Rápida de Fourier(FFT)[GON87].

La correlación de dos funciones f(x,y) y g(x,y), expresadas en forma discreta, se denota como f(x,y) o g(x,y) y está definida por la fórmula

Donde f* significa conjugada de f.

Si f(x,y) y g(x,y) son iguales, la ecuación (3.3.1-25) se la conoce como autocorrelación.

Es posible demostrar lo que sostiene el Teorema de Correlación tanto para el caso continuo como para el discreto

y

Una de las principales aplicaciones de la correlación en el procesamiento digital de imágenes es en búsqueda del patrón apropiado de encaje (prototype matching), donde el problema es encontrar la coherencia espacial entre una imagen desconocida y un conjunto de imágenes con origen conocido. Una aproximación es calcular la correlación entre la imagen desconocida y cada una de las imágenes prototipos. El prototipo mas acorde con la imagen desconocida es aquel con el que tiene una función de correlación mayor.

3.3.2 Transformada Discreta del Coseno

La transformada discreta del coseno está definida por el par

Como tiene, al igual que la transformada de Fourier, la propiedad de ser separable, puede ser implementada por sucesivas transformaciones unidimensionales.

§ 3.4 Mejoramiento de la Imagen

El principal objetivo de las técnicas de mejoramiento de la imagen (image enhancement) es procesar una imagen dada de modo tal que el resultado sea más apropiado, para una aplicación específica, que la imagen original. La palabra "específica" es importante ya que caracteriza de antemano a las técnicas que se verán a continuación, como metodologías orientadas al problema. Por lo tanto, un método que es bastante util para mejorar las imágenes generadas por un TAC, puede no ser necesariamente la aproximación más óptima para mejorar las imágenes enviadas por un satélite.

Las técnicas para mejoramiento de la imagen puede ser clasificada en dos grandes categorías:

3.4.1 Métodos en el Dominio de Frecuencia

El fundamento de las técnicas basadas en el dominio de frecuencia es el teorema de convolución.

Sea g(x,y) una imagen formada por la convolución de una imagen f(x,y) y un operador invariante por posición h(x,y) (cuyo resultado depende solo del valor de f(x,y) en un punto dado de la imagen y nó de la posición de ese punto). Esto es,

Entonces, por el teorema de convolución, se tiene que la siguiente relación en el dominio de frecuencia se mantiene:

Donde G, H, F son las transformadas de Fourier de g, h, f, respectivamente. La transformada H(u,v) es llamada a veces "función de transferencia".

Numerosos problemas de mejoramiento de imágen pueden ser expresados con la fórmula (3.4.1-2). En una típica aplicación de mejoramiento de imagen, f(x,y) es dada y el objetivo, después del cálculo de F(u,v) es seleccionar un H(u,v) tal que la imagen deseada, dada por,

resalte o mejore alguna característica de f(x,y). Por ejemplo, los bordes pueden ser acentuados usando una función H(u,v) que aumente la componente de F(u,v) de alta frecuencia [GON87].

3.4.2 Métodos en el Dominio Espacial

El término dominio espacial se refiere al conjunto de pixels que componen una imagen y los métodos en el dominio espacial son procedimientos que operan directamente en esos pixels. La funciones de procesamiento de imágenes en el dominio espacial pueden ser expresadas como:

donde f(x,y) es la imagen de entrada, g(x,y) es la imagen procesada y T es un operador en f, siendo el soporte de la función T o f un entorno de (x,y). La mejor aproximación para definir el significado de vecinos de un pixel (x,y) es usar una imagen cuadrada o rectangular (vecindad) centrada en (x,y), como se muestra en la (Fig.3.4.2-1). El centro de la subimagen es movido de pixel a pixel comenzando, por ejemplo, en la esquina superior izquierda, y aplicando el operador a cada posición (x,y) para obtener el valor de g(x,y) correspondiente a esa posición. Aunque otras formas de vecindad, tal como un círculo, son a veces usadas, los arreglos cuadrados son los que predominan debido a la facilidad de implementación.

La forma más simple de T es cuando la vecindad es de 1X1. En esos casos g depende solo del valor de f en (x,y), T consiste en una transformación en la escala de gris y se la denomina función de mapeamiento.

Al considerar una vecindad mayor, se pueden definir una mayor variedad de transformaciones o filtros que cumplan la función de mejorar la calidad de la imagen para un propósito determinado. Una de las aproximaciones más comunes a los filtros digitales son las máscaras (también llamadas ventanas).Una máscara es un pequeño arreglo (p.e. 3X3) cuyos coeficientes son elegidos para detectar alguna propiedad en la imagen. Así, dándole distintos valores a los coeficientes se puede obtener filtros para detectar bordes en distintas direcciones [MAS89], el filtro de la media, que suaviza la imagen, el filtro de la mediana que resalta los contornos, etc.

La elección de un filtro u otro depende, como ya se dijo anteriormente, de la propiedad de la imagen que se desea obtener. Posiblemente no haya un único filtro apropiado para una determinada propiedad; la imagen deberá ser sometida a sucesivos filtros para su mejoramiento general. De esto se deduce que muchas veces encontrar el filtro óptimo se convierte en una tarea experimental de combinacion de varias máscaras.

A continuación se desarrollarán filtros que, por su simplicidad en la implementación, su bajo costo computacional y su aceptable performance, son frecuentemente usados en el proceso de mejoramiento de imagen. Luego se explicarán los fundamentos que motivaron la elección del filtro en el presente trabajo.

3.4.2.1 Filtro de la Media

El filtro de la media consiste en el promedio entre cada punto P(x,y) y los puntos en su vecindad-8. La formulación de este filtro es la siguiente

Donde S es la colección de puntos que conforman la vecindad-8.

Este filtro tiende a suavizar las discontinuidades, algo que no es propicio para los fines del trabajo ya que luego nos deberemos basar en éstas para determinar los bordes del objeto. Si bien a la vista es mas atractivo (la imagen parece mas "continua"), es preferible elegir un filtro que no "borre" los bordes.

Un resultado similar se obtiene si se utiliza una máscara con todos los coeficientes del arreglo igual a 1/9:

3.4.2.2 Filtro de la Mediana

La principal dificultad del método descripto en la sección anterior es que suaviza bordes y otros detalles propios de la imagen. Aunque ese problema puede ser de algún modo salvado usando una intensidad mínima como umbral. Es decir, todo pixel de la imagen con intensidad menor que el umbral no es considerado parte del objeto de interés. La elección de un valor de umbral apropiado suele convertirse en una tarea experimental relativamente ardua. Una aproximación alternativa es usar el filtro de la mediana por el cual se reemplaza el nivel de gris de cada pixel por la mediana de los tonos de grises del pixel y sus vecinos, en vez del promedio.

Este método es particularmente útil cuando la característica de agudeza y definición precisa de bordes desea ser conservada.

A continuación se explica el funcionamiento de este filtro:

Para un pixel cualquiera P(x,y) hacer una lista de los pixels en su vecindad-8 {(x-1,y-1), (x,y-1), (x+1,y-1), (x-1,y), (x+1,y), (x-1,y+1), (x,y+1), (x+1,y+1)} y el pixel en cuestión, ordenar y seleccionar como valor de P al quinto valor de la lista.

Para los objetivos propuestos en este trabajo es muy conveniente emplear el filtro de la mediana ya que elimina los picos de intensidad (probablemente producto del ruido) y a la vez conserva la necesaria definición de bordes a los efectos de aislar un objeto determinado.