Búsqueda personalizada     
AGOSTO - SEPTIEMBRE ISSN: 1.131-9.100
viernes, 03 de septiembre de 2010
 
ARTÍCULOS
 
 
 
   

SUPERFICIE OCUPADA POR INVERNADEROS EN EL CAMPO DE NIJAR (ALMERIA), DETERMINADA POR APLICACIÓN DE REDES NEURONALES ARTIFICIALES SOBRE UNA IMAGEN DE SATELITE DE MUY ALTA RESOLUCION

 
Septiembre de 2005
Fernando Carvajal Ramírez, Manuel Ángel Aguilar Torres, Fco Agüera Vega, Fernando José Aguilar Torres; Universidad de Almería, España. Escuela Politécnica Superior, departamento de Ingeniería Rural
 

 

RESUMEN
En este trabajo se propone la clasificación de una imagen multiespectral mediante el entrenamiento de una red neuronal artificial por la técnica de retropropagación. El cálculo está basado en la información obtenida de áreas de entrenamiento identificadas sobre una imagen del satélite de muy alta resolución espacial QuickBird.

La zona de estudio corresponde al Campo de Níjar, provincia de Almería, donde el uso del suelo está marcado principalmente por el sistema de producción agrícola de cultivo intensivo bajo plástico. Con ello se pretende establecer las bases del diseño de una metodología óptima para la detección de superficies invernadas empleando las imágenes del satélite mencionado, cuya puesta en funcionamiento es reciente, y cuyas características técnicas han abierto nuevas expectativas.

Palabras clave: Redes neuronales artificiales, clasificación de imágenes multiespectrales.

ABSTRACT

In this work we propose the classification of a multispectral image by means of the training of a artificial neural nerwork using back propagation technique. The calculation is based on information from training sites identified on remotely sensed imagery: very high spatial resolution satellite QuickBird.

The zone of study includes Campo de Níjar, province of Almería, where the use of the soil is determined principally by agricultural production system of intensive production in greenhouses. We try to establish the bases of the design of an ideal methodology for the detection of greenhouses surfaces using the images of the mentioned satellite, which was put in functioning recently, and whose technical characteristics have opened new expectations.

Key words: Artificial neural networks, Classification of multispectral images.

Grupo temático: GIS: Sistemas de Información Geográfica y Cartografía

INTRODUCCIÓN

La clasificación es una de las técnicas más aplicadas en teledetección y fotointerpretación de imágenes de satélite. Sus aplicaciones son de lo más variadas: detección de cubiertas, usos de suelo, geología, urbanismo, etc. La información que contienen las imágenes de satélite puede ser obtenida por clasificación, basándose en los datos que presentan sus píxeles en cada una de las bandas registradas.

Los algoritmos de clasificación estadística son los más frecuentemente usados para asignar la clase a que pertenecen cada uno de los píxeles de una imagen de satélite [1]. Uno de los aspectos más destacados de estos algoritmos es que producen resultados de probabilidad de pertenencia. De hecho, algunos de ellos se basan en la clasificación de cada píxel a la clase a la que pertenece con mayor probabilidad. También pueden dar como resultado mapas de clasificación donde cada clase, incluso cada píxel tiene su nivel de confianza estimado.

Sin embargo para la aplicación de estos algoritmos se necesita asumir una serie de hipótesis estadísticas a priori como funciones de probabilidad o funciones de distribución, con el riesgo que ello supone. La aplicación de redes neuronales artificiales, aunque más complicada conceptualmente, permite adoptar una interpretación geométrica de la información multiespectral como regla de decisión, prescindiendo del uso de modelos estadísticos.

Con la aparición de satélites de alta resolución espacial como IKONOS en el año 1999 o QuickBird en 2001, deja de tener sentido el análisis por píxel. Cada uno de ellos ya no representa un objeto, una clase o una entidad sino una porción de ello [2]. Se amplían las aplicaciones tradicionales de la teledetección en áreas urbanas, incluso alcanzando la actualización cartográfica [3], integrándose con las técnicas de fotogrametría [4].

Las imágenes procedentes de satélites de alta resolución espacial se presentan fuertemente texturadas lo cual facilita su clasificación. Por tanto, la incorporación de un análisis de textura a la información multiespectral debe mejorar apreciablemente los resultados de clasificación.

El objetivo de este trabajo es diseñar y entrenar una red neuronal que permita realizar la clasificación de una imagen del satélite QuickBird obtenida en diciembre de 2004, sobre el Campo de Níjar, provincia de Almería, poniendo especial interés en la discriminación de la clase “invernaderos”. Una vez aplicada la clasificación se han evaluado las confusiones aparecidas dentro de esta clase y se ha incorporado a la red neuronal un análisis de textura por geometría fractal, estudiando sus consecuencias en la mejora de la clasificación de la clase de mayor interés.

DEFINICIÓN DE LA ZONA DE ESTUDIO Y MATERIALES DE TRABAJO

El Campo de Níjar (figura 1) es una comarca de la provincia de Almería cuyo sistema de producción agrícola es intensivo bajo plástico. La estructura de los invernaderos condiciona el paisaje, junto con una vegetación natural de tipo monte bajo, una concentración dispersa de áreas de población y una orografía poco montañosa limitada al sur por la Sierra La Serrata y al norte por Sierra Alhamilla.

El Campo de Níjar (figura 1) es una comarca de la provincia de Almería cuyo sistema de producción agrícola es intensivo bajo plástico. La estructura de los invernaderos condiciona el paisaje, junto con una vegetación natural de tipo monte bajo, una concentración dispersa de áreas de población y una orografía poco montañosa limitada al sur por la Sierra La Serrata y al norte por Sierra Alhamilla.

Comprende unas 20.000 Has y dispone de una red de abastecimiento de agua y un conjunto de balsas de regulación que gestionan recursos hídricos propios y los procedentes de la desaladora de la población cercana de Carboneras.

Figura 1. Localización de la zona de estudio

Para su clasificación, fue obtenida una imagen del satélite QuickBird el 19 de diciembre de 2004 (figura 2), con un porcentaje de cubierta de nubes del 6%, un ángulo de desviación de nadir de 8º, un azimut objetivo de 303º y una calidad ambiental del 90% calificada como excelente por el proveedor. Las coordenadas límites que abarca la imagen se muestran en la tabla 1.

Figura 2. Composición color verdadero con las bandas 1, 2 y 3 de la imagen del satélite QuickBird.

La imagen está compuesta por cuatro bandas registradas en el visible e infrarrojo cercano, con una resolución espacial de 2.49 m, y una banda pancromática con resolución espacial de 0.62 m.

CLASIFICACIÓN POR REDES NEURONALES ARTIFICIALES

Las redes neuronales artificiales simulan el proceso de resolución de problemas espaciales por parte del cerebro humano. Aplicado a la clasificación basada en la información registrada en diferentes longitudes de onda, es decir multiespectral, suele ser más eficiente y suele necesitar menos entrenamiento que los algoritmos de clasificación estadísticos o tradicionales [5]. En su diseño y desarrollo no hay que asumir ninguna hipótesis estadística de partida como funciones de distribución de variables ni dependencias multivariables.

Puede entenderse que una red neuronal artificial es un modelo matemático complejo, basado en ecuaciones no lineales, en el que se introducen unas variables de entrada (en este trabajo, una imagen multiespectral) y se obtiene una respuesta o datos de salida (clasificación de dicha imagen). La red neuronal se ajusta para que dé resultados parecidos a los introducidos en un proceso previo de aprendizaje o entrenamiento. El método empleado en este trabajo para la fase de entrenamiento se conoce como retropropagación [6].

PROCESO ELEMENTAL: NEURONA

Una red neuronal está definida por un nivel de entrada, un nivel de salida y uno o varios niveles ocultos (figura 3).

Figura 3. Estructura de una red neuronal de tres niveles.

Cada uno de estos niveles está compuesto por un número de neuronas, llamadas así por analogía con el cerebro humano, que representan los procesos elementales de decisión. La salida de una neurona oj se obtiene por una función que evalúa ponderadamente cada una de las entradas procedentes de las neuronas del nivel anterior mediante la siguiente expresión:

En la que es un umbral y el vector de coeficientes de ponderación. Esta función se conoce como función de activación y suele ser una expresión exponencial (ecuación 2).

En la que es una constante. En clasificación multiespectral suele ser suficiente el empleo de redes neuronales de tres niveles, uno de entrada, otro oculto y otro de salida [5] tal y como refleja la figura 3. El número de neuronas asignadas al nivel de entrada ha sido 4, coincidiendo con el número de bandas existentes en la imagen multiespectral, en el nivel de salida se han dispuesto 8 neuronas que corresponden con las clases a discriminar, y en el nivel oculto, el número de neuronas suele estar comprendido entre ambos, en este trabajo 6, obtenido de la expresión (3) propuesta en [7].

ENTRENAMIENTO DE UNA RED NEURONAL: RETROPROPAGACIÓN

Para que la función de activación asociada a cada neurona de una red dé una salida, debe recibir entrada de cada una de las neuronas que se encuentran el nivel anterior oi, y deben estar determinados los factores de ponderación asociados a cada una de ellas . El proceso por el cual se estiman estos factores se denomina entrenamiento y la técnica por la que se resuelve habitualmente este entrenamiento en clasificaciones multiespectrales, retropropagación.

La retropropagación comprende principalmente dos pasos: la propagación hacia adelante y hacia atrás, que modifican el estado de la red neuronal. Para ello debe haberse definido tantas áreas de entrenamiento como clases se quieran obtener en la clasificación. La experiencia recomienda que cada área de entrenamiento debe tener un número de píxeles igual o superior a 10 veces el número de bandas de la imagen multiespectral.

Figura 4. Áreas de entrenamiento de algunas clases, digitalizadas sobre una composición falso color bandas 2, 3, 4: a) Invernaderos no activos b) Invernaderos activos c) Agua superficial d) Asfalto

En la figura 4 se muestran algunas áreas de entrenamiento elegidas en este trabajo. La leyenda completa está compuesta por las siguientes clases: Invernaderos no activos, Invernaderos activos, Vegetación, Agua superficial, Asfalto, Suelo natural, Suelo sin vegetación, Sombra. Puede apreciarse que el nivel de actividad fotosintética que existe bajo el plástico de los invernaderos puede apreciarse a través de este si se introduce el registro del infrarrojo cercano (banda 4) en la composición, ya que el comportamiento radiométrico medio de esta superficie queda marcado por la capacidad de absorción de la masa vegetal activa dentro del invernadero en dicha banda y el de la propia superficie de plástico [8]. El proceso de entrenamiento comienza introduciendo en las neuronas de entrada los cuatro niveles digitales registrados en las bandas de la imagen de cada píxel. Con unos factores de ponderación iniciales elegidos arbitrariamente la red genera una respuesta en el nivel de salida, que supone la asignación de esos píxeles a una clase. La diferencia entre esta clasificación y los patrones esperados por las áreas de entrenamiento, , da una estimación del error medio cuadrático cometido por la red, E (ecuación 4).

Entonces este error es propagado hacia atrás en la red neuronal, modificando los factores de ponderación relacionados con cada conexión entre neuronas mediante la llamada regla delta o de la tasa de gradientes descendentes de Rumelhart [6] (ecuación 5):

Donde es el parámetro de tasa de aprendizaje, es el factor momento. Este proceso de cálculo de señales hacia delante y retropropagación del error cometido hasta que el error cometido por la red neuronal es minimizado o alcanza una magnitud aceptable.

El algoritmo empleado en este trabajo selecciona un conjunto de píxeles de las áreas de entrenamiento para aplicar la técnica de retropropagación descrita, y otro conjunto de píxeles de control, que no intervienen en el cálculo del error que se retropropaga, con los que se calcula el error después de cada iteración. En un entrenamiento correcto, ambos errores, el de entrenamiento y el de control deben ir reduciéndose progresivamente y de modo aproximadamente paralelo. En la figura 5 se muestra la evolución de estos errores en el entrenamiento realizado en este trabajo

Figura 5. Evolución del error cometido por la red neuronal (training error) y del error de control (testing error) a lo largo del proceso iterativo de entrenamiento.

Después de 1033 iteraciones, el error de estimación descendió a 0.0088 y el de control a 0.0089, con una relación de precisión del 85%. La constante de la función de activación (ecuación 2) fue fijada en =1, el parámetro de tasa de aprendizaje =0.2, y el factor momento =0.5.

Dado que los factores de ponderación se elijen aleatoriamente en la primera iteración y que el modelo matemático tiene muchos grados de libertad, es frecuente que se encuentre un mínimo local de los errores. No obstante esto no supone ningún problema, ya que los factores de ponderación que hacen que la red neuronal de una respuesta correcta no son únicos. También puede ocurrir que, a partir de un número alto de iteraciones, la evolución del error de entrenamiento y del de control dejen de tener la misma tendencia. En este caso se habría alcanzado un “sobreentrenamiento” de la red neuronal, lo que produciría muy probablemente problemas de respuesta de señal de salida (confusiones de clases). En la tabla 2 se presentan un estudio de precisión del entrenamiento realizado con la red neuronal. De ella pueden deducirse las clases que presentan mayor nivel de confusión por exceso o defecto y por tanto, podrían ser mejoradas unificando áreas de entrenamiento que sean en realidad la misma clase o segregando áreas de entrenamiento que contengan más de una clase.

Los errores globales se encuentran comprendidos entre el 21.88% y el 22.17% ± 0.14% con un intervalo de confianza del 99%.

RESULTADOS DE LA CLASIFICACIÓN

En la figura 6 se presenta un recorte de la clasificación obtenida, donde puede apreciarse el grado de ajuste de la clasificación con la realidad, encontrado una pequeña confusión entre los invernaderos con alta actividad fotosintética y los no activos. Los que presentan mayor nivel de actividad fotosintética pueden llegar a confundirse en algunos casos aislados con vegetación al aire libre. Destaca la precisión de definición de las superficies de agua superficial, tanto en las diferentes balsas de riego como en la rambla. Incluso pueden apreciarse suelos previsiblemente encharcados.
Se ha encontrado otro tipo de confusión en invernaderos poco activos fotosintéticamente, y que tienen sus cubiertas orientadas al sol de forma que dan un alto registro de reflectividad, con la clase suelo sin vegetación.

En la clasificación final se ha aplicado un filtro modal de 3x3 para reducir ruidos propios de una clasificación de una imagen de satélite de alta resolución espacial.

Figura 6. Detalle de la composición falso color de la imagen multiespectral y de la clasificación obtenida por aplicación de la red neuronal entrenada con ocho clases.

ANÁLISIS DE TEXTURA POR GEOMETRÍA FRACTAL

Algunas de las confusiones entre clases comentadas en el apartado 3.3 son típicas de una clasificación sobre una imagen multiespectral en la que un píxel, por su tamaño real, no representa una mezcla de clases sino más bien una porción de una determinada clase. Por tanto estas imágenes presentan un alto nivel de textura característico. La solución que proponen diversos autores (por ejemplo [1] y [2]) y que está mostrando mejores resultados es realizar un análisis de texturas, y su resultado incorporarlo a la red neuronal en el nivel de entrada como si fuera una banda más. De los diversos índices que pueden usarse como medidores de la variabilidad registrada en la imagen multiespectral, en este trabajo se ha probado la dimensión fractal calculada con un kernel de 3x3, aplicada a la imagen pancromática, ya que integra las cuatro bandas multiespectrales al estar altamente correlacionada con una combinación lineal de ellas.

La dimensión fractal no solo mide el grado de convolución de una forma geométrica, sino que también representa bien estadísticamente el concepto de autosimilitud. Se obtiene la dimensión fractal D de cada uno de los píxeles de una imagen mediante al ecuación 6:

Donde N(L) es el número de unidades elementales que contiene el objeto al que se está calculado su dimensión fractal, y L es el tamaño de las unidades elementales. El histograma de la imagen resultante de este análisis de textura está muy concentrado en niveles digitales cercanos a 2, que es la geometría fractal de un plano, presentando un mínimo y un máximo de 2 y 2.0013 respectivamente. Para poder introducirlo en la red neuronal, este histograma fue normalizado a valores comprendidos entre 0 y 255, perdiendo su significado físico pero reflejando una medida de la variabilidad de los niveles digitales presentes en la imagen.

En este caso la red neuronal estaba compuesta por un nivel de entrada de 5 neuronas (una por cada banda, más el análisis de textura incorporado), un nivel de salida de 8 neuronas (las mismas 8 clases) y un nivel oculto de 6 neuronas. Se emplearon las mismas áreas de entrenamiento que con la anterior red neuronal, y los mismos parámetros , y . En su entrenamiento se encontró solución convergente a las 726 iteraciones, alcanzando niveles de errores de entrenamiento y errores de control, ambos de 0.0096, y una relación de precisión del 85%. Los errores globales obtenidos en este entrenamiento se encuentran comprendidos entre el 23.47% y el 23.77% ± 0.15% con un intervalo de confianza del 99%.Tras el análisis de errores cometidos por defecto y exceso en cada clase, con resultados algo peores que los obtenidos con la anterior red neuronal, se procedió a la clasificación. La figura 7 muestra el mismo detalle que se presenta en la clasificación sin análisis textural (figura 6).

Puede apreciarse que existe un alto porcentaje de píxeles que en la clasificación sin análisis de textura aparecían correctamente como invernaderos activos, que en la clasificación con dicho análisis se desplazan a la clase suelo sin vegetación. Estos se han representado en la figura 8.

Existen además otros desplazamientos de clases de menor importancia cuantitativa como son el cambio de invernaderos activos a no activos y viceversa, y de invernadero activo a las clases vegetación, suelo natural.

CONCLUSIONES

Ha quedado comprobada la eficiencia del clasificador de redes neuronales artificiales para la clasificación de una imagen multiespectral del satélite de alta resolución espacial QuickBird. El empleo de este tipo de datos hace que deba replantearse la estrategia de clasificación clásica, por medios estadísticos, dejando así de depender en alguna medida de la calidad de las áreas de entrenamiento, y de la asunción de hipótesis estadísticas de partida.

Figura 7. Detalle de la clasificación obtenida por aplicación de la red neuronal entrenada con ocho clases, incorporando como dato de entrada un análisis textural por geometría fractal.


Figura 8. Desplazamiento de píxeles pertenecientes a la clase invernaderos activos que aparecen en la clase suelo sin vegetación en la clasificación que incluye el análisis textural mediante geometría fractal.


También se propone como línea de investigación futura, la consideración del algoritmo empleado como un clasificador no rígido. Esto implicaría no hacer asignaciones de clase determinísticas en cada píxel, sino establecer probabilidades de pertenencia a diferentes clases, lo cual podría reflejar mejor el hecho de que un píxel de invernadero está en realidad condicionado por el comportamiento radiométrico del plástico de cubierta y por la masa vegetal subyacente.

Las confusiones encontradas en la clasificación que no incluye análisis de textura entre las clases de invernaderos y vegetación no han sido mejoradas incluyendo dicho análisis. Esto abre dos vías de solución alternativas o complementarias: el empleo de otro indicador que represente mejor la variabilidad textural de la imagen multiespectral y/o la umbralización de conjuntos de píxeles agregados de igual clase.

AGRADECIMIENTOS

La financiación de los datos de este trabajo ha sido posible gracias a una subvención excepcional concedida por la Consejería de Educación y Ciencia de la Junta de Andalucía a través de las Oficinas de Transferencia de los Resultados a la Investigación de las universidades andaluzas. Dentro de esta convocatoria se enmarca el proyecto titulado “Generación, integración y actualización de cartografía digital como soporte de modelos de desarrollo rural sostenible. Propuesta metodológica y aplicación en el Campo de Najar (Almería)”, cuyo investigador responsable es el Dr. D. Manuel Ángel Aguilar Torres, perteneciente al grupo de investigación PAI AGR-199 “Tecnología de la Producción Agraria en Zonas Semiáridas”.

REFERENCIAS

[1] RICHARDS, John A y JIA, Xiuping. Remote Sensign Digital Image Analysis. 3ª ed. Berlin: Springer-Verlag, 1999.

[2] SÁNCHEZ MARTÍN, Nilda. Panorama actual de las técnicas mixtas de clasificación de imágenes mediante segmentación espectral y por texturas. Aplicación a las imágenes de alta resolución espacial. Mapping Nº 9, 2003.

[3] FLICKER, P., SANDAU, R., LLORENS, P., CARACUEL, J.E., CARDENAL, J., DELGADO, J. Sensores Aerotransportados Digitales (ADS): situación actual y perspectivas futuras. Topografía y Cartografía, 101 (noviembre-diciembre 2000), 50-62, 2000.

[4] FRITZ, L.W. High resolution commercial Remote Sensing Satellites and Spatial Information Systems. ISPRS Highigths Vol. 4 No. 2, 1999.

[5] KIMES, D.S.; NELSON, R.F.; MANRY, M.T. y FUNK, A.K. Attributes of neural networks for extracting continuous vegetation variables from optical and radar measurements. Int. J. Remote Sensing, vol. 19 (14): 2639-2663, 1998.

[6] ATKINSON, P.M. y TATNAL R.L. Neural Networks in Remote Sensing. Int. J. Remote Sensing, vol. 18 (4): 699-709, 1997.

[7] EASTMAN, J.R. Idrisi Kilimanjaro. Guía para SIG y Procesamiento de Imágenes. Worcester, MA.: Clark University, 2003.

[8] CADENA, T.F.; ACOSTA, D. y VICENTE, M. Caracterización del deterioro de cubiertas de invernaderos con un año de exposición en La Puna. Avances en Energías Renovables y Medio Ambiente, vol 6 (2): 109-113, 2002.

 
   
   
   
   
REGÍSTRESE
Anónimo
Usuarios activos en la página: 206
Usuario
Password
¿Desea registrarse?
¿Ha perdido su contraseña?
   
   
   
Página web creada por R&A Marketing www.ra-marketing.com