La zona de estudio corresponde al Campo de Níjar, provincia
de Almería, donde el uso del suelo está marcado principalmente
por el sistema de producción agrícola de cultivo intensivo
bajo plástico. Con ello se pretende establecer las bases del
diseño de una metodología óptima para la detección
de superficies invernadas empleando las imágenes del satélite
mencionado, cuya puesta en funcionamiento es reciente, y cuyas características
técnicas han abierto nuevas expectativas.
Palabras clave: Redes neuronales artificiales, clasificación
de imágenes multiespectrales.
In this work we propose the classification of a multispectral image
by means of the training of a artificial neural nerwork using back propagation
technique. The calculation is based on information from training sites
identified on remotely sensed imagery: very high spatial resolution
satellite QuickBird.
The zone of study includes Campo de Níjar, province of Almería,
where the use of the soil is determined principally by agricultural
production system of intensive production in greenhouses. We try to
establish the bases of the design of an ideal methodology for the detection
of greenhouses surfaces using the images of the mentioned satellite,
which was put in functioning recently, and whose technical characteristics
have opened new expectations.
Key words: Artificial neural networks, Classification of multispectral
images.
Grupo temático: GIS: Sistemas de Información Geográfica
y Cartografía
La clasificación es una de las técnicas más aplicadas
en teledetección y fotointerpretación de imágenes
de satélite. Sus aplicaciones son de lo más variadas:
detección de cubiertas, usos de suelo, geología, urbanismo,
etc. La información que contienen las imágenes de satélite
puede ser obtenida por clasificación, basándose en los
datos que presentan sus píxeles en cada una de las bandas registradas.
Los algoritmos de clasificación estadística son los más
frecuentemente usados para asignar la clase a que pertenecen cada uno
de los píxeles de una imagen de satélite [1]. Uno de los
aspectos más destacados de estos algoritmos es que producen resultados
de probabilidad de pertenencia. De hecho, algunos de ellos se basan
en la clasificación de cada píxel a la clase a la que
pertenece con mayor probabilidad. También pueden dar como resultado
mapas de clasificación donde cada clase, incluso cada píxel
tiene su nivel de confianza estimado.
Sin embargo para la aplicación de estos algoritmos se necesita
asumir una serie de hipótesis estadísticas a priori como
funciones de probabilidad o funciones de distribución, con el
riesgo que ello supone. La aplicación de redes neuronales artificiales,
aunque más complicada conceptualmente, permite adoptar una interpretación
geométrica de la información multiespectral como regla
de decisión, prescindiendo del uso de modelos estadísticos.
Con la aparición de satélites de alta resolución
espacial como IKONOS en el año 1999 o QuickBird en 2001, deja
de tener sentido el análisis por píxel. Cada uno de ellos
ya no representa un objeto, una clase o una entidad sino una porción
de ello [2]. Se amplían las aplicaciones tradicionales de la
teledetección en áreas urbanas, incluso alcanzando la
actualización cartográfica [3], integrándose con
las técnicas de fotogrametría [4].
Las imágenes procedentes de satélites de alta resolución
espacial se presentan fuertemente texturadas lo cual facilita su clasificación.
Por tanto, la incorporación de un análisis de textura
a la información multiespectral debe mejorar apreciablemente
los resultados de clasificación.
El objetivo de este trabajo es diseñar y entrenar una red neuronal
que permita realizar la clasificación de una imagen del satélite
QuickBird obtenida en diciembre de 2004, sobre el Campo de Níjar,
provincia de Almería, poniendo especial interés en la
discriminación de la clase “invernaderos”. Una vez
aplicada la clasificación se han evaluado las confusiones aparecidas
dentro de esta clase y se ha incorporado a la red neuronal un análisis
de textura por geometría fractal, estudiando sus consecuencias
en la mejora de la clasificación de la clase de mayor interés.
El Campo de Níjar (figura 1) es una comarca de la provincia
de Almería cuyo sistema de producción agrícola
es intensivo bajo plástico. La estructura de los invernaderos
condiciona el paisaje, junto con una vegetación natural de tipo
monte bajo, una concentración dispersa de áreas de población
y una orografía poco montañosa limitada al sur por la
Sierra La Serrata y al norte por Sierra Alhamilla.
El Campo de Níjar (figura 1) es una comarca de la provincia
de Almería cuyo sistema de producción agrícola
es intensivo bajo plástico. La estructura de los invernaderos
condiciona el paisaje, junto con una vegetación natural de tipo
monte bajo, una concentración dispersa de áreas de población
y una orografía poco montañosa limitada al sur por la
Sierra La Serrata y al norte por Sierra Alhamilla.
Comprende unas 20.000 Has y dispone de una red de abastecimiento de
agua y un conjunto de balsas de regulación que gestionan recursos
hídricos propios y los procedentes de la desaladora de la población
cercana de Carboneras.
Figura 1. Localización de la zona de estudio
Para su clasificación, fue obtenida una imagen
del satélite QuickBird el 19 de diciembre de 2004 (figura 2),
con un porcentaje de cubierta de nubes del 6%, un ángulo de
desviación de nadir de 8º, un azimut objetivo de 303º
y una calidad ambiental del 90% calificada como excelente por el proveedor.
Las coordenadas límites que abarca la imagen se muestran en
la tabla 1.

Figura 2. Composición color verdadero
con las bandas 1, 2 y 3 de la imagen del satélite QuickBird.
|
La imagen está compuesta por cuatro bandas
registradas en el visible e infrarrojo cercano, con una resolución
espacial de 2.49 m, y una banda pancromática con resolución
espacial de 0.62 m.
CLASIFICACIÓN POR REDES NEURONALES
ARTIFICIALES
Las redes neuronales artificiales simulan el proceso
de resolución de problemas espaciales por parte del cerebro
humano. Aplicado a la clasificación basada en la información
registrada en diferentes longitudes de onda, es decir multiespectral,
suele ser más eficiente y suele necesitar menos entrenamiento
que los algoritmos de clasificación estadísticos o tradicionales
[5]. En su diseño y desarrollo no hay que asumir ninguna hipótesis
estadística de partida como funciones de distribución
de variables ni dependencias multivariables.
Puede entenderse que una red neuronal artificial
es un modelo matemático complejo, basado en ecuaciones no lineales,
en el que se introducen unas variables de entrada (en este trabajo,
una imagen multiespectral) y se obtiene una respuesta o datos de salida
(clasificación de dicha imagen). La red neuronal se ajusta
para que dé resultados parecidos a los introducidos en un proceso
previo de aprendizaje o entrenamiento. El método empleado en
este trabajo para la fase de entrenamiento se conoce como retropropagación
[6].
PROCESO ELEMENTAL: NEURONA
Una red neuronal está definida por un nivel
de entrada, un nivel de salida y uno o varios niveles ocultos (figura
3).

Figura 3. Estructura de una red neuronal de tres
niveles.
|
Cada uno de estos niveles está compuesto por
un número de neuronas, llamadas así por analogía
con el cerebro humano, que representan los procesos elementales de
decisión. La salida de una neurona oj se obtiene por una función
que evalúa ponderadamente cada una de las entradas procedentes
de las neuronas del nivel anterior
mediante
la siguiente expresión:
En la que
es un umbral y
el vector de coeficientes de ponderación. Esta función
se conoce como función de activación y suele ser una
expresión exponencial (ecuación 2).
En la que
es una constante. En clasificación multiespectral suele ser
suficiente el empleo de redes neuronales de tres niveles, uno de entrada,
otro oculto y otro de salida [5] tal y como refleja la figura 3. El
número de neuronas asignadas al nivel de entrada ha sido 4,
coincidiendo con el número de bandas existentes en la imagen
multiespectral, en el nivel de salida se han dispuesto 8 neuronas
que corresponden con las clases a discriminar, y en el nivel oculto,
el número de neuronas suele estar comprendido entre ambos,
en este trabajo 6, obtenido de la expresión (3) propuesta en
[7].
ENTRENAMIENTO DE UNA RED NEURONAL: RETROPROPAGACIÓN
Para que la función de activación asociada
a cada neurona de una red dé una salida, debe recibir entrada
de cada una de las neuronas que se encuentran el nivel anterior oi,
y deben estar determinados los factores de ponderación asociados
a cada una de ellas
.
El proceso por el cual se estiman estos factores se denomina entrenamiento
y la técnica por la que se resuelve habitualmente este entrenamiento
en clasificaciones multiespectrales, retropropagación.
La retropropagación comprende principalmente
dos pasos: la propagación hacia adelante y hacia atrás,
que modifican el estado de la red neuronal. Para ello debe haberse
definido tantas áreas de entrenamiento como clases se quieran
obtener en la clasificación. La experiencia recomienda que
cada área de entrenamiento debe tener un número de píxeles
igual o superior a 10 veces el número de bandas de la imagen
multiespectral.

Figura 4. Áreas de entrenamiento
de algunas clases, digitalizadas sobre una composición
falso color bandas 2, 3, 4: a) Invernaderos no activos b) Invernaderos
activos c) Agua superficial d) Asfalto |
En la figura 4 se muestran algunas áreas de
entrenamiento elegidas en este trabajo. La leyenda completa está
compuesta por las siguientes clases: Invernaderos no activos, Invernaderos
activos, Vegetación, Agua superficial, Asfalto, Suelo natural,
Suelo sin vegetación, Sombra. Puede apreciarse que el nivel
de actividad fotosintética que existe bajo el plástico
de los invernaderos puede apreciarse a través de este si se
introduce el registro del infrarrojo cercano (banda 4) en la composición,
ya que el comportamiento radiométrico medio de esta superficie
queda marcado por la capacidad de absorción de la masa vegetal
activa dentro del invernadero en dicha banda y el de la propia superficie
de plástico [8]. El proceso de entrenamiento comienza introduciendo
en las neuronas de entrada los cuatro niveles digitales registrados
en las bandas de la imagen de cada píxel. Con unos factores
de ponderación iniciales elegidos arbitrariamente la red genera
una respuesta en el nivel de salida,
que supone la asignación de esos píxeles a una clase.
La diferencia entre esta clasificación y los patrones esperados
por las áreas de entrenamiento,
,
da una estimación del error medio cuadrático cometido
por la red, E (ecuación 4).
Entonces este error es propagado hacia atrás
en la red neuronal, modificando los factores de ponderación
relacionados con cada conexión entre neuronas mediante la llamada
regla delta o de la tasa de gradientes descendentes de Rumelhart [6]
(ecuación 5):
Donde
es el parámetro de tasa de aprendizaje,
es el factor momento. Este proceso de cálculo de señales
hacia delante y retropropagación del error cometido hasta que
el error cometido por la red neuronal es minimizado o alcanza una
magnitud aceptable.
El algoritmo empleado en este trabajo selecciona
un conjunto de píxeles de las áreas de entrenamiento
para aplicar la técnica de retropropagación descrita,
y otro conjunto de píxeles de control, que no intervienen en
el cálculo del error que se retropropaga, con los que se calcula
el error después de cada iteración. En un entrenamiento
correcto, ambos errores, el de entrenamiento y el de control deben
ir reduciéndose progresivamente y de modo aproximadamente paralelo.
En la figura 5 se muestra la evolución de estos errores en
el entrenamiento realizado en este trabajo

Figura 5. Evolución del error cometido
por la red neuronal (training error) y del error de control
(testing error) a lo largo del proceso iterativo de entrenamiento.
|
Después de 1033 iteraciones, el error de estimación
descendió a 0.0088 y el de control a 0.0089, con una relación
de precisión del 85%. La constante de la función de
activación (ecuación 2) fue fijada en
=1,
el parámetro de tasa de aprendizaje
=0.2,
y el factor momento
=0.5.
Dado que los factores de ponderación se elijen
aleatoriamente en la primera iteración y que el modelo matemático
tiene muchos grados de libertad, es frecuente que se encuentre un
mínimo local de los errores. No obstante esto no supone ningún
problema, ya que los factores de ponderación que hacen que
la red neuronal de una respuesta correcta no son únicos. También
puede ocurrir que, a partir de un número alto de iteraciones,
la evolución del error de entrenamiento y del de control dejen
de tener la misma tendencia. En este caso se habría alcanzado
un “sobreentrenamiento” de la red neuronal, lo que produciría
muy probablemente problemas de respuesta de señal de salida
(confusiones de clases). En la tabla 2 se presentan un estudio de
precisión del entrenamiento realizado con la red neuronal.
De ella pueden deducirse las clases que presentan mayor nivel de confusión
por exceso o defecto y por tanto, podrían ser mejoradas unificando
áreas de entrenamiento que sean en realidad la misma clase
o segregando áreas de entrenamiento que contengan más
de una clase.
Los errores globales se encuentran comprendidos entre
el 21.88% y el 22.17% ± 0.14% con un intervalo de confianza
del 99%.
RESULTADOS DE LA CLASIFICACIÓN
En la figura 6 se presenta un recorte de la clasificación
obtenida, donde puede apreciarse el grado de ajuste de la clasificación
con la realidad, encontrado una pequeña confusión entre
los invernaderos con alta actividad fotosintética y los no
activos. Los que presentan mayor nivel de actividad fotosintética
pueden llegar a confundirse en algunos casos aislados con vegetación
al aire libre. Destaca la precisión de definición de
las superficies de agua superficial, tanto en las diferentes balsas
de riego como en la rambla. Incluso pueden apreciarse suelos previsiblemente
encharcados.
Se ha encontrado otro tipo de confusión en invernaderos poco
activos fotosintéticamente, y que tienen sus cubiertas orientadas
al sol de forma que dan un alto registro de reflectividad, con la
clase suelo sin vegetación.
En la clasificación final se ha aplicado un
filtro modal de 3x3 para reducir ruidos propios de una clasificación
de una imagen de satélite de alta resolución espacial.

Figura 6. Detalle de la composición falso
color de la imagen multiespectral y de la clasificación
obtenida por aplicación de la red neuronal entrenada
con ocho clases.
|
ANÁLISIS DE TEXTURA POR GEOMETRÍA
FRACTAL
Algunas de las confusiones entre clases comentadas
en el apartado 3.3 son típicas de una clasificación
sobre una imagen multiespectral en la que un píxel, por su
tamaño real, no representa una mezcla de clases sino más
bien una porción de una determinada clase. Por tanto estas
imágenes presentan un alto nivel de textura característico.
La solución que proponen diversos autores (por ejemplo [1]
y [2]) y que está mostrando mejores resultados es realizar
un análisis de texturas, y su resultado incorporarlo a la red
neuronal en el nivel de entrada como si fuera una banda más.
De los diversos índices que pueden usarse como medidores de
la variabilidad registrada en la imagen multiespectral, en este trabajo
se ha probado la dimensión fractal calculada con un kernel
de 3x3, aplicada a la imagen pancromática, ya que integra las
cuatro bandas multiespectrales al estar altamente correlacionada con
una combinación lineal de ellas.
La dimensión fractal no solo mide el grado
de convolución de una forma geométrica, sino que también
representa bien estadísticamente el concepto de autosimilitud.
Se obtiene la dimensión fractal D de cada uno de los píxeles
de una imagen mediante al ecuación 6:
Donde N(L) es el número de unidades elementales
que contiene el objeto al que se está calculado su dimensión
fractal, y L es el tamaño de las unidades elementales. El histograma
de la imagen resultante de este análisis de textura está
muy concentrado en niveles digitales cercanos a 2, que es la geometría
fractal de un plano, presentando un mínimo y un máximo
de 2 y 2.0013 respectivamente. Para poder introducirlo en la red neuronal,
este histograma fue normalizado a valores comprendidos entre 0 y 255,
perdiendo su significado físico pero reflejando una medida
de la variabilidad de los niveles digitales presentes en la imagen.
En este caso la red neuronal estaba compuesta por
un nivel de entrada de 5 neuronas (una por cada banda, más
el análisis de textura incorporado), un nivel de salida de
8 neuronas (las mismas 8 clases) y un nivel oculto de 6 neuronas.
Se emplearon las mismas áreas de entrenamiento que con la anterior
red neuronal, y los mismos parámetros
,
y
.
En su entrenamiento se encontró solución convergente
a las 726 iteraciones, alcanzando niveles de errores de entrenamiento
y errores de control, ambos de 0.0096, y una relación de precisión
del 85%. Los errores globales obtenidos en este entrenamiento se encuentran
comprendidos entre el 23.47% y el 23.77% ± 0.15% con un intervalo
de confianza del 99%.Tras el análisis de errores cometidos
por defecto y exceso en cada clase, con resultados algo peores que
los obtenidos con la anterior red neuronal, se procedió a la
clasificación. La figura 7 muestra el mismo detalle que se
presenta en la clasificación sin análisis textural (figura
6).
Puede apreciarse que existe un alto porcentaje de
píxeles que en la clasificación sin análisis
de textura aparecían correctamente como invernaderos activos,
que en la clasificación con dicho análisis se desplazan
a la clase suelo sin vegetación. Estos se han representado
en la figura 8.
Existen además otros desplazamientos de clases
de menor importancia cuantitativa como son el cambio de invernaderos
activos a no activos y viceversa, y de invernadero activo a las clases
vegetación, suelo natural.
CONCLUSIONES
Ha quedado comprobada la eficiencia del clasificador
de redes neuronales artificiales para la clasificación de una
imagen multiespectral del satélite de alta resolución
espacial QuickBird. El empleo de este tipo de datos hace que deba
replantearse la estrategia de clasificación clásica,
por medios estadísticos, dejando así de depender en
alguna medida de la calidad de las áreas de entrenamiento,
y de la asunción de hipótesis estadísticas de
partida.

Figura 7. Detalle de la clasificación
obtenida por aplicación de la red neuronal entrenada
con ocho clases, incorporando como dato de entrada un análisis
textural por geometría fractal.
|

Figura 8. Desplazamiento de píxeles pertenecientes
a la clase invernaderos activos que aparecen en la clase suelo
sin vegetación en la clasificación que incluye
el análisis textural mediante geometría fractal.
|
También se propone como línea de investigación
futura, la consideración del algoritmo empleado como un clasificador
no rígido. Esto implicaría no hacer asignaciones de
clase determinísticas en cada píxel, sino establecer
probabilidades de pertenencia a diferentes clases, lo cual podría
reflejar mejor el hecho de que un píxel de invernadero está
en realidad condicionado por el comportamiento radiométrico
del plástico de cubierta y por la masa vegetal subyacente.
Las confusiones encontradas en la clasificación
que no incluye análisis de textura entre las clases de invernaderos
y vegetación no han sido mejoradas incluyendo dicho análisis.
Esto abre dos vías de solución alternativas o complementarias:
el empleo de otro indicador que represente mejor la variabilidad textural
de la imagen multiespectral y/o la umbralización de conjuntos
de píxeles agregados de igual clase.
AGRADECIMIENTOS
La financiación de los datos de este trabajo
ha sido posible gracias a una subvención excepcional concedida
por la Consejería de Educación y Ciencia de la Junta
de Andalucía a través de las Oficinas de Transferencia
de los Resultados a la Investigación de las universidades andaluzas.
Dentro de esta convocatoria se enmarca el proyecto titulado “Generación,
integración y actualización de cartografía digital
como soporte de modelos de desarrollo rural sostenible. Propuesta
metodológica y aplicación en el Campo de Najar (Almería)”,
cuyo investigador responsable es el Dr. D. Manuel Ángel Aguilar
Torres, perteneciente al grupo de investigación PAI AGR-199
“Tecnología de la Producción Agraria en Zonas
Semiáridas”.
REFERENCIAS
[1] RICHARDS, John A y JIA, Xiuping. Remote Sensign
Digital Image Analysis. 3ª ed. Berlin: Springer-Verlag, 1999.
[2] SÁNCHEZ MARTÍN, Nilda. Panorama
actual de las técnicas mixtas de clasificación de imágenes
mediante segmentación espectral y por texturas. Aplicación
a las imágenes de alta resolución espacial. Mapping
Nº 9, 2003.
[3] FLICKER, P., SANDAU, R., LLORENS, P., CARACUEL,
J.E., CARDENAL, J., DELGADO, J. Sensores Aerotransportados Digitales
(ADS): situación actual y perspectivas futuras. Topografía
y Cartografía, 101 (noviembre-diciembre 2000), 50-62, 2000.
[4] FRITZ, L.W. High resolution commercial Remote
Sensing Satellites and Spatial Information Systems. ISPRS Highigths
Vol. 4 No. 2, 1999.
[5] KIMES, D.S.; NELSON, R.F.; MANRY, M.T. y FUNK,
A.K. Attributes of neural networks for extracting continuous vegetation
variables from optical and radar measurements. Int. J. Remote Sensing,
vol. 19 (14): 2639-2663, 1998.
[6] ATKINSON, P.M. y TATNAL R.L. Neural Networks
in Remote Sensing. Int. J. Remote Sensing, vol. 18 (4): 699-709, 1997.
[7] EASTMAN, J.R. Idrisi Kilimanjaro. Guía
para SIG y Procesamiento de Imágenes. Worcester, MA.: Clark
University, 2003.
[8] CADENA, T.F.; ACOSTA, D. y VICENTE, M. Caracterización
del deterioro de cubiertas de invernaderos con un año de exposición
en La Puna. Avances en Energías Renovables y Medio Ambiente,
vol 6 (2): 109-113, 2002.