• Portada
12/2014

Contribucions a l’anàlisi automàtica de grans volums de dades

Aquesta tesi és fonamentalment un estudi sobre la recerca d’automatismes en diferents algorismes aplicats a la ciència de la informació geogràfica. Els treballs que la formen tenen un important objectiu comú: aconseguir la màxima qualitat possible dels resultats obtinguts en substituir el mètode habitual (manual) en l’anàlisi de grans volums de dades pel corresponent mètode automàtic, que mostra diversos avantatges respecte el primer, i en el qual tenen un paper rellevant les metadades, és a dir, la informació sobre dades, objectes o recursos.

Els automatismes tenen diversos avantatges respecte un mètode manual: objectivitat en la presa de decisions, repetitivitat, traçabilitat, constància i homogeneïtat (la qualitat del procés, l’atenció en termes humans no decau per tasques repetitives), i una molt important a l’hora de fer recerca: podrem analitzar les diferents respostes del nostre model en base a repeticions on canviïn uns pocs criteris o paràmetres, podrem replicar-los a altres àmbits o moments en el temps, analitzar
diferents escenaris, etc. Alhora, des del punt de vista operacional, afegeix una característica no viable pels mètodes manuals: el tractament d’un gran volum de dades, l’anomenat Big Data. Aquest és un problema (força benvingut, per cert) dels nous temps i que va creixent de forma accelerada. Actualment s’ha generalitzat la lliure distribució de dades i es generen amb un detall espacial i recurrència temporal poc imaginables fa uns anys.
 
Les principals aportacions concretes seguint aquestes objectius són:
 
· L’automatització de l’anàlisi del variograma, el disseny distribuït i la implementació paral·lelitzada d’un mètode geoestadístic d’interpolació espacial: el kriging. Permet usar aquest mètode en aplicacions a temps real i amb grans volums de dades, mantenint la màxima qualitat en el model interpolat.
 
· La integració en el SIG de tots els processos per la publicació automàtica a Internet de mapes de variables contínues obtingudes des de mostreigs de diverses espècies de flora i fauna a partir de modelitzacions geoestadístiques.
 
· L’anàlisi geoestadística d’imatges de Teledetecció de llargues sèries temporals ha permès afegir elements d’estudi del patró espacial que milloren altres tècniques que no tenen en compte l’estructura espacial de les propietats radiomètriques de les imatges. Alguns exemples són la selecció d’imatges d’elevada qualitat i l’estudi de les alteracions provocades pels mètodes de compressió amb pèrdua.
 
· La generació automàtica de valors de referència, en zones amb valors de reflectància quasi constant, i la seva aplicabilitat en un nou model de correcció radiomètrica automàtica d’imatges Landsat, obre la porta a estudis on es necessiti tractar un gran nombre d’aquestes imatges.
 
Finalment, i com aportació global de la tesi, destacar el paper rellevant que tenen les metadades en els processos automàtics. Aquest nou rol afegeix uns trets més geogràfics que els usos habituals només aplicats a les cerques sobre catàlegs, sovint allunyades de la seva component geogràfica.

Imatge esquerra: 4 escenes, seleccionades de la llarga sèrie Landsat, que mostren els canvis dels darrers 30 anys a la desembocadura del riu Llobregat i infraestructures veïnes, com l’aeroport i el port de  Barcelona.

Lluís Pesquer

Referències

“Contribucions a l’anàlisi automàtica de grans volums de dades en el context de la Ciència de la Informació Geogràfica”, tesi doctoral de Lluís Pesquer (CREAF), dirigida pel Dr. Xavier Pons i llegida al Departament de Geografia de la UAB.

 
View low-bandwidth version