Andichi/Shutterstock |
Tant les xarxes socials com les xarxes de carreteres es poden representar mitjançant grafs, això és, objectes matemàtics que ens permeten descriure i analitzar sistemes on els seus elements estan relacionats. Per exemple, en una xarxa social, podem representar a les persones com a nodes i les connexions d'amistat entre elles com a arestes. Un altre cas és el dels sistemes de transport, on les ciutats són els nodes i les carreteres que les connecten són les arestes.
La teoria de grafos moderna naix en 1736 amb el famós problema dels ponts de Königsberg plantejat per Leonhard Euler. Des de llavors, esta teoria s'ha consolidat com una important branca de les matemàtiques, tant teòrica com aplicada. No obstant això, només recentment els avanços en aprenentatge profund (de l'anglés deep learning) han començat a integrar-se en este àrea.
La raó fonamental és que l'aprenentatge automàtic s'ha centrat tradicionalment en l'anàlisi i processament de dades tabulars, imatges, text i àudio. Des de fa una mica més de deu anys, algunes arquitectures sofisticades de xarxes neuronals han revolucionat camps com el reconeixement d'imatges (xarxes de convolució) i el processament del llenguatge natural (xarxes recurrents i transformadors).
No obstant això, estes arquitectures no són adequades per a dades en forma de grafs, on la relació entre les dades és tan important com les dades mateixes.
El problema de les permutacions
Matemàticament, la principal limitació d'estes tècniques d'aprenentatge profund per a manejar i analitzar grafs és que no són invariants a les permutacions de les dades.
Per a entendre això, vegem un exemple senzill:
Imaginem que tenim un graf que representa les amistats entre quatre persones: Adán Benítez, Belén Antúnez, Carlos Díaz i Diego Canales. Estes persones estan connectades de la manera següent: Adán és amic de Betlem i Carlos; Belén és amiga d'Adán i Carlos; Carlos és amic de tots els altres i, finalment, Diego és amic solament de Carlos.
El graf que representa les relacions entre les persones no depén de si identifiquem els nodes mitjançant la inicial del nom o del cognom de cada persona. No obstant això, la taula que arreplega les relacions (matriu d'adjacència) pot canviar segons com nomenem els nodes malgrat representar la mateixa realitat.
En la figura següent s'observa que tots dos grafs són iguals (mateixes connexions entre les mateixes persones), però els patrons de les matrius d'adjacència són diferents.
Una xarxa neuronal tradicional podria interpretar este canvi d'orde com un graf diferent. Això és problemàtic, perquè volem que la nostra xarxa neuronal entenga que l'estructura de les amistats és la mateixa independentment de l'orde en què es considere a les persones.
La solució de les xarxes neuronals gràfiques
Per a resoldre este problema, les xarxes neuronals gràfiques (Graph Neural Networks o GNN en anglés) es basen en la propagació de missatges i l'agregació d'informació. Cada node del graf rep informació dels seus nodes veïns a través de les arestes que els connecten. Este procés es repetix en diverses capes, permetent que la informació fluïsca a través del graf.
Propagació de missatges: En cada capa d'una xarxa neuronal gràfica, cada node envia i rep missatges dels seus nodes veïns. Imagine que cada persona en la nostra xarxa d'amistats envia un missatge a tots els seus amics. Estos missatges contenen informació rellevant sobre cada persona, com les seues característiques i estats.
Agregació d'informació: Després de rebre els missatges, cada node (o persona) combina la informació rebuda dels seus amics. Això es fa mitjançant una operació d'agregació, com una suma, una mitjana o un màxim. Per exemple, si Ana, Ben i Carla s'envien missatges entre si, cadascun d'ells sumarà, farà una mitjana d'o prendrà el valor màxim dels missatges rebuts.
El fet que l'agregació es base en operacions com la suma o la mitjana és el que garantix la invariància a les permutacions. No importa en quin orde rebem els missatges, el resultat final de l'agregació serà el mateix. Per exemple, sumar 2, 3 i 5 donarà el mateix resultat independentment de l'orde que sumem estos números.
Aprenent a diversos nivells
Les xarxes neuronals gràfiques són capaces d'analitzar, trobar patrons i realitzar prediccions a diferents nivells:
Nivell de node: predicció de propietats específiques de nodes individuals, com la detecció de fraus en transaccions de bitcoins.
Nivell d'aresta: predicció de connexions futures en xarxes socials, com identificar qui podria convertir-se en amic de qui o recomanacions d'articles en plataformes de compra en línia.
Nivell de graf complet: anàlisi de propietats globals del graf, com la predicció de la solubilitat de compostos químics.
Aplicacions de les xarxes neuronals gràfiques
Encara que les notícies sobre intel·ligència artificial generativa, com ChatGPT i DALL-E, han dominat els titulars, les xarxes neuronals gràfiques ja s'utilitzen en diverses aplicacions amb un impacte similar en les nostres vides:
Sistemes de recomanació. Alibaba les utilitza per a millorar la precisió de les seues recomanacions de productes, integrant informació complexa sobre els usuaris i les seues interaccions.
Biomedicina. AlphaFold de DeepMind, una ferramenta utilitzada en biologia computacional, les usa per a predir l'estructura de proteïnes amb una precisió sense precedents.
Navegació i transport. Google Maps empra en l'actualitat xarxes neuronals gràfiques per a optimitzar rutes i predir el trànsit en temps real.
Meteorologia. GraphCast de Google les aplica per a millorar les prediccions meteorològiques. Pot realitzar una predicció de deu dies de la meteorologia global en qüestió de minuts.
Les xarxes neuronals gràfiques ja es troben en les nostres vides sense que ho sapiem, i les emprem quan utilitzem Google Maps o rebem recomanacions de productes per a comprar en internet. Encara que poc conegudes pel públic general, suposen un dels grans avanços en el camp de la intel·ligència artificial dels últims anys.
Diego Canales Aguilera, Professor d'Intel·ligència Artificial, Universitat Loyola Andalusia
Este article va ser publicat originalment en The Conversation.
* ho pots llegir perquè som Creative Commons
Cap comentari :