Proximitat

Tot sobre la intel·ligència artificial Atomian – Entrevista a la portaveu Amaia Marsà

Raquel Casals
Escrit per Raquel Casals
Què és el vostre projecte Atomian?

L’empresa es va fundar el 2014. Som encara una startup. Darrere de la creació de l’empresa hi ha 15 anys d’història, d’investigació del nostre CEO, en Miquel. Ara en són 17 ja. 15 anys només dedicat a investigar i desenvolupar la teoria de la intel·ligència artificial, basada en la intel·ligència artificial simbòlica. A grans trets, hi ha dues grans branques d’IA: la simbòlica i la connexionista. La connexionista és la que es coneix més, el machine learning. És la branca d’IA més coneguda. El model que va crear el Miquel es basa en la simbòlica, que no hi té res a veure i que es va desenvolupar els anys 50 volent crear una gran IA de propòsits generals.

El que nosaltres fem és representar els conceptes més enllà de les paraules. O sigui, tot el concepte del món està representat en símbols, que nosaltres anomenem àtoms de coneixement. D’aquí el nom d’Atomian. Tots els àtoms de coneixement són dades i són cognicions al voltant d’aquestes dades. Per això diem que és un model del món, perquè no només expliquem les dades, sinó les relacions entre elles.

 

El propòsit d’en Miquel no era publicar, sinó que com a emprenedor ell volia donar-li una aplicació pràctica. Hi va haver com un període d’uns dos anys de recerca, d’explicar què teníem. Hem anat durant aquest temps fent visites per explicar què tenim: un cervell digital. La primera aplicació que se li va veure va ser que pot servir per preguntar-li sobre dades. Si tenim una aplicació que pot emmagatzemar tot de dades, vol dir que podem preguntar-li sobre elles. Tot això tenint en compte que entén el llenguatge natural. No processa la paraula, sinó que l’entén i la relaciona amb altres. Atomian pot prendre decisions operatives que ara les han de prendre les persones.

Bàsicament, entén els conceptes i te’ls sap relacionar, doncs?

El nostre model té dos grans avantatges competitius. La primera és el fet que entén el llenguatge natural. Al final, es tradueix tot en un servidor web on tu fas una pregunta, Atomian l’entén i busca la informació dins el cervell. No la busca per paraules clau, com Google, sinó que analitza la frase i l’entén. Construeix una resposta dinàmicament. Altres sistemes el que fan és escollir la resposta predeterminada que més s’assembla al que tu li has preguntat. Atomian, si té la informació, te la donarà, però si no… Et dirà “no tinc aquesta informació”. No et diu probabilitats, no fa prediccions, li pots preguntar sobre dades reals. Ara bé, quan et dóna una resposta, saps que és segura al 100%. Aquesta seria una gran diferència.

Una altra diferència seria que és l’únic model que coneixem que pot tractar alhora dades estructurades (dades d’Excel, de camps…) i dades de text lliure (word, text). Li pots preguntar qualsevol tipus d’informació independentment del format, perquè un únic cervell ha assimilat totes les dades, per tant és possible fer preguntes creuades. Hi ha altres sistemes que només tracten dades estructurades, per exemple.

Bé, tot això que ens has explicat és a nivell teòric, però s’ha aplicat ja en alguna empresa o institució?

De moment, hem fet proves de concepte. La manera d’entrar al mercat que hem tingut és a través de proves pilot. Per què? Per l’època de crisi i perquè és una tecnologia molt nova. No és un producte tancat, un producte madur, sinó que és alguna cosa tan nova que el que hem hagut de fer és començar amb proves pilot. Sobretot en el camp de salut, ara estem treballant per l’Hospital de Granollers. Serà el primer hospital que tindrà Atomian en els seus sistemes, abans que acabi l’any els haurem implantat aquest primer pilot. Haurà d’integrar totes les dades de l’hospital.

Vam començar en el sector salut amb una prova pilot a l’Hospital de Sant Joan de Reus. Vam veure que allà hi havia una gran oportunitat perquè als hospitals estan constantment generant dades, contínuament omplint. Els costa molt accedir a tot el que ells estan generant contínuament. Han vist en Atomian una eina molt fàcil de fer servir. Al final, és una interfície web amb un cercador on fer una pregunta per arribar a la informació. Després s’hi poden afegir panells per marcar objectius, fer seguiments de variables, guardar preguntes que es facin regularment… El que els equips de salut volen són eines fàcils, que els donin una resposta ràpida.

Estem fent una altra prova pilot per a CatSalut, per automatitzar el procés d’informació. Per extraure informació clau de les històries clíniques.

Tenim un projecte obert amb Hospital Clínic. Un projecte obert amb Sant Pau… Ara mateix està tot al laboratori, encara, per això.

També estem treballant amb un projecte per un gran banc (que no podem anomenar per confidencialitat), pel sector de banca legal. Aquesta seria la branca d’automatització de processos. Automatitzem una tasca monòtona i repetitiva que ara fan persones. Un advocat llegeix un document, n’extreu la informació clau i signa conforme tot és correcte. Atomian fa que això sigui fet automàticament i que l’advocat l’únic que hagi de fer sigui signar.

Llavors, en aquests projectes, dieu que treballareu amb CatSalut. És un camp una mica de risc. Hi ha algun marge d’error? Teniu assegurat que quan pregunteu al cervell no s’equivoca en absolut?

Sí. Realment, si li manquen dades, el cervell et dirà “no tinc dades suficients per respondre’t això”. Per altra banda, en el camp de la salut, en el tema de les dades personals és clau l’anonimització de les dades. Nosaltres no comencem a treballar-hi sense que s’hagi firmat abans un NDA, és a dir, l’acord de confidencialitat. Quan ho facin servir ells, evidentment, ja tindran les dades. El que volen fer ells és la investigació, extreure anàlisis d’aquelles dades. En això és molt important que no s’equivoqui i el marge d’error és molt baix. Si no té dades, no respon.

Per ara, sou encara un projecte prematur, has dit. Però… Quina és l’ambició? Quines metes us poseu? Esteu avançant a bon pas, però fins on voleu arribar? Us limitareu només a territori català o més enllà?

La idea és internacionalitzar-nos. Hem començat per Catalunya per un tema de recursos, al final som 14 persones, no arribem a tot arreu. Que, per cert, som més noies que nois. Com ens hem decantat pel sector salut, tenim bioinformàtiques i també gent que ve d’enginyeria. A nivell d’avançar, ens truca molta gent per col·laborar. Des de Mèxic, Colòmbia, Aràbia Saudí… Ens surten oportunitats que per temes de recursos ara encara no podem executar.

De moment, ho fem tot nosaltres perquè estem començant. La idea és créixer a través de partners. Nosaltres només produïm i després tenim tot un grup de partners al voltant. Tot i que la IA està molt de moda, la gent és molt reticent. Primer, que comenci el veí, després “ja m’ho pensaré”. Costa fer el primer pas. Als EUA s’avança ràpid i aquí encara som conservadors.

Tota l’assimilació de dades és automàtica, però sempre hi ha la supervisió. Atomian aprèn de manera supervisada. T’evita altres riscos que té la intel·ligència artificial, com el tema de dades esbiaixades amb racisme, masclisme, xenofòbia… Si el llenguatge ho incorpora, els algoritmes també. Nosaltres ho podem evitar perquè realment fem un aprenentatge supervisat.

Preveiem que podem créixer a nivell internacional durant l’any que ve i el següent. De moment, cap a Europa i, quan puguem, cap a Estats Units i Llatinoamèrica.

No existeix cap empresa que us faci la competència, que sigui similar? Ni a Estats Units, que és un lloc on van avançats tecnològicament?

Per la part del coneixement, tenim els business intelligence. Són molt rígids, amb preguntes/consultes ja establertes que es poden preguntar, però no pots sortir d’aquí. Competim amb aquest tipus de business intelligence, però estan lluny de ser un sistema d’IA. Això sí, cobrim les mateixes necessitats.

També IBM Watson, que tenen uns productes basats en IA increïble, de l’altra branca d’IA. Cobreixen necessitats de molts sectors. Tot i que IBM és un monstre, en moltes cosetes hi tenim similituds, tot i que amb aplicacions diferents. Ells diagnostiquen i proposen tractaments. Nosaltres no diagnostiquem, ens descartem totalment d’aquesta posició. Nosaltres som una eina cognitiva per a l’equip mèdic. No pretenem fer la funció del metge perquè entenem que no es pot substituir. Donem tota la informació perquè es pugui fer l’anàlisi i decidir, però no es proposen tractaments.

En temes de business intelligence i healthcare… La nostra és una interfície molt fàcil. Altres sistemes obliguen als metges a fer servir etiquetes, o escriure-ho de maneres diferents, amb codis. Nosaltres els ho fem escriure com vulguin, que Atomian ja ho entendrà. S’ha d’intentar evitar tan com es pugui canviar la manera de fer de l’usuari. Es pot preguntar de forma fàcil.

A l’hora d’introduir dades noves, és tan fàcil com agafar les dades ja creades, sense tocar-les, introduir-les, Atomian les entén i ja les pot fer servir?

A Atomian ho fem tot. Funciona amb un servidor normal i corrent. Anem a cada base de dades de l’hospital -el servidor està in situ– i es fa una ETL. Extracció de les dades, transformació en àtoms i càrrega al servidor. No afecta al sistema intern dels hospitals. Tot funciona normalment i és un procés que fem nosaltres. La primera vegada que es fa, el fem nosaltres des del laboratori, Atomian, i després cada vegada que l’organització ho decideixi es refresquen les dades.

Llavors, cada vegada que preguntem, ataquem al servidor d’Atomian. No necessitem tampoc grans infraestructures. El procés d’introducció de dades és més gran al principi, per això. No són grans períodes de temps, potser un mes o dos, la implantació en tota una organització.

Llavors, si Atomian per desgràcia deixés de funcionar, per algun accident, no afectaria a les dades?

No, nosaltres anem en paral·lel. L’únic que passaria és que no es podria preguntar. Després, hem creat un producte: l’Atomian Clinical Research. També l’usuari pot introduir cognicions. Hi ha un mòdul per introduir la cognició al cervell: se li diu la paraula a Atomian, la converteix en àtoms i l’afegeix al cervell.

És a dir, alhora que li preguntes a Atomian, pots fer que vagi aprenent, no?

Sí, fem un creixement de gestió hospitalària, assistencial… Cada vegada que s’integra un domini de coneixement, el que es fa és donar més coneixement al cervell, que és un però es replica. Com més aprèn, millor és. Al final, és com un nen a qui li van explicant coses. Com més dominis integra, més capaç d’entendre el món és. Ara no l’entén, li ho hem d’explicar, definir-li els conceptes. Què és un client, què és una empresa… Un cop està fet, ja no caldrà explicar-li mai més.

Si en un hospital el metge pregunta a Atomian, es pregunta en els servidors de l’hospital o en el centre d’Atomian al centre?

No, al servidor de l’hospital. Funciona com un software normal. Fem un release, una actualització del software. Totes les organitzacions que tenen el manteniment de software el carreguen, s’actualitza automàticament. Tot el que es va aprenent al cervell, es va replicant en els cervells de cada empresa.

Si Atomian tingués al seu abast totes les dades del món, seria el cervell més intel·ligent de la Terra, no?

Sí, però no seria perillós, perquè el programem nosaltres. L’aplicació més bèstia, a anys vista, seria tot el coneixement en un únic model. Et donaria respostes concretes -i no infinits enllaços com amb Google-. Tindria tot el coneixement i te’n donaria sempre la resposta.

Més informació i font de les imatges | Atomian

Sobre l'autor

Raquel Casals

Raquel Casals

Pirata de Melêe Island, grammar nazi i fanàtica dels videojocs. La triforça m'ajuda a tenir cura del català.