Quantes paraules coneix ChatGPT? Quantes paraules coneix ChatGPT?
Camp de Túria - Notícies -
Sant Antoni, L'Eliana, Bétera, Riba-roja, Pobla de Vallbona, Serra, Benissanó, Olocau, Llíria, Gàtova, Nàquera, Vilamarxant......

Seccions del Crònica

Pots buscar açí en el diari

Quantes paraules coneix ChatGPT?

Capaces de crear continguts originals a partir de dades existents, les aplicacions d'intel·ligència artificial (IA) generativa, han registrat un desenvolupament exponencial en els últims mesos. Són milions les persones que les utilitzen diàriament per a les tasques més diverses. No obstant això, tenim un coneixement molt limitat d'aquestes eines. Fins ara, per exemple, ignoràvem alguna cosa tan bàsica com quantes paraules de la llengua espanyola pot identificar ChatGPT.

Investigadors de la Universitat Politècnica de Madrid (UPM), juntament amb col·legues de la Universitat Carlos III de Madrid i la Universitat de Valladolid, es van proposar respondre a la pregunta. Per fer-ho, han desenvolupat l' aplicació ChatWords, que permet avaluar el coneixement lèxic que el sistema d'intel·ligència artificial té de diferents idiomes.

El seu estudi inicial de les més de 90.000 paraules contingudes en el diccionari de la Reial Acadèmia de la Llengua mostra que el model ChatGPT3.5turbo desconeix aproximadament el 20 %. I no només això. Del 80 % restant, ofereix significats erronis en alguns casos, entorn al 5 %.

La última versió de ChatGPT desconeix aproximadament el 20 % del lèxic espanyol i del 80 % restant, ofereix significats erronis entorn al 5 %

Per entendre millor els resultats, convé tenir en compte que un hispanoparlant reconeix 30.000 paraules de mitjana, és a dir, gairebé un terç del lèxic espanyol. Pot semblar una dada pobra front a la màquina.

"Però com passa moltes vegades amb els sistemes d'IA, no és or tot el que lluu, i analitzant els significats que dóna ChatGPT de les paraules, veiem que hi ha un percentatge no menyspreable en què el sentit que assenyala és incorrecte", afirma Javier Conde, professor ajudant a l'Escola Tècnica Superior d'Enginyers de Telecomunicació (ETSIT) de la UPM i un dels participants en el treball. "Potser ChatGPT no siga hui en dia tan savi com aparenta", afig.

Garantir la riquesa lèxica en la IA

És raonable pensar que els models de llenguatge de gran grandària (LLM, per les seues sigles en anglès), basats en intel·ligència artificial i dissenyats per a processar i comprendre llenguatge natural en una escala enorme, no utilitzaran paraules que desconeixen. Per aquest motiu, sorgeix una altra preocupació.

L'aplicació espanyola ChatWords és de codi obert i està dissenyada per a ser fàcil d'usar i ampliar

Per a Pedro Reviriego, coautor del treball i professor titular d'ETSIT, resulta "molt factible un escenari en què el contingut recentment generat tinga un nombre cada vegada menor de paraules diferents. Per tant, és fonamental garantir la riquesa lèxica en el text creat per intel·ligència artificial", sosté.

L'aplicació ChatWords és de codi obert i està dissenyada per a ser fàcil d'usar i ampliar. El següent pas dels investigadors és avaluar altres idiomes i LLM per a comprendre millor el coneixement lèxic que tenen les eines d'intel·ligència artificial i com evoluciona a mesura que apareixen noves versions i eines.

La seua tasca s'emmarca en el projecte Xarxes del Futur per a Centres de Processats de Dades i Operadors, finançat per l'Agència Estatal d'Investigació, i compta amb el suport de OpenAI, laboratori estatunidenc responsable de ChatGPT, a través del seu programa d'accés a investigadors.

Drets: Creative Commons.

Gonzalo Martínez 

.
des de
Creative Commons
Crònica CT
Publicat per Àgora CT. Col·lectiu Cultural sense ànim de lucre per a promoure idees progressistes Pots deixar un comentari: Manifestant la teua opinió, sense censura, però cuida la forma en què tractes a les persones. Procura evitar el nom anònim perque no facilita el debat, ni la comunicació. Escriure el comentari vol dir aceptar les normes. Gràcies

Cap comentari :

Mastodon NotaLegal