Notícies

L’AMIC i el Barcelona Supercomputing Center arriben a un acord per ajudar a millorar la IA en català
Dijous, 2 de octubre 2025
Barcelona Supercomputing Center

Tretze mitjans associats han arribat a un acord de cessió de dades  i han visitat les instal·lacions del BSC

Aquest 17 de setembre, tretze mitjans de l’AMIC (Associació de Mitjans d’Informació i Comunicació) han visitat les instal·lacions del Barcelona Supercomputing Center - Centro Nacional de Supercomputación (BSC-CNS) per oficialitzar un acord de cessió de dades  per part dels mitjans associats cap al centre . Els mitjans que han signat l’acord permeten l’accés a la seva web i els seus continguts, tot ajudant a obtenir dades que permetin  desenvolupar i entrenar una IA eficaç i òptima en llengua catalana.


El BSC, que compta amb una unitat especialitzada en tecnologies del llenguatge amb projectes de referència com Aina i ALIA, treballa amb  bases de dades de diferents entitats i organismes i, sobretot de mitjans de comunicació, que li permeten entrenar models de llenguatge amb un alt percentatge de català. L’objectiu de l’acord entre l’AMIC i el BSC doncs, és ajudar a fomentar la pervivència de la llengua catalana en el terreny digital.


La visita ha comptat amb la presència de Josep Ritort, secretari de l’AMIC, qui ha expressat que “l’AMIC sempre ha estat al costat d’iniciatives i projectes que impulsen l’ús social de la llengua catalana, especialment totes aquelles que promouen les seves variants dialectals”. Seguidament, Marta Villegas, directora del Laboratori de Tecnologies del Llenguatge del BSC, ha destacat “la importància de poder disposar de dades en català amb la col·laboració de mitjans del territori, per tal de poder desenvolupar models de llenguatge massius que representin la nostra llengua i cultura”. Clara Soteras, cap d’Innovació i Estratègia Digital de l’AMIC, ha destacat que “aquest acord permet que mitjans de proximitat repartits arreu del territori català ajudin amb el seu contingut a entrenar els nous models d’IA”. I ha remarcat que “un altre valor afegit és la diversitat lingüística dels mitjans participants així com l’oportunitat de comptar amb contingut textual i audiovisual, que permetrà entrenar el model del BSC tenint en compte els dialectes catalans i els diferents usos del llenguatge”.


Finalment, Javier Aula-Blasco, investigador sènior al Laboratori de Tecnologies del Llenguatge del BSC i cap de l’equip de dades, ha dut a terme una xerrada sobre la importància, a nivell tècnic, de l’acord arribat amb els tretze mitjans de l’AMIC i quins desenvolupaments permetrà aquesta cessió de dades.


A continuació, s’ha fet una visita guiada a les instal·lacions del BSC, on es troben el supercomputador MareNostrum5 i el MareNostrum Ona -el nou ordinador quàntic-.


El BSC com ho farà i com utilitzarà les dades?
En aquest sentit, l’equip de dades del Laboratori de Tecnologies del Llenguatge del BSC vol reunir el màxim volum de textos (a més d’àudios i imatges) en català per entrenar grans models de llenguatge amb dades considerades no personals. És important destacar, en el cas del català, que cada vegada es disposen de més dades sintètiques -generades per models-, però manquen dades generades per humans, cabdals per a mitigar alguns dels problemes causats per les dades sintètiques. El BSC treballa amb la idea d’obtenir un interès lingüístic en les dades i no en la informació i el producte generat; d’aquesta manera, tots els models que entrenen i els recursos generats es llicencien per garantir l’impacte més gran possible en els àmbits científic, social i econòmic. Els acords assolits no tenen cap contraprestació pel mitjà més enllà de contribuir, com a mitjà de comunicació en català, a crear una intel·ligència artificial en llengua catalana que entengui i comprengui la diversitat del país.

 

­

 


                    
Associa't   Planifica una campanya   Innovació   Notícies   Qui som   Junta   Objectius   Serveis   25 anys   Mitjans digitals   Mitjans en paper   Contacta'ns   
Amb el suport de:
Amb la col·laboració de:
Avís legal   Política de privacitat   Política de cookies   Gestiona les teves preferències de cookies