Aste honetatik aurrera, AA Adimen Artifizial bidezko aukera berria eskaintzen hasi da Tokikom: testu sinplifikatuak. Euskara ikasten ari direnei edo irakurtzeko zailtasunak dituzten pertsonei begira garatu den sistema hau, beraz, dagoeneko Tokikomen barruan dauden hedabideetako webguneetan martxan dauden beste aukerei gehitu zaie.
Hortaz, hemendik aurrera, testuak ozen irakurtzeko eta testuaren titularra eta sarrera hainbat hizkuntzara itzultzeko gaitasuna izateaz gain, irakurleek aukera izango dute euskara sinplifikatuan eduki horiek irakurtzeko, botoi bat sakatze soilarekin.

Irakurleak sinplifikatzeko botoia sakatuz gero, sistemak "kalitate maila altua duten testuak eskaintzen ditu, baina alboan beti joango da abisu bat, esanez akatsak izan ditzakeen sinplifikazio automatikoa dela", laburbildu du Etxegoienek. Albisteak sinplifikatzeko, maila publikoan bederen, orain arte euskaraz egin den lehen garapena da Tokikomek abiatu duena.
Ebaluazio ugari
Logikoa denez, sistema martxan jarri aurretik, Tokikomeko kazetariek testu lagin askoren ebaluazioak egin dituzte, sistema trebatu eta fintzeko. Baina, horren aurretik ere, lan eskerga egon da: urtebeteko garapena dago Jesus Calleja kidearekin batera Etxegoienek prestatu duen sistemaren oinarrian.
Besteak beste, euskara ikasten ari direnentzat edo irakurtzeko zailtasuna dutenei begira egindako tresna da, baina, beti ere, Vicomtech enpresako ikertzaile Thierry Etxegoienek ohartarazi duenez, aintzat hartu behar da sinplifikazio automatizatua dela eskaintzen den testua, gizaki baten gainbegiradarik gabekoa.
Sinplifikatzean, garrantzitsua da ereduak desbideratu ez daitezela
Hau posible izateko teknikek ibilbide luzea izan dute hamarkadetan zehar. "Duela denbora asko, arauen arabera egiten zen sinplifikazioa: adibidez, hitz konplexu bat ordezkatzeko hitz sinpleagoa bilatzen zen. Baina, giza lengoaia horren konplexua izanik, hori egitea oso zaila zen", gogora ekarri du adituak.
Duela hainbat hamarkada, berriz, datuetan oinarritutako metodoa abiatu zen, dagoeneko existitzen ziren edukiak erabiliz. "Horretan, estrategia izan zen bai testu konplexua zein testu sinplea ematea, eta sistemak ikas zezan prozesu hori egiten". Aukera hau erabili ahal izan da itzulpenak egiteko, horietan testu asko zeudelako. Baina hori ez da, inondik inora, sinplifikazioaren egoera, horrelako adibideak aurkitzea "askoz zailagoa baita". Adituak dioenez, milioika esaldi erabili behar dira, beren pareko esaldi sinplifikatuekin. Arazoa are handiagoa da euskara moduko hizkuntza gutxituetan. "Ingelesean, adibidez, sinplifikatutako Wikipedia badago dago", argudiatu du Etxegoienek.
AAren iraultza
Baina, arlo honetara ere, iraultza iritsi da. "Orain, AA sortzailearen bidez, eredu erraldoiak sortu dira, eta horiek ahalmen handia dute lagin gutxirekin ataza asko egiteko; tartean, sinplifikazioa". Etxegoienek dioenez, arrazoitzeko oso modu indartsua dute eredu horiek, eta horrek aukera ematen du atazak egiteko. "Kasurako, ereduari esan dakioke: 'hona hemen testu konplexu bat, eta nolako sinplifikazioa egin behar den adierazteko hainbat adibide emango dizkizut'. Eta, neurri bateraino bederen, hori egiteko gai dira. Horregatik, gure proiektuan hizkuntza ereduez baliatu gara; besteak beste, euskararako eredu espezializatuak, EHUren Latxa ereduren modukoak".
Orain arte euskaraz gauzatu den lehen garapena da Tokikomek egindakoa
Ohi bezala, dena ez da bide samurra izan, eta arazoei aurre egin behar izan diete. Handienetakoa, adimen artifizialek haluzinatzeko duten joera arrastoan sartzea. "Sistema hauek oso ondo idazten dute, baina, batzuetan, ahazten zaie ataza, edo guztiz desbideratzen dira, eta eskatu ez zaien zerbait idazten dute", gogora ekarri du adituak. Sinplifikazioaren alorrean bereziki garrantzitsua da ereduan desbideratu ez daitezela, helburu nagusia delako jatorrizko testuaren informazio guztia mantentzea, modu errazago batean adierazita. Hori da, hain zuzen, sinplifikazioa irakurketa erraza izenekotik desberdintzen duena. Azken kasu hauetan, bereziki desgaitasun intelektuala duten lagunei bideratuta dagoen egokitzapena da, eta, kasu horietan, zilegitzat jotzen da informazioa kendu edota gehitzea ere, irakurleari azalpen osagarriak emanez.
Kazetaritzaren alorrean, ordea, gauzak ezin dira hala izan, eta, horregatik, arreta berezia jarri dute bidean ezer galdu ez dadin. "Bereziki ardura handia izan behar dugu adierazpenekin, komatxo artean azaltzen diren esaldi horiekin", ohartarazi du Etxegoienek. Kasu horretan, hitzak bere horretan mantendu daitezke, edo zeharka adierazi, baina esaldi sinplifikatu hori inori egotzi gabe, zehaztasuna mantendu aldera.