google-translate-sardu

Su sardu foras dae is lìnguas de Google Translate: pro ite no est una noa bella

de Flavia Floris (Sardware)

Google Translate est un’aina de tradutzione automàtica (TA) neuronale intre is prus connotas e impreadas dae totu su mundu. Nàschidu in su 2006 comente sistema istatìsticu, cun su passare de su tempus at afinadu sa tecnologia sua e inclùdidu prus de 100 lìnguas, comente  s’aymara, su guaraní, su lingala, su mizo e su quechua. Est de su 27 de làmpadas s’annùntziu de Google chi comùnicat a is utentes s’inclusione de 110 lìnguas noas in su tradutore, comente efetu de su progetu 1.000 Languages Initiative, chi punnat a su fràigu de modellos de IA capatzos de agiudare a is 1000 lìnguas prus faeddadas in su mundu.

Cales lìnguas?

A su nàrrere de Google, is lìnguas agiuntas a su tradutore, chistionadas dae prus de 610 milliones de persones, aberint sa possibilidade de gosare de sa TA a s’8% de sa populatzione mundiale. Calicuna de custas dda chistionant giai 100 milliones de persones (est su casu de su cantonesu, de su punjabi e de su qʼeqchiʼ), àteras, comente su brètone, su marwari, s’otzitanu, su romaní e su tibetanu, sunt de comunidades prus piticas. Àteras ancora sunt lòmpidas acanta de s’estintzione definitiva, però sunt istètias recuperadas in parte dae initziativas de revitalizatzione: est su casu de su mannesu, chi in su 1974 fiat abarradu chene faeddadorəs.

E su sardu?

Sa lìngua sarda no est intre is lìnguas seberadas dae Google. Non si tratat isceti de una pèrdida chi podet tènnere efetos in su benidore, ma su datu podet èssere fintzas sìntomu de una gestione e pianificatzione linguìsticas no efitzientes. Mancari su comunicadu de s’azienda pòngiat in craru, prus o mancu, cales sunt is critèrios issoro in contu de donare prioridade a una variedade linguìstica in antis de un’àtera (nùmeru de impitadorəs, presèntzia in sa rete, tecnologia PaLM 2 pro s’imparòngiu de lìnguas afines), non faghet evidente pro ite si siant seberadas lìnguas determinadas e àteras nono. Duncas, non podimus lòmpere a is resones esatas de s’esclusione de su sardu. Epuru nois de Sardware, comente ativistas e istudiosəs, dae sa positzione e is esperièntzias nostras —de seguru limitadas— amus pensadu de cumpartzire calicunu cunsideru

Su pensu segundu chi su sardu no est presente in s’agiornamentu de su tradutore pro no èssere istandardizadu no est esaustivu. Tenende presente cantu acraradu dae Google in contu de su sèberu de una variedade linguìstica o ortogràfica a noghimentu de un’àtera, àteras lìnguas chene istandard sunt istètias inclùdidas in su tradutore. Aici etotu, mancari non siat s’ùnica resone pro chi su sardu est abarradu a foras, sa falta de un’istandard pro una lìngua tenet efetos de importu ca, intre àteras cunsighèntzias, ìmplicat una produtzione testuale prus bàscia rispetu a sa chi si diat tènnere cun un’istandard ortogràficu.

Su nùmeru limitadu de testos a disponimentu in sardu si depet fintzas a sa costuma, fitiana a beru, de ddos publicare cun lissèntzias propietàrias e non lìberas. Custa tendèntzia diat agiudare a ispiegare is càusas de s’assèntzia de su sardu in progetos che a OPUS Corpora, sa regorta de testos parallelos de còdighe abertu prus manna de sa rete, chi contat prus de 740 lìnguas. Si tratat de un’àtera pèrdida manna pro sa difusione e s’impreu de su sardu: pro mentovare un’esèmpiu, in is ùrtimas dècadas, sa literadura sientìfica in àmbitu tradutològicu at dimustradu de manera ampra is vantàgios de s’impreu de memòrias de tradutzione in is protzessos tradutivos.

Cun custas premissas, nd’aprofitamus fintzas pro torrare a regordare s’importàntzia de s’acàpiu intre finantziamentos pùblicos e disponimentu de risorsas a lissèntzia aberta, su chi resurtat èssere unu paradigma de fundamentu pro sa gestione e sa pianificatzione de polìticas linguìsticas pro s’amparu de lìnguas minorizadas. Mancari de aici, in is ùrtimos annos amus bidu chi is prataformas istantargiadas dae su guvernu (Sardegna Digital Library e Sardegna Cultura), de interessu pro s’informatzione, pro s’imparòngiu de sa lìngua a generatziones noas e neofaeddadorəs, in prus chi pro una gestione lìbera e aberta de totu is risorsas in sardu, ant patidu una calada manna, siat in contu de cantidade de cuntenutos, siat pro cantu a sa calidade de su modellu de lìngua. Custu fatu, in prus chi inditare unu livellu artu de discoidadu, tenet cunsighèntzias in sa cunfiguratzione e in s’impreu de sa lìngua a intro de su cuntestu digitale, mescamente in contu de prestìgiu, de difusione de allegas non curretas e de incoerèntzia a intro de sa pròpia variedade linguìstica.

Is deretos linguìsticos sunt deretos umanos

Sa Decraratzione universale de is deretos linguìsticos ponet in craru chi is comunidades linguìsticas tenent su deretu de dispònnere de trastos tecnològicos chi agiudent a assegurare sa presèntzia de is lìnguas in totus is grados de s’educatzione, in sa comunicatzione e, in generale, in sa difusione de sa cultura, pro aparigiare is oportunidades de ògnia comunidade. Nois de Sardware, chi chircamus de traballare in custa deretura, pensamus chi sa TA podet èssere un’agiudu —mancari non siat s’ùnicu e definitivu— pro sa defensa de lìnguas subordinadas comente su sardu e, duncas, de is deretos linguìsticos e umanos nostros.

Sa TA est su diàulu?

Cunsideros e risos in pitzus de TA, pregiuditzièvoles o nono, nd’amus fatu totus, siat comente professionistas de sa tradutzione, siat comente utentes de custa tecnologia. Una tendèntzia mala a mòrrere est cussa tecnofòbica, de seguru legìtima, chi a s’ispissu curpat a is motores de TA pro èssere ainas de evitare de manera assoluta. Ma ite nos perdimus?

Istùdios medas ant esploradu is benefìtzios de sa TA pro is lìnguas minorizadas. Pro cumintzare, no est isceti una chistione de prestìgiu, pro chi una lìngua subordinada podet gosare de si pònnere a su pròpiu livellu de una lìngua dominante. Tradutores che a Apertium (cun is crobas linguìsticas catalanu-sardu e italianu-sardu e viceversa), MinT (chi at incorporadu inglesu-sardu e sardu-inglesu) e àteras tecnologias, essende ainas a servìtziu de is lìnguas e is persones chi ddas chistionant, agiudant a minimare sa diferèntzia de oportunidades intre is comunidades linguìsticas.

In unu pianu prus pràticu, sa TA podet èssere impreada cun iscopos de assimilatzione  (pro agiudare sa cumprensione de testos) e de disseminatzione (pro generare testos chi s’ant a publicare). Dae unu puntu de bista descritivu, est evidente chi, a s’ispissu, s’imperat custa tecnologia pro assimilatzione, est a nàrrere, pro cumprèndere messàgios o pro agatare a lestru sa tradutzione de una fràsia o unu faeddu. In prus, est comunu, mescamente intre is persones non professionistas de sa tradutzione, fintzas chi si nde fatzat un’impreu de imparòngiu individuale: “Comente s’at a nàrrere tale faeddu in swahili? Si ddu domandamus a Google!”. Subra sa base de custas funtziones, non faghet a negare chi Google Translate diat incoragiare, mancari de manera isporàdica e no intzisiva, sa curiosidade fache a tzertas allegas sardas.

A parte custos casos, is benefìtzios pro is lìnguas minorizadas sunt prus evidentes cando s’imperat sa TA cun iscopos de disseminatzione, est a nàrrere, cando sa TA agiudat a formulare una tradutzione publicàbile. Pensemus a s’esèmpiu de Wikipedia in sardu. Sa prataforma entziclopèdica prus consultada in su mundu, a su presente cuntenet 7.500 pàginas in sardu, siat inèditas, siat traduidas dae àteras lìnguas.

Su trastu Content Translation, impreadu dae sa comunidade de Wikipedia pro sa tradutzione de artìculos, oferit sa possibilidade de integrare is tradutores de Apertium e MinT in su protzessu tradutivu. De custa manera, is passos prus istentosos de sa creatzione de un’artìculu traduidu benint automatizados dae Content Translation e, in su pròpiu momentu, sa TA est a disponimentu de chie est traduende. Custu mecanismu ìmplicat livellos prus artu de coerèntzia linguìstica a intro de totu sa Wikipedia, in prus chi de produtividade, duncas de crèschida de materiale digitale lìberu in sardu.

Est provadu chi sa gestione tecnològica e collaborativa de progetos de tradutzione aumentat sa produtividade. In dies de oe, cando una persone professionista s’agatat a tradùere tzertas genias de testos cun iscadèntzias in pagu tempus (una cunditzione frecuente a beru in su traballu de is tradutorəs), est probàbile chi sa faina sua siat cussa de sa post-editzione, est a nàrrere,  s’interventu umanu subra de unu testu otènnidu dae unu sistema de TA. Acumpangiadu dae programmas e ainas de tradutzione assistida, custu mètodu permitit de mantènnere coerèntzia linguìstica e testuale e tradùere prus materiale, risparmiende tempus de manera significativa.

Lassende a una parte s’àmbitu professionale, sa produtividade chi nos interessat de a beru est sa chi nos permitit de programmare atziones urgentes e creare risorsas abertas, lìberas e èticas pro ddas pònnere a disponimentu de sa comunidade linguìstica nostra. Difatis, cada borta chi contribuimus a generare risorsas in lìngua sarda e ddas cumpartzimus, semus alimentende sa difusione, s’impreu e, duncas, s’amparu de sa lìngua.

Est de importu fintzas a èssere cussentes chi est gràtzias a custos printzìpios de abertura e cumpartzidura si podimus isvilupare tecnologias de calidade e èticas, pro cuntrastare is egemonias linguìsticas e culturales chi nos oprimint.

Sardware est unu grupu de persones voluntàrias chi traballant pro sa presèntzia de su sardu in sa tecnologia. Si ti boles acostare a su mundu de is tecnologias in sardu, iscrie a sardware@sardware.org. Tenimus sa seguresa chi una comunidade cussente e cumpromìtida cun is deretos linguìsticos de sa populatzione de Sardigna est sa garantzia de una tecnologia soberana.


Imàgini: a

Cumpartzi • Condividi

Lascia un commento / Cummenta

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Captcha in caricamento...