Testuen itzulpen sistema
Deskribapena
Testuak hainbat hizkuntzen artean itzultzeko zerbitzua: euskaratik gaztelaniara/frantzesera/ingelesera eta alderantziz.
- Erakundea:
- Kultura eta Hizkuntza Politika - Euskara Sustatzeko Zuzendaritza.
- Arduraduna:
- Miren Josune Irabien Marigorta.
- Kontaktua:
- Harremanetarako datuak.
- Erakunde arduraduna arlo teknikoan:
- EJIE - Negozioaren euskarria.
- Domeinua edo gaia:
- Euskara.
- Algoritmo edo sistemaren egoera:
- Produktiboa.
- Ezarpen-data:
- 2020
- Bazkide/enpresa hornitzailea:
- Vicomtech.
Informazio gehiago
Sistema algoritmikoa zer daturekin entrenatzen ari den eta erabiltzen ari denean zer datu prozesatzen diren azaltzen da.
| Datu-multzoaren izenburua | URL (publikoa bada) | Ereduan datuak erabiltzearen helburua |
|---|---|---|
| Itzulpen memoriak | https://www.ivap.euskadi.eus/izo/ | Eredua elikatu |
| Elhuyar Hiztegia | https://hiztegiak.elhuyar.eus/ | Hitz bat edo bi itzuli |
| Euskalterm Banku Terminologikoa | https://ivap.euskadi.eus/euskalterm/ | Eredua elikatu |
| EHU Euskal Institutua | https://www.ehu.eus/eu/web/eins/home | Eredua elikatu |
| EIZIE Elkartea | https://eizie.eus/eu | Eredua elikatu |
| AENOR | https://www.aenor.com/ | Eredua elikatu |
| eLiburutegia | https://www.euskadi.eus/ac37aELiburutegiaPublicaWar/ | Eredua elikatu |
Sistemak sarrerako datuak automatikoki nola prozesatzen dituen azaltzen da, ereduaren emaitzak sortzeko.
- Erabilitako teknologia eta zeinek garatu du:
- MarianNMT
- Algoritmo mota:
- Gainbegiratu gabeko sailkapen-algoritmoa.
- Algoritmoaren deskribapena:
- C++ ezarpen hutsa
- Motor bat GPU/CPU entrenatzeko eta deskodetzeko.
Prestakuntza azkarra GPUn eta itzulpen bateratua GPU/CPUn
Kanpoko softwarearen gutxieneko dependentziak: CUDA edo- Iturburu kodea eta auditoretza independentea:
- Marian Itzulpen Makina Neuronalaren esparru eraginkor eta libre bat da, C++ hutsean idatzia, gutxieneko dependentziekin. Batez ere Microsoft Translator taldea ari da garatzen. Akademiko askok(batez ere Edinburgoko Unibertsitateak eta iraganean Poznaouseko Adam Mickiewicz Unibertsitateak) eta merkataritza-kolaboratzaile askok laguntzen dute haren garapenean. Gaur egun, Microsoft Translator Neural Machine Translation zerbitzuen atzean dagoen motorra da, eta enpresa, erakunde eta ikerketa-proiektu askok hedatzen dute (ikus jarraian zerrenda osatugabea)
Hala badagokio, berdintasuna eta diskriminaziorik eza sustatzeko neurriren bat ezarri behar izan den azaltzen da, adina, jatorria, nazionalitatea, hizkuntza, erlijioa, sinesmena, iritzia, jarduera politikoa eta abar direla-eta.
Bat ere ez. Iturburu-kodea enpresan hornitzailearen jabetza da, Gobernuak ez du erosi eta ez du erabilgarri. Ez dago guri traspasatzeko aukerarik.
Azaldu egiten da arduradunak nola dauden jakinaren gainean edo nola kontrolatzen duten sistema, eta ziurtatu behar da ez duela ondorio kaltegarririk edo desiorik sortzen.
Itzulpenak hainbat testutatik oinarritzen dira eta testu gehienetan berdintasun eta diskriminazio irizpideak kontuan izan dira, baina ez guztietan (batez ere, zaharrak badira). Orokorrean, testuen itzulpenenek irizpideak ondo jarratizen dituzte baina jarraitu ez direla detektatzen direnean, eredua entrenatzeko eskaera bat helarazten zaio enpresa hornitzaileari itzulpenek irizpide horiek kontuan har ditzaten.
Enpresaren erantzunarekin, probak egiten dira EJIEn irizpideak jarraitzen dutela ziurtatu arte.
Desgaituen beharrak kontuan izan dira, transkripzio eta ahots sintesi zerbitzuak eskuragarri daudelako.
Sistemarekin eta horiek arintzeko erabilitako metodoekin lotutako arrisku ezagunak.
Ez dagokio. Sistemak ez du ikuskapenik behar. Autonomia osoa dauka.
Azken aldaketako data:

