Euskararen bilakaerak izan duen menderik garrantzitsuena Interneten gorpuztu dute UZEIk eta Euskaltzaindiak. XX. mendean euskaraz argitaratu diren lan guztien artean aukeraketa egin eta, guztira, 6.315 obra zati jaso dituzte. Orain, www.euskaraCorpusa.net gunean guztien eskura jarri dute. Testu horien oinarriak (4.658.036 hitz) osatzen du XX. mendeko euskararen corpusa, eta berau ehun urtean erabili den euskararen erakusgarri eta lekuko da. Ez ordea, ereduzko euskararen adibide. Izan ere, obra-zatiak zozketa bidez, programa estatistikoekin, hautatu dira bestelako irizpiderik gabe eta, beraz, denetariko testuak ikus daitezke; ahozko jardunen transkripzioak, saio liburuak, saio artikuluak, egunkariak, aldizkariak, literatur prosa, bertsoak, administrazio idazkiak eta abar. Gainera, euskalkien arabera ere kontsulta daitezke hitzak, eta nahi izanez gero, garai bakoitzean nola erabili diren ere ikus daiteke lau zatitan banatu baitute mendea: 1900-1939, 1940-1968, 1969-1990 eta 1991-1999. Hortaz, hitz bat euskalki, epe edo testu mota batean edo gehiagotan nola erabili den ikusteko aukera eskaintzen du corpusak.
Esate baterako, "Hala eta guztiz ere" bilatzeko eskatuta 1907ko eta 1983ko ondoko testu zatiak emango dizkigu corpusak beste hainbaten artean. Bakoitzak, gainera, fitxa bat du autorearen, izenburuaren, bildumaren eta argitalpen urtearen berri emateko:
- «Erdaldundua. Badakije orrek. Estakijenari erakutsi bierr jako.
- Euskeria. Errderia be, badakije izkuntza ori egiten dan errijetan, alan da guzti be, asi erriko ikastegian ta gora beti errderia ta erderazko idaztijak erakusten deutses".
"A.- Halaz eta guztiz ere mugatua da zure iritzirako.
P.I.- Mugatua da alde batetik, botere aldetik, eta bestetik ikastolaren kontrola oso zehatza delako".
Corpusa lematizatua da, hots, testu hitz bakoitzari forma estandar bat erantsi zaio, hiztegi sarrera moduko bat, eta horri esker, bilatu nahi dugun hitzaren aldaera guztiak aurkituko ditu bilatzaileak: hala eta guztiz ere jarriz gero, alan da guztiz be eta halaz eta guztiz ere bilatuko ditu. Eta hitz bakunak ez ezik, hitz elkartuak, eratorriak eta bestelako hitz anitzeko unitate lexikalak ere markatu direnez, etxe eskatuta etxeko jaun, etxekoandre, etxepe eta beste hainbat bilatuko du.
Horrez gain, hitz bakoitzaren agerraldi kopurua ere ikus dezakegu; izan ere, grafikoen bidez, epe, euskalki eta testu mota bakoitzean hitza zein proportziotan erabili den jakiteko aukera baitago. Beraz, izugarri zabaldu diren hainbat egiturek zein oinarri duten jakiteko aukera ere ematen du corpusak.
Hamabost urte lanean.
1987an Euskaltzaindiak eskatuta, UZEIko hiru kide hasi ziren euskararen XX. mendeko corpusa osatzen, eta pixkanaka 7-8 laguneko taldea bildu da. Patxi Goenaga euskaltzainak adierazi digunez, Akademiak laurogeiko hamarkadaren azken aldera hartu zuen proiektua bultzatzeko erabakia: "Euskaltzaindiak hiztegigintzari ekin behar bazion, lan horretarako ezinbesteko langaia zen corpusa. Orotariko Euskal Hiztegia egiteko ere corpus bat osatu beharra zegoen, euskal literaturako testuez osatua. Era berean, hiztegi batuari bultzada emateko mendeetan zehar ez ezik, azken mendean nolako euskara erabili den jakin beharra dago". Beraz, batez ere, Euskaltzaindiaren lanean pentsatuz egin da corpusa, baina hizkuntzalarientzat, hiztegigintzan, itzulpengintzan eta gramatikagintzan dabilenarentzat, nahiz ikerlarientzat aproposa da.
Bilduma osatzen hasteko, XX. mendeko euskarazko argitalpenen inbentario osoa egin zuen UZEIk. Gero, programa estatistiko batekin hautatu ziren aztertu beharreko obrak. Testuak multzoka bildu, eta multzo bakoitzetik batzuk aukeratzen ditu programak. Beraz, hautaketa amaitu arte UZEIko kideek ez zuten jakin zein izango ziren hartu beharreko autoreak eta lanak. Horrek bere arriskua bazuela esan digu UZEIko kide Miriam Urkiak: "Ezin genuen erabaki zein testu aztertu, eta arriskua zegoen Mitxelenaren obra bat ez tokatzeko. Zorionez tokatu zaigu, baina tartean literatur lehiaketetako autore ezezagunen lanak ere badaude. Beldur pixka bat ematen du baina helburua bilaketa estatistikoa egitea zen".
PASADIZO UGARI.
Hainbeste urtetan obra mordoa irakurri eta aztertu dituzte UZEIko kideek eta testuak adina kontu oroitzen dituzte. "Behin, Krutwigen obra bat tokatu zitzaigun eta hura lematizatzeko grekoko hiztegia erabili behar izan nuen, ez nuen ezer ere ulertzen, grekozko formei euskarazko bukaera ematen baitzien egileak. Tristea izan zen grekoko hiztegi batekin euskarazko testu bat ulertu behar izatea", kontatu digu Urkiak.
Garbizaletasunaren eta Euskaltzaindiak martxan jarritako araugintzaren eragina ere nabarmenak direla diote corpusaren egileek: "Harrigarria da jendeak nola zaintzen duen idazketa. Badirudi araua noiz aterako zain daudela. Oso-oso zintzoak gara". Modan egon diren formekin gauza bera gertatzen dela dio Urkiak: «Gramatikan asko ikusten da Iparraldeko formen erabilera, jendeari forma exotikoak izugarri gustatzen zaizkio eta erabili egiten ditu nahiz eta non sartu jakin ez".
Hamabost urte corpusa osatzen eman ondoren, jendearen eskura jartzeak izugarrizko poza eman diela esan digute Miriam Urkiak eta Patxi Goenagak. Orain, ordea, UZEIko kideek beste asmo batzuk dituzte buruan; Euskararen Erreferentzia Corpusa egiteko proposatu diote Euskaltzaindiari. Urkiaren ustez, hizkuntza bat aurrera baldin badoa eta, gainera, hiztegi arau emailea atera nahi bada, XX. Mendeko Euskararen Corpusa, nolabait, mugatua geratzen da. Hala ere, oraindik ikusgai dago corpus zabal hori orain egiterik izango dutenentz