EHUN URTEKO CORPUSA


2021eko uztailaren 16an
Zarata mediatikoz beteriko garai nahasiotan, merkatu logiketatik urrun eta irakurleengandik gertu dagoen kazetaritza beharrezkoa dela uste baduzu, ARGIA bultzatzera animatu nahi zaitugu. Geroz eta gehiago gara, jarrai dezagun txikitik eragiten.
Euskararen bilakaerak izan duen menderik garrantzitsuena Interneten gorpuztu dute UZEIk eta Euskaltzaindiak. XX. mendean euskaraz argitaratu diren lan guztien artean aukeraketa egin eta, guztira, 6.315 obra zati jaso dituzte. Orain, www.euskaraCorpusa.net gunean guztien eskura jarri dute. Testu horien oinarriak (4.658.036 hitz) osatzen du XX. mendeko euskararen corpusa, eta berau ehun urtean erabili den euskararen erakusgarri eta lekuko da. Ez ordea, ereduzko euskararen adibide. Izan ere, obra-zatiak zozketa bidez, programa estatistikoekin, hautatu dira bestelako irizpiderik gabe eta, beraz, denetariko testuak ikus daitezke; ahozko jardunen transkripzioak, saio liburuak, saio artikuluak, egunkariak, aldizkariak, literatur prosa, bertsoak, administrazio idazkiak eta abar. Gainera, euskalkien arabera ere kontsulta daitezke hitzak, eta nahi izanez gero, garai bakoitzean nola erabili diren ere ikus daiteke lau zatitan banatu baitute mendea: 1900-1939, 1940-1968, 1969-1990 eta 1991-1999. Hortaz, hitz bat euskalki, epe edo testu mota batean edo gehiagotan nola erabili den ikusteko aukera eskaintzen du corpusak.

Esate baterako, "Hala eta guztiz ere" bilatzeko eskatuta 1907ko eta 1983ko ondoko testu zatiak emango dizkigu corpusak beste hainbaten artean. Bakoitzak, gainera, fitxa bat du autorearen, izenburuaren, bildumaren eta argitalpen urtearen berri emateko:
- «Erdaldundua. Badakije orrek. Estakijenari erakutsi bierr jako.
- Euskeria. Errderia be, badakije izkuntza ori egiten dan errijetan, alan da guzti be, asi erriko ikastegian ta gora beti errderia ta erderazko idaztijak erakusten deutses".
"A.- Halaz eta guztiz ere mugatua da zure iritzirako.
P.I.- Mugatua da alde batetik, botere aldetik, eta bestetik ikastolaren kontrola oso zehatza delako".
Corpusa lematizatua da, hots, testu hitz bakoitzari forma estandar bat erantsi zaio, hiztegi sarrera moduko bat, eta horri esker, bilatu nahi dugun hitzaren aldaera guztiak aurkituko ditu bilatzaileak: hala eta guztiz ere jarriz gero, alan da guztiz be eta halaz eta guztiz ere bilatuko ditu. Eta hitz bakunak ez ezik, hitz elkartuak, eratorriak eta bestelako hitz anitzeko unitate lexikalak ere markatu direnez, etxe eskatuta etxeko jaun, etxekoandre, etxepe eta beste hainbat bilatuko du.
Horrez gain, hitz bakoitzaren agerraldi kopurua ere ikus dezakegu; izan ere, grafikoen bidez, epe, euskalki eta testu mota bakoitzean hitza zein proportziotan erabili den jakiteko aukera baitago. Beraz, izugarri zabaldu diren hainbat egiturek zein oinarri duten jakiteko aukera ere ematen du corpusak.

Hamabost urte lanean.

1987an Euskaltzaindiak eskatuta, UZEIko hiru kide hasi ziren euskararen XX. mendeko corpusa osatzen, eta pixkanaka 7-8 laguneko taldea bildu da. Patxi Goenaga euskaltzainak adierazi digunez, Akademiak laurogeiko hamarkadaren azken aldera hartu zuen proiektua bultzatzeko erabakia: "Euskaltzaindiak hiztegigintzari ekin behar bazion, lan horretarako ezinbesteko langaia zen corpusa. Orotariko Euskal Hiztegia egiteko ere corpus bat osatu beharra zegoen, euskal literaturako testuez osatua. Era berean, hiztegi batuari bultzada emateko mendeetan zehar ez ezik, azken mendean nolako euskara erabili den jakin beharra dago". Beraz, batez ere, Euskaltzaindiaren lanean pentsatuz egin da corpusa, baina hizkuntzalarientzat, hiztegigintzan, itzulpengintzan eta gramatikagintzan dabilenarentzat, nahiz ikerlarientzat aproposa da.
Bilduma osatzen hasteko, XX. mendeko euskarazko argitalpenen inbentario osoa egin zuen UZEIk. Gero, programa estatistiko batekin hautatu ziren aztertu beharreko obrak. Testuak multzoka bildu, eta multzo bakoitzetik batzuk aukeratzen ditu programak. Beraz, hautaketa amaitu arte UZEIko kideek ez zuten jakin zein izango ziren hartu beharreko autoreak eta lanak. Horrek bere arriskua bazuela esan digu UZEIko kide Miriam Urkiak: "Ezin genuen erabaki zein testu aztertu, eta arriskua zegoen Mitxelenaren obra bat ez tokatzeko. Zorionez tokatu zaigu, baina tartean literatur lehiaketetako autore ezezagunen lanak ere badaude. Beldur pixka bat ematen du baina helburua bilaketa estatistikoa egitea zen".

PASADIZO UGARI.

Hainbeste urtetan obra mordoa irakurri eta aztertu dituzte UZEIko kideek eta testuak adina kontu oroitzen dituzte. "Behin, Krutwigen obra bat tokatu zitzaigun eta hura lematizatzeko grekoko hiztegia erabili behar izan nuen, ez nuen ezer ere ulertzen, grekozko formei euskarazko bukaera ematen baitzien egileak. Tristea izan zen grekoko hiztegi batekin euskarazko testu bat ulertu behar izatea", kontatu digu Urkiak.
Garbizaletasunaren eta Euskaltzaindiak martxan jarritako araugintzaren eragina ere nabarmenak direla diote corpusaren egileek: "Harrigarria da jendeak nola zaintzen duen idazketa. Badirudi araua noiz aterako zain daudela. Oso-oso zintzoak gara". Modan egon diren formekin gauza bera gertatzen dela dio Urkiak: «Gramatikan asko ikusten da Iparraldeko formen erabilera, jendeari forma exotikoak izugarri gustatzen zaizkio eta erabili egiten ditu nahiz eta non sartu jakin ez".
Hamabost urte corpusa osatzen eman ondoren, jendearen eskura jartzeak izugarrizko poza eman diela esan digute Miriam Urkiak eta Patxi Goenagak. Orain, ordea, UZEIko kideek beste asmo batzuk dituzte buruan; Euskararen Erreferentzia Corpusa egiteko proposatu diote Euskaltzaindiari. Urkiaren ustez, hizkuntza bat aurrera baldin badoa eta, gainera, hiztegi arau emailea atera nahi bada, XX. Mendeko Euskararen Corpusa, nolabait, mugatua geratzen da. Hala ere, oraindik ikusgai dago corpus zabal hori orain egiterik izango dutenentz


Azkenak
Zergatik Durangora joan abenduaren 7an?

Euskalgintzaren Kontseilua hizkuntza larrialdia bizi dugula ohartarazten ari da azken astetan. Urte dezente pasa dira euskararen biziberritze-prozesuaren egoera bidegurutzean, errotondan, inpasse egoeran eta antzeko hitzekin deskribatzen hasi zenetik, hizkuntza politikek... [+]


Iruñerriko hondakinak bilduko dituen Imarkoaineko gunea %33 garestitu da

Iruñerriko Mankomunitateak Imarkoaineko Hondakin Zentroaren proiektuaren aldaketa onartu zuen ostegun honetan eta, horren arabera, azpiegitura 2026ko urtarrilaren 21ean hasiko da lanean.


Tuterako alkateak aurrekontuak aurkeztu ditu talde neonazi baten abestiarekin

Estirpe Imperial da talde neonazia, besteak beste ezagun egin dena erabiltzen dituen letra faxista eta arrazistengatik.


2024-11-29 | Axier Lopez
EAJ, PSE eta PPk mendietako gurutze katolikoak babestu nahi dituzte “euskal kultura eta ohituren parte” direlako

Gipuzkoako Batzar Nagusietako Kultura Batzordeak, EAJ, PSE eta PPren aldeko botoekin, azaroaren 22ko bilkuran erabaki du Eusko Jaurlaritzari eskatzea azter ditzala “euskal kulturan hain esanguratsuak diren” gurutzeak eta haien inguruko “ohiturak”... [+]


Boikota Israelgo datilei (eta datil horiek saltzen dituzten supermerkatuei)

Israelek gosea erabiltzen du palestinarren aurkako gerra-arma gisa, eta nekazaritza-produktuak mundu osoan merkaturatzen ditu.<


2024-11-29 | Gedar
Etxebizitzarako eskubide unibertsala aldarrikatu dute Iruñean

Etxebizitza Sindikatu Sozialistak eta Harituk antolatuta, manifestazio bat izan zen ostegun arratsaldean Iruñeko Alde Zaharrean. "Etxebizitzaren negozioaren aurrean, eta hura sustatzen duten politikarien aurrean, etxebizitza eskubide unibertsalaren benetako defentsa... [+]


2024-11-29 | Estitxu Eizagirre
EH Bizirik sarearen manifestazioa martxoaren 22an Gasteizen
“Indarrak batuta soilik lortuko dugu makroproiektuen oldarraldi hau gelditzea”

EH Bizirik sarea makroproiektuen aurkako plataformen elkargunea da eta martxoaren 22an manifestazio nazionala deitu du Gasteizen: "Lekuko borrokez gain, esparru zabalagoan lan egitea ezinbestekoa dela jakitun, manifestazio honek sare osoari eragiten dien puntuak izango ditu... [+]


Gaindegiaren 20 urteko argazkia
Euskal Herriak biztanlerian, energian eta pobrezian gora egin du, CO2 isurketetan eta elikagaien kontsumoan behera

Hogei urte bete ditu Gaindegiak, Euskal Herriaren garapen sozial eta ekonomiko iraunkorrerako Behategiak. Horren harira, denbora horretan Euskal Herriak esparru horietan izan duen garapenaren berri ematen duen azterketa aurkeztu dute, eta datuok Europar Batasunekoekin konparatu... [+]


2024-11-29 | Euskal Irratiak
Eguberriko merkatu solidario, etiko eta euskaltzale bat Baionan

Lau egunez idekia izanen den merkatu bat antolatzen du Plazara kooperatibak euskararen aldeko beste hamar bat eragilerekin –horien artean ARGIA–.


Komunikazio libreago baterantz

Azaroaren 21ean Errenteriako Torrekuan eta Badalaben egon nintzen "Komunikazio libreago baterantz trantsizioan" izeneko jardunaldian.


Eguneraketa berriak daude