Grobid:Q35775.tei.xml: Difference between revisions
From Inguma Wikibase
(Created page with "~~~~ <syntaxhighlight lang="xml" line> <?xml version="1.0" encoding="UTF-8"?> <TEI xml:space="preserve" xmlns="http://www.tei-c.org/ns/1.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.tei-c.org/ns/1.0 /etc/grobid/grobid-0.6.0/grobid-home/schemas/xsd/Grobid.xsd" xmlns:xlink="http://www.w3.org/1999/xlink"> <teiHeader xml:lang="en"> <fileDesc> <titleStmt> <title level="a" type="main">IkerGazte, 2015 Giza-zientziak Corpus...") |
No edit summary |
||
Line 1: | Line 1: | ||
[[User:DavidL|DavidL]] ([[User talk:DavidL|talk]]) 20:50, 12 March 2024 (UTC) | *[[User:DavidL|DavidL]] ([[User talk:DavidL|talk]]) 20:50, 12 March 2024 (UTC) | ||
*Inguma sarrera [[Item:Q35775|Q35775]] | |||
<syntaxhighlight lang="xml" line> | <syntaxhighlight lang="xml" line> | ||
<?xml version="1.0" encoding="UTF-8"?> | <?xml version="1.0" encoding="UTF-8"?> |
Latest revision as of 22:48, 12 March 2024
<?xml version="1.0" encoding="UTF-8"?>
<TEI xml:space="preserve" xmlns="http://www.tei-c.org/ns/1.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.tei-c.org/ns/1.0 /etc/grobid/grobid-0.6.0/grobid-home/schemas/xsd/Grobid.xsd"
xmlns:xlink="http://www.w3.org/1999/xlink">
<teiHeader xml:lang="en">
<fileDesc>
<titleStmt>
<title level="a" type="main">IkerGazte, 2015 Giza-zientziak Corpusetan oinarritutako hiztegi elebidun berria sortzen</title>
</titleStmt>
<publicationStmt>
<publisher/>
<availability status="unknown"><licence/></availability>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">David</forename><surname>Lindemann</surname></persName>
<email>david.lindemann@ehu.eus</email>
<affiliation key="aff0">
<orgName type="institution">UPV/EHU</orgName>
<address>
<country>Elhuyar Fundazioa</country>
</address>
</affiliation>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">Iñaki</forename><surname>San</surname></persName>
<affiliation key="aff0">
<orgName type="institution">UPV/EHU</orgName>
<address>
<country>Elhuyar Fundazioa</country>
</address>
</affiliation>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">Vicente</forename></persName>
<email>i.sanvicente@elhuyar.com</email>
<affiliation key="aff0">
<orgName type="institution">UPV/EHU</orgName>
<address>
<country>Elhuyar Fundazioa</country>
</address>
</affiliation>
</author>
<title level="a" type="main">IkerGazte, 2015 Giza-zientziak Corpusetan oinarritutako hiztegi elebidun berria sortzen</title>
</analytic>
<monogr>
<imprint>
<date/>
</imprint>
</monogr>
</biblStruct>
</sourceDesc>
</fileDesc>
<encodingDesc>
<appInfo>
<application version="0.6.0" ident="GROBID-SDO" when="2021-12-13T19:32+0000">
<desc>GROBID - A machine learning software for extracting information from scholarly documents</desc>
<ref target="https://github.com/kermitt2/grobid-sdo"/>
</application>
</appInfo>
</encodingDesc>
<profileDesc>
<textClass>
<keywords>
<term>Hitz gakoak: Hizkuntzalaritza</term>
<term>Hiztegigintza</term>
<term>Corpus Hizkuntzalaritza</term>
<term>Euskara</term>
<term>Alemanera Keywords: Linguistics</term>
<term>Lexicography</term>
<term>Corpus Linguistics</term>
<term>Basque</term>
<term>German</term>
</keywords>
</textClass>
<abstract>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Laburpena</head><p>Lan honetan, hiztegigintza egitasmo berria aurkezten dugu, EHUn garatzen ari dena: Euskaraalemanerazko EuDeLex hiztegi elebidun elektronikoa, hizkuntza-ikasleei zuzentzen dieguna. Sarrera, hizkuntza-bikote honentzako hiztegi berria baten beharrari dagokio.</p><p>EuDeLex egitasmoak ez du eguneratu edo egokitu litekeen aurrekaririk. Hala ere, baliabide lagungarriak ditugu hiztegia sortu eta editatzean: alde batetik, datu-base lexikografiko nahiz corpus elebakarrak, eta bestetik, sortu berri diren euskara-alemanerazko corpus paraleloak. Hiztegiaren makroegitura eta mikroegitura osatzeko corpusetan oinarritutako eman ditugun ikerketa-urratsak aurkezten ditugu.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Abstract</head><p>In this paper, we introduce EuDeLex, the new German-Basque bilingual electronic dictionary for language learners, which is currently being worked on at UPV/EHU. The introduction addresses the need for a new electronic dictionary for that language pair.</p><p>This new project does not have any lexicographical antecedents that could be updated or adapted. Nevertheless, one the one hand, existing monolingual lexicographical databases and corpora, and newly created German-Basque parallel corpora, on the other, support the creation and editing process of the new dictionary. We explain our workflow in corpus-based macrostructure and microstructure design and editing.</p></div>
</abstract>
</profileDesc>
</teiHeader>
<text xml:lang="en">
<body>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="1.">Sarrera</head><p>Alemanera euskaratik ikasteko lehenengo testu-liburua 2007an argitaratu zen <ref type="bibr" target="#b16">(Reuter eta Wolff 2007)</ref>. Hurrengo urteetan, alemanera euskaldunei irakasteari buruzko zenbait ikerlan burutu ziren <ref type="bibr" target="#b2">(Braun 2010;</ref><ref type="bibr" target="#b15">Reuter 2010;</ref><ref type="bibr" target="#b23">Wolff 2010)</ref>. Haien arabera, urtean euskara L1 duten 1330 bat ikaslek hasten dituzte alemaneraren ikasketak bigarren hezkuntzako esparruan, eta beste 1.000 batek unibertsitateetan eta Hizkuntza Eskola Ofizialetan. Euskaldunei alemanera irakasten diotenek, ikasleei hiztegi elebakarrak erabiltzea gomendatu arren, ikasleak hiztegi elebidunez baliatzen direla ikusten dute, eta euskara-alemanerazko eskaintzarik ezean, zubihizkuntza batetik jo ohi dutela, kasu gehienetan gaztelera-alemanerazko hiztegietara, azken haiek makroegiturari (lemategia) eta mikroegiturari (hiztegi-sarreraren diseinua eta edukia) dagokienez askoz ere gehiago eskaintzen dietela egun euskara-alemanerazko hiztegi bakarra den poltsiko neurriko paperezko hiztegiak baino <ref type="bibr" target="#b11">(Martínez Rubio 2007)</ref>. Horretaz gain, hiztegien erabilpenaren inguruko ikerketak argi utzi du ikasleek hiztegi elektronikoak erabiltzeko ohitura hartu dutela, paperezko hiztegi hobeak eskuragarri izan gorabehera (Domínguez in press 1 ). Hutsune hau betetzeko asmoz, hizkuntza-ikasleentzako euskara-alemanerazko hiztegi elektronikoa garatzea dugu helburu, EHU-ko web atariaren bitartez EuDeLex izenpean dohain eskuragarri jarriko dena. 2 Jarraian, EuDeLex hiztegia sortzeko bidean eman ditugun zenbait ikerketa-urrats aurkeztuko ditugu, bi ataletan banaturik, makroegituraren eta mikroegituraren edukia osatzeari dagokionez, hurrenez hurren. Laugarren atalak zenbait ondorio eta gerorako erronkak azaltzen ditu. 2) Maiztasun-datuak hiztegi-sarreraren osagai gisa eskura jarri ahal zaizkio erabiltzaileari. Besteak beste, hizkuntza-ikaslearen beharrei begira, aspalditik oso zentzuduntzat jotzen da maiztasunari buruzko argibideak hiztegian ematea; ingelesa ikasten duenak, esaterako, 1990. hamarkadatik aurrera aurkitzen ditu maiztasun-datuak ikasleentzako hiztegietan <ref type="bibr" target="#b6">(Kilgarriff 1997</ref>).</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="2.2">Alemanerazko eta euskarazko lemategiak eraikitzeko metodoak</head><p>EuDeLex hiztegiaren alemanezko lemategia zehazteko lehengaia 40.000 sarrera dituen DeReWo-40.000 maiztasun-zerrenda lematizatua (IDS 2009) izan da, egun alemanerazko corpus handienak diren eta prestigio handiko IDS erakundeak kudeatutako baliabideetan oinarritzen dena. Horren lehenengo % 10a (A hizkiaz hasten diren lemak) eskuz editatu ondoren, zerrendako lemen % 95a bere horretan aurkitu dugu hiztegiaren lemategian, eta eskuz moldatutakoak edo gehitutakoak gainontzeko % 5a baino ez du osatzen (xehetasun gehiagorako, ikus Lindemann 2014a; Lindemann 2014b). Zenbaki horiek adierazten dute zenbateraino den egokia zerrenda hori hiztegi baten sarrera multzoa zehazteko lanean, ia inolako eskulanik ez baitu behar. </p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.">Mikroegitura osatzeko datuak</head></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.1">Lemak entitate sintaktiko gisa</head><p>Lemategien konparaketa hau burutzeko eskuragarri izan ditugun euskarazko baliabide lexikaletako bat, EDBL <ref type="bibr" target="#b1">(Aldezabal et al. 2001</ref>) datu-basea izan da, corpus-datu gordinak lematizatzen eta etiketa morfosintaktikoez osatzen dituen EusTagger tresnak <ref type="bibr" target="#b0">(Aduriz et al. 1996)</ref> ere erabiltzen duen datu-base bera. Datu-base horrek lema-ikur bakoitzari egoki ahal zaizkion kategoria eta azpi-kategoria gramatikalak dakartza, ondorengo adibideak erakusten duen bezala: 1) EDBL-eko etiketa sintaktikoen gainean, hiztegi-sarreraren oinarrizko egitura bat eraiki daiteke. Lema-ikur baten azpian, lema homografoak (ikus adibidea 1 taulan) entitate sintaktiko gisa antolatuko lirateke.</p><p>2) Gainera, fintasun maila horretan zehaztutako entitate sintaktiko bakoitzarentzat maiztasun-datuak ditugu; eskuragarri ditugun beste datu-iturrietan, aldiz, lemaren kategoria hutsaz bestelako etiketarik ez dugunez, haiei dagokienez ezin dugu maiztasun daturik azpi-kategoria gramatikalarentzat kalkulatu.</p><p>3) EDBL-ko datuak hiztegigintzan abiapuntutzat hartu eta beste iturrietatik osatzeko erabakiak eta EDBL-ko lemategi hura eskuz editatzeak ahalbidetuko dute datu-base hori bera eguneratu eta aberastea. Ondorengoak dira eraikitako glosarioen ebaluazio kuantitatibo eta kualitatiboaren emaitzak:</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.2">Aleman-euskarazko ordain-bikoteak definitzeko metodoak</head><p>• Aipatutako metodo guztiak konbinatuz, alemanerazko lemategiaren %80arentzat lortu dugu euskarazko ordain bat edo gehiago.</p><p>• Alemanerazko lemategiaren %60arentzat lortu dugu eskuzko ebaluazioan egokitzat jo dugun ordain bat edo gehiago, gainontzekoak desegokiak izanik. Ordain egokia(k) dituen leman erdiak (%30) ordain egokiez gain ez du ordain desegokirik.</p><p>• Eskuzko ebaluazioaren emaitzen arabera, hiru taldetan sailkatu ditugu metodoak. Ondorengo taulan, sailkatutako datuak ikus daitezke: Lortutako ordain-bikoteak EuDeLex hiztegiko datu-basean sarrera emango diogu, aipatu berri dugun sailkapenaren araberako irizpideak izanik: (1) taldeko datuak, ia datu desegokirik ez egotea espero dugunez, zuzenean sartuko ditugu datu-basean, ondoren eskuz editatzeko; (2) taldeko datuak, berriz, eskuz errebisatuko ditugu datu-basean sartu baino lehen; eta (3) taldeko datuak, datu desegoki franko tartean duten glosarioen taldekoak, ez ditugu datu-basean sartuko.</p><p>Eskuzko lana nabarmen erraztuko duen datu-multzoa lortu dugu. Horretaz gain, honako bi baieztapen hau azpimarratu nahi dugu: Proposatutako metodo sorta printzipioz edozein hizkuntza-bikoterako balio du, eta beste hainbat konbinaziotan errepika daiteke, bai hiztegizirriborro gisa balia daitekeen glosario elebidunak lortzeko, eta bai hizkuntza-bikote ezberdinen arteko erkaketak egiteko.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="4.">Ondorioak eta gerorako erronkak</head><p>Eguneratu edo egokitu ahalko litzatekeen hiztegigintza-lan aurrekaririk gabeko hizkuntzabikote honetako hiztegi elektroniko berri baten oinarri batzuk definitu ahal izan ditugu, bai makroegituraren, eta bai mikroegituraren osaketari begira. Bi kasuetan, hizkuntza corpus elektronikoak ezinbesteko baliabideak direla argi geratu da. Bestalde, ez dago zalantzarik hiztegigintzan eskuzko lana ere berebiziko baliabidea izaten jarraitzen duela, automatikoki sortutako zirriborro-datuak egiaztatu eta osatzeko.</p><p>Hiztegi elebidun bat hutsetik hasteko zenbait abiapuntu baino ez ditugu deskribatu lan honetan. Hasieratik balio digun asmo bikoitzari jarraituko diogu hemendik aurrera ere: Alde batetik, EuDeLex euskara-alemanerazko hiztegi honetako lanak aurreratzea, hizkuntza-ikasleari, batik bat, baliabide egokia eskaintzeko, eta bestetik, euskararekiko hiztegigintza elebidunean oraindik landu gabeak diren beste hainbat hizkuntza-bikotetan aplika zitzaketen oinarrizko irizpide eta metodoak landu eta proposatzea.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="5.">Erreferentziak</head></div><figure xmlns="http://www.tei-c.org/ns/1.0" type="table" xml:id="tab_0"><head>2. Corpusetatik erauzitako datuetan oinarritutako makroegitura 2.1 Lemategiak eraikitzeko irizpideak</head><label></label><figDesc>Hiztegigintzak eta Corpus Hizkuntzalaritzak elkar elikatzen dute hainbat alderdiri begira (ikus, besteak beste, Teubert 2001; Teubert 2002; baita Lindemann 2013 ere). Hala nola, gaurko hiztegigintzak corpusetatik erauzitako datuetara jotzen du lemategia definitzeko orduan.</figDesc><table><row><cell>Hizkuntza Azterketa eta Prozesamendua (HAP) alorrean garatutako teknikei esker, corpus-datu</cell></row><row><cell>gordinetatik hainbat ebidentzia estatistiko erauzteko gai gara, eta horien artean, lemaren</cell></row><row><cell>erabilera-maiztasuna. Maiztasuna bi zentzutan da garrantzitsua hiztegigintzan:</cell></row><row><cell>1) Batetik, ikasleentzako hiztegi-lemategiak maiztasunean oinarritzea ohiko jokabidetzat</cell></row><row><cell>har dezakegu (Quasthoff 2009), eta bestetik, erabilera-maiztasuna eta dagokion hiztegi-</cell></row><row><cell>sarreraren ikustaldi kopurua erlazionatuta daude neurri handi batean (De Schryver et al.</cell></row><row><cell>2010; Wolfer et al. 2014);</cell></row></table><note></note></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" type="table" xml:id="tab_1"><head>1 irudia: Hiztegi-lemategiak corpusetan</head><label></label><figDesc>Euskarazko oinarrizko lemategi bat proposatzeko, eredutzat hartu dugu alemanerazko DeReWo zerrendak sortzeko metodologia (xehetasun gehiagorako, ikus Lindemann eta San Vicente 2015). Alde batetik, ETC corpus (Sarasola, Landa eta Salaburu 2013) eta Elhuyar Web-Corpus-etatik (Elh124 eta Elh200, Leturia 2012; Leturia 2014), hau da, egun euskarazko corpus handienak diren baliabideetatik, erauzi ditugun maiztasun zerrendez baliatu gara. 3 Bestetik, aurretik argitaratutako hainbat euskarazko hiztegi eta datu-base lexikaletako lemategiak eskuratu ahal izan ditugu. 4 Bi multzo haien intersekzioa, hots: corpus batean eta hiztegi batean agertzen diren lemen multzoa, abiapuntutzat hartu dugu lemategiaren eskuzko edizioa burutzeko. 75.481 euskarazko lematako multzoa dugu honezkero, bakoitza corpusetatik erauzitako maiztasun-informazioarekin (ikus corpusetako ebakidurak (∩) hiztegi-lemategi bakoitzarekin eta multzo disjuntuak ( ) 1 irudian). ∖ Corpus hizkuntzalaritzako literatura klasikoan proposatutako atalasearen arabera, corpusetan 20 agerpenetatik gora duten 57.919 lema EuDeLex hiztegian sarrera-buru izateko hautagai egokitzat hartzen ditugu. 5 Metodo automatikoen bitartez definituriko lemategi horren eskuzko edizioak argituko digu baieztapen horrek norainoko balioa duen.</figDesc><table /><note></note></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" type="table" xml:id="tab_2"><head>1 Taula: alegia lema-ikurra EDBL datu-basean eta Elh200 corpusean EDBL lema eta etiketa Kategoria Agerpenak Elh200</head><label></label><figDesc>EDBL eta corpusetako ebakidurako lemei dagokienez, ondorengo kopuruak ditugu: 51.157 lemetatik, 46.124 dira 20 agerpenetatik gora dutenak. Ondorengo arrazoiengatik proposatzen dugu EuDeLex hiztegiaren abiatzeko euskarazko lemategia multzo horren gainean eraikitzeko:</figDesc><table><row><cell>alegia_LOT_LOK</cell><cell>lokailua</cell><cell>41.106</cell></row><row><cell>alegia_IZE_ARR</cell><cell>izen arrunta</cell><cell>4.208</cell></row><row><cell>Alegia_IZE_LIB</cell><cell>leku-izen berezia</cell><cell>921</cell></row></table><note></note></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" type="table" xml:id="tab_3"><head></head><label></label><figDesc>Hiztegigintza lanetan lema baten esanahia zehazteko ebidentzia nahikoa izateko, 20 agerpenetan finkatzen duSinclair-rek (2005) gutxieneko agerpen-kopurua. EuDeLex hiztegiaren editatze lanetarako giza baliabide murriztuak izatearen ondorioz eskuzko lana murriztu behar izanez gero, gutxieneko kopuru handiagoa finkatu beharko da. glosario-zirriborroak garatzeko metodo sorta garatu dugu, jarraian laburbiltzen duguna (ikusLindemann et al. 2014 xehetasunetarako).Alemanerazko A hizkirako hiztegi-sarrerak editatu ondoren, hau da: proposatutako lemategiaren %10erako (3.400 bat lema), alemanerazko lemaren polisemia-desanbiguatze eta euskarazko ordainak barne, baliatu ditugu datu haiek jarraian aipatuko ditugun glosario elebidunak automatikoki sortzeko bost metodo ebaluatzeko. Alemanerazko DeReWo-40.000</figDesc><table><row><cell>Aipatu dugun bezala, EuDeLex hiztegia hutsetik lantzen dugu, abiapuntu gisa balia daitekeen glosario elebidunik ez baikenuen eskuragarri. Eskuzko lana murrizteko asmotan, abiatzeko 4 Euskaltzaindiaren Hiztegi Batua (HB), Orotariko Euskal Hiztegia (OEH), Elhuyar Euskara-Gaztelania hiztegiaren euskarazko lemategia (ElhDic), Euskal WordNet (EusWN) eta EDBL; Erreferentzia zehatzak Lindemann eta San Vicente (2015) lanean. ordainak lortzen. 1) EHUko Letra Fakultatean garatu berri den euskara-alemanerazko literatura-corpus elebiduneko eskuragarri genituen datuak -81 alemanerazko liburu eta haien euskarazko itzulpenak; 2 milioi testu-hitz hizkuntza bakoitzean -(Sanz, Zubillaga eta Uribarri 2015) erabili ditugu honako bi tresna hauen bitartez glosarioak sortzeko: GIZA (Och eta Ney 2000) eta Bifid (Nazar 2012) lerrokatze tresnak, estatistikan oinarrituta testu paraleloetatik itzulpen-ordainak hautatzen dituenak. 2) Asmo honetarako eratu dugun Biblia-corpus elebiduna (640.000 testu-hitz hizkuntza bakoitzean) erabili dugu aipatutako lerrokatze tresnek glosarioak sor ditzaten. 3) Elhuyar Fundazioak garatutako Pibolex hiztegiaren (Saralegi, Manterola eta San Vicente 2012) euskaraz-alemanerazko bertsioak ematen dituen ordain-bikoteak ebaluatu ditugu. 4) Existitzen diren kode ireki eta lizentzia libreko datu-base lexikal elebakar biren hizkuntzaz-hizkuntzako loturak erauzi ditugu, EU-DE lotura duten item lexikoak glosario-sarrera gisa batzeko: Wiktionary eta Wikipedia. 5) WordNet datu-baseetatik erauzi ditugu datuak, EusWN datu baseko item lexikoak, ingelesezko WordNet-en bitartez alemanerazko GermaNet datu-baseko edukiekin lotuz, 5 (ikus 2.1 atala) zerrendako 40.000 lementzat saiatu gara metodo hauen bitartez euskarazko alegia. 6</cell></row></table><note></note></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" type="table" xml:id="tab_4"><head>2 Taula: Glosario elebidunak sortzeko metodoen sailkapena, emaitzaren kalitatearen arabera Taldea Baliabideak Ordain egoki bat edo gehiago dituen alemanerazko lemak</head><label></label><figDesc></figDesc><table><row><cell>(1) ia erabateko doitasuna</cell><cell>Wiktionary, Wikipedia, Bifid</cell><cell>%40,6</cell></row><row><cell></cell><cell>(Literatura corpusa)</cell><cell></cell></row><row><cell>(2) doitasun altua (ordain</cell><cell>Bifid (Biblia), WordNet</cell><cell>%20</cell></row><row><cell>desegoki gutxi)</cell><cell></cell><cell></cell></row><row><cell>(3) doitasun baxua (ordain</cell><cell>Giza, Pibolex</cell><cell>%18,7</cell></row><row><cell>desegoki asko)</cell><cell></cell><cell></cell></row></table><note></note></figure>
<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="1">[Artikulu hau argitaratzeko zorian dago; idazlan honen azken bertsiorako, erreferentzia eskuragarria izango da.] 2 Erabiltzaile-interfazearen lehenengo bertsioa http://www.ehu.eus/eudelex helbidean eskuragarri dago.Artikulu honetan lekurik ez duten EuDeLex hiztegiaren garapenaren beste alderdi batzuez, ikus Lindemann (2014a).</note>
<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="3">ETC-ren kasuan, EHUko Euskara Institutuan prozesaturiko maiztasun-zerrenda lematizatua eskuragarri izan dugu.IkerGazte, 2015Giza-zientziak</note>
<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="6"> Erreferentziak Lindemann et al. (2014) lanean.</note>
</body>
<back>
<div type="references">
<listBibl>
<biblStruct xml:id="b0">
<analytic>
<title level="a" type="main">EUSLEM: A lemmatiser/tagger for Basque</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">I</forename><surname>Aduriz</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">I</forename><surname>Aldezabal</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">I</forename><surname>Alegria</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">X</forename><surname>Artola</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">N</forename><surname>Ezeiza</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">R</forename><surname>Urizar</surname></persName>
</author>
</analytic>
<monogr>
<title level="m">Proceedings of EURALEX 1996</title>
<meeting>EURALEX 1996<address><addrLine>Göteborg</addrLine></address></meeting>
<imprint>
<date type="published" when="1996" />
<biblScope unit="page" from="17" to="26" />
</imprint>
<respStmt>
<orgName>Göteborg University</orgName>
</respStmt>
</monogr>
</biblStruct>
<biblStruct xml:id="b1">
<monogr>
<title level="m" type="main">EDBL: a General Lexical Basis for the Automatic Processing of Basque</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">I</forename><surname>Aldezabal</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">O</forename><surname>Ansa</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">B</forename><surname>Arrieta</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">X</forename><surname>Artola</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">A</forename><surname>Ezeiza</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">G</forename><surname>Hernandez</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">M</forename><surname>Lersundi</surname></persName>
</author>
<imprint>
<date type="published" when="2001" />
</imprint>
</monogr>
<note type="report_type">HAL -CCSD</note>
</biblStruct>
<biblStruct xml:id="b2">
<analytic>
<title level="a" type="main">Die Rolle der Muttersprache im Deutschunterricht in zweisprachigen Gebieten am Beispiel des Baskenlandes</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">S</forename><surname>Braun</surname></persName>
</author>
</analytic>
<monogr>
<title level="m">Bestandsaufnahme der Germanistik in Spanien: Kulturtransfer und methodologische Erneuerung</title>
<editor>C. Jarrilot (arg</editor>
<imprint>
<publisher>Peter Lang</publisher>
<date type="published" when="2010" />
<biblScope unit="page" from="25" to="36" />
</imprint>
</monogr>
</biblStruct>
<biblStruct xml:id="b3">
<analytic>
<title level="a" type="main">Do dictionary users really look up frequent words?-on the overestimation of the value of corpus-based lexicography</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">, G.-M</forename><surname>De Schryver</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">D</forename><surname>Joffe</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">P</forename><surname>Joffe</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">S</forename><surname>Hillewaert</surname></persName>
</author>
</analytic>
<monogr>
<title level="j">Lexikos</title>
<imprint>
<biblScope unit="volume">16</biblScope>
<biblScope unit="issue">1</biblScope>
<date type="published" when="2010" />
</imprint>
</monogr>
</biblStruct>
<biblStruct xml:id="b4">
<analytic>
<idno>40000g-2009-12-31-0.1</idno>
</analytic>
<monogr>
<title level="m">mit Benutzerdokumentation. Institut für Deutsche Sprache</title>
<imprint>
<date type="published" when="2009" />
</imprint>
</monogr>
<note>Korpusbasierte Wortgrundformenliste DEREWO. Programmbereich Korpuslinguistik</note>
</biblStruct>
<biblStruct xml:id="b5">
<analytic>
<title level="a" type="main">Polysemie oder Homonymie? Zur Praxis der Bedeutungsgliederung in den Wörterbuchartikeln synchronischer einsprachiger Wörterbücher der Deutschen Sprache</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">G</forename><surname>Kempcke</surname></persName>
</author>
</analytic>
<monogr>
<title level="j">Lexicographica, Nr</title>
<imprint>
<biblScope unit="volume">17</biblScope>
<biblScope unit="page" from="61" to="68" />
<date type="published" when="2001" />
</imprint>
</monogr>
</biblStruct>
<biblStruct xml:id="b6">
<analytic>
<title level="a" type="main">Putting Frequencies in the Dictionary</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">A</forename><surname>Kilgarriff</surname></persName>
</author>
</analytic>
<monogr>
<title level="j">International Journal of Lexicography</title>
<imprint>
<biblScope unit="volume">10</biblScope>
<biblScope unit="issue">2</biblScope>
<biblScope unit="page" from="135" to="55" />
<date type="published" when="1997" />
</imprint>
</monogr>
</biblStruct>
<biblStruct xml:id="b7">
<analytic>
<title level="a" type="main">Evaluating Different Methods for Automatically Collecting Large General Corpora for Basque from the Web</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">I</forename><surname>Leturia</surname></persName>
</author>
</analytic>
<monogr>
<title level="m">Proceedings of 24th International Conference on Computational Linguistics (COLING 2012</title>
<editor>UPV/EHU Lengoaia eta Sistema Informatikoak Saila</editor>
<meeting>24th International Conference on Computational Linguistics (COLING 2012<address><addrLine>Mumbai, India; Donostia</addrLine></address></meeting>
<imprint>
<date type="published" when="2012" />
<biblScope unit="page" from="1553" to="70" />
</imprint>
</monogr>
<note type="report_type">PhD Thesis</note>
<note>The Web as a Corpus of Basque</note>
</biblStruct>
<biblStruct xml:id="b8">
<analytic>
<title level="a" type="main">Creating a German-Basque Electronic Dictionary for German Learners</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">D</forename><surname>Lindemann</surname></persName>
</author>
</analytic>
<monogr>
<title level="m">Zweisprachige Lexikographie im Spannungsfeld zwischen Translation und Didaktik</title>
<editor>Domínguez Vázquez, M. J., F. Mollica eta M. Nied</editor>
<imprint>
<publisher>De Gruyter</publisher>
<date type="published" when="2013" />
<biblScope unit="volume">95</biblScope>
<biblScope unit="page" from="263" to="86" />
</imprint>
</monogr>
<note>Lexicographica Series Maior</note>
</biblStruct>
<biblStruct xml:id="b9">
<analytic>
<title level="a" type="main">Euskarazko maiztasun lemategia gaurko teknologien ikuspuntutik</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">D</forename><surname>Lindemann</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><surname>Eta I. San</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><surname>Vicente</surname></persName>
</author>
</analytic>
<monogr>
<title level="m">Ibon Sarasolari Gorazarre</title>
<editor>B. Fernandez eta B. Salaburu</editor>
<meeting><address><addrLine>Bilbao</addrLine></address></meeting>
<imprint>
<publisher>UPV/EHU</publisher>
<date type="published" when="2015" />
</imprint>
</monogr>
</biblStruct>
<biblStruct xml:id="b10">
<analytic>
<title level="a" type="main">Bilingual Dictionary Drafting. The example of German-Basque, a medium-density language pair</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">D</forename><surname>Lindemann</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">X</forename><surname>Saralegi</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">I</forename><surname>Vicente</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">I</forename><surname>Manterola</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">R</forename><surname>Nazar</surname></persName>
</author>
</analytic>
<monogr>
<title level="m">Proceedings of the XVI Euralex International Congress</title>
<meeting>the XVI Euralex International Congress<address><addrLine>Bolzano</addrLine></address></meeting>
<imprint>
<publisher>EURAC</publisher>
<date type="published" when="2014" />
<biblScope unit="page" from="563" to="76" />
</imprint>
</monogr>
</biblStruct>
<biblStruct xml:id="b11">
<monogr>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">Martínez</forename><surname>Rubio</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">E</forename></persName>
</author>
<title level="m">Euskara alemana hiztegia</title>
<meeting><address><addrLine>Donostia</addrLine></address></meeting>
<imprint>
<publisher>Elkar</publisher>
<date type="published" when="2007" />
</imprint>
</monogr>
</biblStruct>
<biblStruct xml:id="b12">
<analytic>
<title level="a" type="main">Bifid: un alineador de corpus paralelo a nivel de documento, oración y vocabulario</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">R</forename><surname>Nazar</surname></persName>
</author>
</analytic>
<monogr>
<title level="j">Linguamática</title>
<imprint>
<biblScope unit="volume">4</biblScope>
<biblScope unit="issue">2</biblScope>
<biblScope unit="page" from="45" to="56" />
<date type="published" when="2012" />
</imprint>
</monogr>
</biblStruct>
<biblStruct xml:id="b13">
<analytic>
<title level="a" type="main">Improved statistical alignment models</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">F</forename><forename type="middle">J</forename><surname>Och</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">H</forename><surname>Ney</surname></persName>
</author>
</analytic>
<monogr>
<title level="m">Proceedings of the 38th annual meeting of the Association for Computational Linguistics on Computational Linguistics</title>
<meeting>the 38th annual meeting of the Association for Computational Linguistics on Computational Linguistics<address><addrLine>Hongkong</addrLine></address></meeting>
<imprint>
<publisher>Association for Computational Linguistics</publisher>
<date type="published" when="2000" />
<biblScope unit="page" from="440" to="487" />
</imprint>
</monogr>
</biblStruct>
<biblStruct xml:id="b14">
<analytic>
<title level="a" type="main">Korpusbasierte Wörterbucharbeit mit den Daten des</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">U</forename><surname>Quasthoff</surname></persName>
</author>
</analytic>
<monogr>
<title level="j">Projekts Deutscher Wortschatz. Linguistik online</title>
<imprint>
<biblScope unit="volume">39</biblScope>
<biblScope unit="page">3</biblScope>
<date type="published" when="2009" />
</imprint>
</monogr>
</biblStruct>
<biblStruct xml:id="b15">
<analytic>
<title level="a" type="main">Interkulturelles Lernen am Beispiel baskischer Muttersprachler im Deutschunterricht</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">D</forename><surname>Reuter</surname></persName>
</author>
</analytic>
<monogr>
<title level="m">C. Jarrilot (arg): Bestandsaufnahme der Germanistik in Spanien: Kulturtransfer und methodologische Erneuerung</title>
<imprint>
<publisher>Peter Lang</publisher>
<date type="published" when="2010" />
<biblScope unit="page" from="261" to="66" />
</imprint>
</monogr>
</biblStruct>
<biblStruct xml:id="b16">
<monogr>
<title/>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">D</forename><surname>Reuter</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">J</forename><surname>Wolff</surname></persName>
</author>
<editor>Deutsch -Euskaldunentzat. Donostia: Erein</editor>
<imprint>
<date type="published" when="2007" />
</imprint>
</monogr>
</biblStruct>
<biblStruct xml:id="b17">
<analytic>
<title level="a" type="main">Estudio basado en corpus de las traducciones del alemán al vasco</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">Z</forename><surname>Sanz</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">N</forename><surname>Zubillaga</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">I</forename><surname>Uribarri</surname></persName>
</author>
</analytic>
<monogr>
<title level="m">Corpus-based Translation and Interpreting Studies: from description to application</title>
<editor>M. T. Sánchez Nieto</editor>
<meeting><address><addrLine>Berlin</addrLine></address></meeting>
<imprint>
<publisher>Frank & Timme</publisher>
<date type="published" when="2015" />
<biblScope unit="page" from="211" to="246" />
</imprint>
</monogr>
</biblStruct>
<biblStruct xml:id="b18">
<analytic>
<title level="a" type="main">Building a Basque-Chinese Dictionary by Using English as Pivot</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">X</forename><surname>Saralegi</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">I</forename><surname>Manterola Eta I. San</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><surname>Vicente</surname></persName>
</author>
</analytic>
<monogr>
<title level="m">Proceedings of the Eighth International Conference on Language Resources and Evaluation</title>
<meeting>the Eighth International Conference on Language Resources and Evaluation<address><addrLine>Istanbul</addrLine></address></meeting>
<imprint>
<date type="published" when="2012" />
</imprint>
</monogr>
</biblStruct>
<biblStruct xml:id="b19">
<monogr>
<title/>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">I</forename><surname>Sarasola</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">J</forename><surname>Landa</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">P</forename><surname>Salaburu</surname></persName>
</author>
<editor>Egungo Testuen Corpusa. UPV/EHU</editor>
<imprint>
<date type="published" when="2013" />
</imprint>
</monogr>
</biblStruct>
<biblStruct xml:id="b20">
<monogr>
<title level="m" type="main">Developing linguistic corpora: A guide to good practice</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">J</forename><surname>Sinclair</surname></persName>
</author>
<editor>M. Wynne</editor>
<imprint>
<date type="published" when="2005" />
<publisher>Oxbow Books</publisher>
<biblScope unit="page" from="1" to="16" />
<pubPlace>Oxford</pubPlace>
</imprint>
</monogr>
<note>Corpus and text-basic principles</note>
</biblStruct>
<biblStruct xml:id="b21">
<analytic>
<title level="a" type="main">The Role of Parallel Corpora in Translation and Multilingual Lexicography</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">W</forename><surname>Teubert</surname></persName>
</author>
</analytic>
<monogr>
<title level="m">Lexis in Contrast: Corpus-Based Approaches</title>
<editor>B. Altenberg eta S. Granger</editor>
<imprint>
<publisher>John Benjamins Publishing</publisher>
<date type="published" when="2001" />
<biblScope unit="volume">6</biblScope>
<biblScope unit="page" from="189" to="214" />
</imprint>
</monogr>
<note>Corpus Linguistics and Lexicography</note>
</biblStruct>
<biblStruct xml:id="b22">
<analytic>
<title level="a" type="main">Dictionary Users do Look up Frequent and Socially Relevant Words. Two Log File Analyses</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">S</forename><surname>Wolfer</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">A</forename><surname>Koplenig</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">P</forename><surname>Meyer Eta</surname></persName>
</author>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">C</forename><surname>Müller-Spitzer</surname></persName>
</author>
</analytic>
<monogr>
<title level="m">Proceedings of the XVI Euralex International Congress</title>
<meeting>the XVI Euralex International Congress<address><addrLine>Bolzano/Bozen</addrLine></address></meeting>
<imprint>
<publisher>Eurac</publisher>
<date type="published" when="2014" />
<biblScope unit="page" from="281" to="90" />
</imprint>
</monogr>
</biblStruct>
<biblStruct xml:id="b23">
<analytic>
<title level="a" type="main">Sprachvergleich Baskisch/Deutsch und seine Auswirkungen für den Unterricht</title>
<author>
<persName xmlns="http://www.tei-c.org/ns/1.0"><forename type="first">Jürgen</forename><surname>Wolff</surname></persName>
</author>
</analytic>
<monogr>
<title level="m">Bestandsaufnahme der Germanistik in Spanien: Kulturtransfer und methodologische Erneuerung</title>
<editor>C. Jarrilot (arg</editor>
<imprint>
<publisher>Peter Lang</publisher>
<date type="published" when="2010" />
<biblScope unit="page" from="37" to="42" />
</imprint>
</monogr>
</biblStruct>
</listBibl>
</div>
</back>
</text>
</TEI>