Ziterauzi KM: Difference between revisions
No edit summary |
|||
Line 1: | Line 1: | ||
= Koldo Mitxelenaren Zitazio-grafoa = | = Koldo Mitxelenaren Zitazio-grafoa = | ||
Orrialde honetan Koldo Mitxelenaren zitazio-grafoa eraikitzeko burutzen ditugun esperimentuak deskribatzen ditugu. | |||
== Helburuak == | |||
* Koldo Mitxelenaren bibliografia Wikibase honetan osorik deskribatzea | |||
* IkerGazte eta ASJU bildumetan, Wikibase honetan osorik deskribatu ostean, KM-en lanak aipatzen dituzten artikuluak identifikatu | |||
* Artikulu horietatik KM-en lanetara doazen zitazio-erlazioak Wikibase honetan errepresentatu | |||
* Pérez Gazteluren bibliografian agertzen diren zitazio-erlazioak Wikibasean jaso, oraindik jaso gabe diren lanak ere Wikibasean errepresentatuz | |||
* Zitazio-grafoa bistarazi | |||
* (Datu guztiak Wikidatara bidali) | |||
== Koldo Mitxelenaren bibliografia == | == Koldo Mitxelenaren bibliografia == | ||
Line 33: | Line 39: | ||
order by xsd:integer(?year) lcase(?label) | order by xsd:integer(?year) lcase(?label) | ||
</sparql> | </sparql> | ||
== IkerGazte Kongresuak == | |||
IkerGazte kongresu sortako edizio guztietako [https://www.zotero.org/groups/4916343/ikergazte%20kongresua/library testu osoak lortu], Wikibaseko item bibliografiko bakoitzarekin lotu ostean, "Mitxelena" eta "Michelena" kateak bilatu ditugu testu osoetan. XX artikulu identifikatu ditugu, non KM aipatu egiten den. | |||
== ASJU Aldizkaria == | |||
Wikibase honetara INGUMA-tik inportatu ziren ASJU-ko 423 artikulurentzat PDF testu osoak lortu eta GROBID tresnaz prozesatu ditugu, XML-TEI bertsioak eskuratzeko. "Mitxelena" eta "Michelena" kateak bilatuz, XXX itemeko multzo bat finkatu dugu, non KM-ren lanen aipuak bilatuko ditugun. | |||
== Zitazio-erlazioak identifikatzea == | |||
=== Metodo semi-automatikoa == | |||
Zotero eta Wikibase konektatzen dituen [https://github.com/dlindem/zotero-wikibase Python flask web-aplikazio bati] funtzio batzuk erantsi dizkiogu, ataza honetan laguntzeko: | |||
* Aplikazioak karpeta bateko TEI-XML fitxategietatik GROBID-ek identifikatutako sarrera bibliografikoak hartzen ditu (<listBibl> elementuaren edukia) | |||
* Zenbait bilaketa abiarazten ditu, ondorengo plataformetan: Google Books, OpenAlex, Wikidata | |||
* Aipatutako argitalpena aurkituz gero, hura deskribatzen duen Wikibase entitate bat sortzen du, eta zitazio-erlazioa datu-basean ezarri (aipatzen duenetik aipatutakora). | |||
== Eskuzko metodoa == | |||
GROBID tresnak artikuluaren egitura TEI-XML formatuan jasotzeko ahaleginean huts egiten duen kasuetan, eskuz bilatzen ditugu Mitxelenaren aipuak, eta zitazio-erlazioa eskuz ezarri. |
Revision as of 13:38, 13 July 2024
Koldo Mitxelenaren Zitazio-grafoa
Orrialde honetan Koldo Mitxelenaren zitazio-grafoa eraikitzeko burutzen ditugun esperimentuak deskribatzen ditugu.
Helburuak
- Koldo Mitxelenaren bibliografia Wikibase honetan osorik deskribatzea
- IkerGazte eta ASJU bildumetan, Wikibase honetan osorik deskribatu ostean, KM-en lanak aipatzen dituzten artikuluak identifikatu
- Artikulu horietatik KM-en lanetara doazen zitazio-erlazioak Wikibase honetan errepresentatu
- Pérez Gazteluren bibliografian agertzen diren zitazio-erlazioak Wikibasean jaso, oraindik jaso gabe diren lanak ere Wikibasean errepresentatuz
- Zitazio-grafoa bistarazi
- (Datu guztiak Wikidatara bidali)
Koldo Mitxelenaren bibliografia
Koldo Mitxelenaren lanak bildu ditugu lehenengoz, haiek aipatzen dituzten lanetatik loturak ezarri ahal izateko. Ondorengoak izan dira iturriak:
Elixabete Pérez Gazteluk egindako bibliografia
Paperean argitaratu izan zen bibliografia hau 1997. urtean (ikus worldcat sarrera). OCR bitartez lortutako testutik bibliografia-sarrerak egitaratu ditugu espresio erregularrez eta eskuzko lanaz. Bibliografiak 721 sarrera ditu; horietatik 441 Koldo Mitxelena dute egile (gainontzekoak beste egile batzuek egindakoak dira, eta KM-en lanak aipatu egiten dituzte).
DialNet
DialNet-ek Koldo Mitxelenaren sarreran zerrendatzen dituenak Zotero bitartez eskuratu ditugu. 166 sarrera hartu dugu hortik.
INGUMA
Wikibase honetan jada errepresentazioa zuten itemak aintzat hartu ditugu. Euskarazko 30 liburu eta aldizkari-artikulu dira horiek.
SPARQL galdeketa
Hiru iturrion itemak batera ikusteko, honako galdeketa hau abiarazi.
PREFIX iwb: <https://wikibase.inguma.eus/entity/>
PREFIX idp: <https://wikibase.inguma.eus/prop/direct/>
PREFIX ip: <https://wikibase.inguma.eus/prop/>
PREFIX ips: <https://wikibase.inguma.eus/prop/statement/>
PREFIX ipq: <https://wikibase.inguma.eus/prop/qualifier/>
select ?bib_item (strafter(str(?bib_item),"https://wikibase.inguma.eus/entity/") as ?qid) ?EPG_bib ?Dialnet_id ?Inguma_id ?worldcat_id
?bib_itemLabel (YEAR(?date) as ?year)
where {
?bib_item idp:P17 iwb:Q201; idp:P19 ?date.
optional {?bib_item idp:P70 ?EPG_bib.}
optional {?bib_item idp:P86 ?Dialnet_id.}
optional {?bib_item idp:P12 ?Inguma_id.}
optional {?bib_item idp:P46 ?worldcat_id.}
SERVICE wikibase:label { bd:serviceParam wikibase:language "en,eu". }
} group by ?bib_item ?EPG_bib ?Dialnet_id ?Inguma_id ?worldcat_id ?bib_itemLabel ?date
order by xsd:integer(?year) lcase(?label)
IkerGazte Kongresuak
IkerGazte kongresu sortako edizio guztietako testu osoak lortu, Wikibaseko item bibliografiko bakoitzarekin lotu ostean, "Mitxelena" eta "Michelena" kateak bilatu ditugu testu osoetan. XX artikulu identifikatu ditugu, non KM aipatu egiten den.
ASJU Aldizkaria
Wikibase honetara INGUMA-tik inportatu ziren ASJU-ko 423 artikulurentzat PDF testu osoak lortu eta GROBID tresnaz prozesatu ditugu, XML-TEI bertsioak eskuratzeko. "Mitxelena" eta "Michelena" kateak bilatuz, XXX itemeko multzo bat finkatu dugu, non KM-ren lanen aipuak bilatuko ditugun.
Zitazio-erlazioak identifikatzea
= Metodo semi-automatikoa
Zotero eta Wikibase konektatzen dituen Python flask web-aplikazio bati funtzio batzuk erantsi dizkiogu, ataza honetan laguntzeko:
- Aplikazioak karpeta bateko TEI-XML fitxategietatik GROBID-ek identifikatutako sarrera bibliografikoak hartzen ditu (<listBibl> elementuaren edukia)
- Zenbait bilaketa abiarazten ditu, ondorengo plataformetan: Google Books, OpenAlex, Wikidata
- Aipatutako argitalpena aurkituz gero, hura deskribatzen duen Wikibase entitate bat sortzen du, eta zitazio-erlazioa datu-basean ezarri (aipatzen duenetik aipatutakora).
Eskuzko metodoa
GROBID tresnak artikuluaren egitura TEI-XML formatuan jasotzeko ahaleginean huts egiten duen kasuetan, eskuz bilatzen ditugu Mitxelenaren aipuak, eta zitazio-erlazioa eskuz ezarri.