Ziterauzi KM: Difference between revisions
Line 73: | Line 73: | ||
* Zitazio-erlazioa datu-basean ezartzen da [[Property:P62|P62]] erabiliz (aipatzen duenetik aipatutakora). | * Zitazio-erlazioa datu-basean ezartzen da [[Property:P62|P62]] erabiliz (aipatzen duenetik aipatutakora). | ||
Fase honetan KM-en lanetara doazen zitazio-erlazioak bakarrik hartzen ditugu aintzat, eta item horiek guztiak jasota ditugu printzipioz. Horregatik, badugu identifikatzailea zitazio-erlazioaezarri ahal izateko, Wikibasekoa, alegia. KM-en lanen batekiko zitazio-erlazioa ezartzen dugunean, lan haren metadatu-sorta errebisatzen dugu. Hau da, Pérez Gazteluren bibliografiako lanentzat batez ere, metadatu-sorta egokia sortu egiten dugu. Horretarako, Zotero sarrera bat sortzen dugu. [https://github.com/dlindem/wikibase/blob/main/inguma/Screenshot_cited_item.png Hemengo] irudian, TEI-XML-ean agertzen den aipu bat eta haren Zotero sarrera egin berria erakusten dira. Zotero sarrera, kasu honetan, RSBAP webguneko sarrera batetik sortu da, eta Wikibaseko sarrera aberastuko du, lehenik Pérez Gazteluren erreferentzia gordina besterik izan ez zuena. Horretarako, nahikoa da Wikibaseko sarrera duen URIak Zoteroko sarrerara kopiatzera; gainontzekoa [https://github.com/dlindem/zotwb script sorta honek] egiten du. Ikus [https://github.com/dlindem/wikibase/blob/main/inguma/Screenshot_zoteroenriched_item.png hemen] irudi bat: OCR-tik zetorren sarrera aberastu baino lehen vs. Zoterokoarekin batu eta gero. | Fase honetan KM-en lanetara doazen zitazio-erlazioak bakarrik hartzen ditugu aintzat, eta item horiek guztiak jasota ditugu printzipioz. Horregatik, badugu identifikatzailea zitazio-erlazioaezarri ahal izateko, Wikibasekoa, alegia. KM-en lanen batekiko zitazio-erlazioa ezartzen dugunean, lan haren metadatu-sorta errebisatzen dugu. Hau da, Pérez Gazteluren bibliografiako lanentzat batez ere, metadatu-sorta egokia sortu egiten dugu. Horretarako, Zotero sarrera bat sortzen dugu. [https://github.com/dlindem/wikibase/blob/main/inguma/Screenshot_cited_item.png Hemengo] irudian, TEI-XML-ean agertzen den aipu bat eta haren Zotero sarrera egin berria erakusten dira. Zotero sarrera, kasu honetan, RSBAP webguneko sarrera batetik sortu da, eta Wikibaseko sarrera aberastuko du, lehenik Pérez Gazteluren erreferentzia gordina besterik izan ez zuena. Horretarako, nahikoa da Wikibaseko sarrera duen URIak Zoteroko sarrerara kopiatzera; gainontzekoa [https://github.com/dlindem/zotwb script sorta honek] egiten du. Ikus [https://github.com/dlindem/wikibase/blob/main/inguma/Screenshot_zoteroenriched_item.png hemen] irudi bat: OCR-tik zetorren sarrera aberastu baino lehen vs. Zoterokoarekin batu eta gero. | ||
== Zitazio-erlazioak: grafoa == | |||
Grafoaren bistarazte sinplea: | |||
<sparql tryit="1"> | |||
PREFIX iwb: <https://wikibase.inguma.eus/entity/> | |||
PREFIX idp: <https://wikibase.inguma.eus/prop/direct/> | |||
select ?aipu_iturri ?aipu_iturriLabel ?aipu_xede ?aipu_xedeLabel ?data | |||
where {?aipu_xede idp:P17 iwb:Q201; idp:P19 ?data. | |||
?aipu_iturri idp:P62 ?aipu_xede . | |||
SERVICE wikibase:label { bd:serviceParam wikibase:language "en,eu". } | |||
} | |||
</sparql> |
Revision as of 16:47, 13 July 2024
Koldo Mitxelenaren Zitazio-grafoa
Orrialde honetan Koldo Mitxelenaren zitazio-grafoa eraikitzeko burutzen ditugun esperimentuak deskribatzen ditugu.
Helburuak
- Koldo Mitxelenaren bibliografia Wikibase honetan osorik deskribatzea
- IkerGazte eta ASJU bildumetan, Wikibase honetan osorik deskribatu ostean, KM-en lanak aipatzen dituzten artikuluak identifikatzea
- Artikulu horietatik KM-en lanetara doazen zitazio-erlazioak Wikibase honetan errepresentatzea
- Pérez Gazteluren bibliografian agertzen diren zitazio-erlazioak Wikibasean jaso, oraindik jaso gabe diren lanak ere Wikibasean errepresentatuz
- Zitazio-grafoa bistaraztea
- (Datu guztiak Wikidatara bidaltzea)
- Proiektuan zehar, prozesu-metadatuak gordetzea, zitazio-grafo handiagoak eraikitzeko lan-karga iragarri ahal izateko
Koldo Mitxelenaren bibliografia
Koldo Mitxelenaren lanak bildu ditugu lehenengoz, haiek aipatzen dituzten lanetatik loturak ezarri ahal izateko. Iturri ezberdinetako bibliografia-sarrerak batu ostean, 499 item bibliografiko ditugu, non KM egile bezala agertzen baiten.
Ondorengoak izan dira iturriak:
Elixabete Pérez Gazteluk egindako bibliografia
Paperean argitaratu izan zen bibliografia hau 1997. urtean (ikus worldcat sarrera). OCR bitartez lortutako testutik bibliografia-sarrerak egitaratu ditugu espresio erregularrez eta eskuzko lanaz. Bibliografiak 721 sarrera ditu; horietatik 441 Koldo Mitxelena dute egile (gainontzekoak beste egile batzuek egindakoak dira, eta KM-en lanak aipatu egiten dituzte).
DialNet
DialNet-ek Koldo Mitxelenaren sarreran zerrendatzen dituenak Zotero bitartez eskuratu ditugu. 166 sarrera hartu dugu hortik.
INGUMA
Wikibase honetan jada errepresentazioa zuten itemak aintzat hartu ditugu. Euskarazko 30 liburu eta aldizkari-artikulu dira horiek.
KM Bibliografia: SPARQL galdeketak
Hiru iturrion itemak batera ikusteko, honako galdeketa hau abiarazi.
PREFIX iwb: <https://wikibase.inguma.eus/entity/>
PREFIX idp: <https://wikibase.inguma.eus/prop/direct/>
PREFIX ip: <https://wikibase.inguma.eus/prop/>
PREFIX ips: <https://wikibase.inguma.eus/prop/statement/>
PREFIX ipq: <https://wikibase.inguma.eus/prop/qualifier/>
select ?bib_item (strafter(str(?bib_item),"https://wikibase.inguma.eus/entity/") as ?qid) ?EPG_bib ?Dialnet_id ?Inguma_id ?worldcat_id
?bib_itemLabel (YEAR(?date) as ?year)
where {
?bib_item idp:P17 iwb:Q201; idp:P19 ?date.
optional {?bib_item idp:P70 ?EPG_bib.}
optional {?bib_item idp:P86 ?Dialnet_id.}
optional {?bib_item idp:P12 ?Inguma_id.}
optional {?bib_item idp:P46 ?worldcat_id.}
SERVICE wikibase:label { bd:serviceParam wikibase:language "en,eu". }
} group by ?bib_item ?EPG_bib ?Dialnet_id ?Inguma_id ?worldcat_id ?bib_itemLabel ?date
order by xsd:integer(?year) lcase(?label)
Koldo Mitxelenaren argitalpenak denboran zehar:
#defaultView:BarChart
PREFIX iwb: <https://wikibase.inguma.eus/entity/>
PREFIX idp: <https://wikibase.inguma.eus/prop/direct/>
select ?data (count (?bib_item) as ?zenbat_lan)
where {?bib_item idp:P17 iwb:Q201; idp:P19 ?data.}
group by ?data ?zenbat_lan
Zitazioak erauzteko dokumentuen iturriak
IkerGazte Kongresuak
IkerGazte kongresu sortako edizio guztietako testu osoak lortu, Wikibaseko item bibliografiko bakoitzarekin lotu ostean, "Mitxelena" eta "Michelena" kateak bilatu ditugu testu osoetan. 19 artikulu identifikatu ditugu, non KM aipatu egiten den: Q35379, Q35404, Q35478, Q35530, Q35533, Q35650, Q35659, Q35662, Q35664, Q35669, Q35759, Q35773, Q35774, Q35781, Q35783, Q37082, Q37130, Q37221, Q37224
ASJU Aldizkaria
Wikibase honetara INGUMA-tik inportatu ziren ASJU-ko 423 artikulurentzat PDF testu osoak lortu eta GROBID tresnaz prozesatu ditugu, XML-TEI bertsioak eskuratzeko. "Mitxelena" eta "Michelena" kateak bilatuz, 251 itemeko multzo bat finkatu dugu, non KM-ren lanen aipuak bilatuko ditugun:
- KM aipatzen dutenak: Q36763, Q36760, Q36759, Q36758, Q36708, Q36707, Q36706, Q36705, Q36703, Q36702, Q35233, Q35231, Q35171, Q35170, Q35169, Q35168, Q35049, Q35048, Q35047, Q31009, Q31008, Q31007, Q31004, Q31000, Q30999, Q30997, Q30994, Q30993, Q30992, Q30986, Q30985, Q30984, Q30982, Q30981, Q30980, Q30978, Q30977, Q30975, Q30973, Q30972, Q30963, Q30962, Q30961, Q30959, Q30958, Q30956, Q30955, Q30954, Q30947, Q30943, Q30942, Q30940, Q30937, Q30936, Q30935, Q30933, Q30930, Q30927, Q30925, Q30923, Q30920, Q30919, Q30914, Q30913, Q30912, Q30905, Q30904, Q30902, Q30900, Q30899, Q30898, Q30897, Q30896, Q30892, Q30891, Q30887, Q30885, Q30883, Q30858, Q30855, Q30851, Q30849, Q30845, Q30843, Q30842, Q30840, Q30839, Q30838, Q30837, Q30836, Q30834, Q30833, Q30831, Q30827, Q30826, Q30823, Q30822, Q30202, Q28292, Q28290, Q28289, Q28282, Q28278, Q28277, Q23127, Q23126, Q23124, Q23121, Q23120, Q23116, Q23115, Q23111, Q23107, Q23106, Q23105, Q23104, Q23102, Q23101, Q23098, Q23097, Q23095, Q23080, Q23078, Q23072, Q23067, Q23066, Q23065, Q23064, Q23061, Q23060, Q23059, Q23058, Q23057, Q23056, Q23055, Q23054, Q23044, Q23043, Q23039, Q23037, Q23036, Q23033, Q23032, Q19650, Q19647, Q19646, Q19645, Q19643, Q19642, Q19640, Q19639, Q17802, Q17801, Q17271, Q15890, Q15866, Q15863, Q15531, Q15529, Q15528, Q15526, Q15525, Q15523, Q15522, Q15521, Q15517, Q15512, Q15511, Q15510, Q15509, Q15507, Q15506, Q13792, Q13791, Q35232, Q35166, Q35046, Q31010, Q31001, Q30998, Q30996, Q30995, Q30988, Q30976, Q30974, Q30953, Q30951, Q30934, Q30932, Q30928, Q30926, Q30918, Q30915, Q30909, Q30906, Q30903, Q30893, Q30884, Q30859, Q30852, Q30850, Q30848, Q30846, Q30844, Q30829, Q28288, Q28285, Q23123, Q23119, Q23118, Q23117, Q23099, Q23096, Q23071, Q23068, Q23063, Q23053, Q23045, Q23042, Q23041, Q23038, Q23035, Q19648, Q19644, Q19641, Q19638, Q19637, Q17799, Q17798, Q17797, Q15892, Q15891, Q15867, Q15865, Q15864, Q15533, Q15532, Q15527, Q15524, Q15520, Q15516, Q15515, Q15513, Q15508, Q13925, Q13924, Q13923, Q13922, Q13921, Q13919
- Baztertuak: Q37130 (Jone Mitxelena, Ikerbasque)
Pérez Gazteluren bibliografia
Paperezko bibliografia honetan 400 bat item zerrendatzen dira, KM-en lan jakin bati erreferentzia egiten diotenak. Wikibasean jaso gabe daude item horiek oraindik (INGUMA eta ASJUkoak izan ezik).
Zitazio-erlazioak identifikatzeko eta KM-en lanen metadatuak osatzeko lan-fluxua
Koldo Mitxelenaren lanen metadatuak (Pérez Gazteluren bibliografiakoak izan ezik) honako Zotero Group Library honetan gordetzen ditugu (Wikibase honetako entitateekin lotuta daude hango sarrerak): https://www.zotero.org/groups/5597887/ziterauzi/library
Zotero eta Wikibase konektatzen dituen Python flask web-aplikazio bati funtzio batzuk erantsi dizkiogu, ataza honetan laguntzeko:
- Aplikazioak karpeta bateko TEI-XML fitxategietatik GROBID-ek identifikatutako sarrera bibliografikoak hartzen ditu (<listBibl> elementuaren edukia)
- Zenbait bilaketa abiarazten ditu, ondorengo plataformetan: Google Books, OpenAlex, Wikidata.
- Aipatutako argitalpena aurkituz gero, hura deskribatzen duen Wikibase entitate bat sortzen du, jatorrizko plataformako identifikatzailea gordez. Horrela, metadatu-sarrera berria aberas daiteke iturri horretatik.
- Zitazio-erlazioa datu-basean ezartzen da P62 erabiliz (aipatzen duenetik aipatutakora).
Fase honetan KM-en lanetara doazen zitazio-erlazioak bakarrik hartzen ditugu aintzat, eta item horiek guztiak jasota ditugu printzipioz. Horregatik, badugu identifikatzailea zitazio-erlazioaezarri ahal izateko, Wikibasekoa, alegia. KM-en lanen batekiko zitazio-erlazioa ezartzen dugunean, lan haren metadatu-sorta errebisatzen dugu. Hau da, Pérez Gazteluren bibliografiako lanentzat batez ere, metadatu-sorta egokia sortu egiten dugu. Horretarako, Zotero sarrera bat sortzen dugu. Hemengo irudian, TEI-XML-ean agertzen den aipu bat eta haren Zotero sarrera egin berria erakusten dira. Zotero sarrera, kasu honetan, RSBAP webguneko sarrera batetik sortu da, eta Wikibaseko sarrera aberastuko du, lehenik Pérez Gazteluren erreferentzia gordina besterik izan ez zuena. Horretarako, nahikoa da Wikibaseko sarrera duen URIak Zoteroko sarrerara kopiatzera; gainontzekoa script sorta honek egiten du. Ikus hemen irudi bat: OCR-tik zetorren sarrera aberastu baino lehen vs. Zoterokoarekin batu eta gero.
Zitazio-erlazioak: grafoa
Grafoaren bistarazte sinplea:
PREFIX iwb: <https://wikibase.inguma.eus/entity/>
PREFIX idp: <https://wikibase.inguma.eus/prop/direct/>
select ?aipu_iturri ?aipu_iturriLabel ?aipu_xede ?aipu_xedeLabel ?data
where {?aipu_xede idp:P17 iwb:Q201; idp:P19 ?data.
?aipu_iturri idp:P62 ?aipu_xede .
SERVICE wikibase:label { bd:serviceParam wikibase:language "en,eu". }
}