KM OOCC índice de nombres
Descripción de los experimentos
- Artículo en castellano en preparación, describiendo los siguientes experimentos:
- Experimentos con los artículos de las revistas ASJU y UZTARO (citaciones de la obra de Mitxelena): Véase la página Ziterauzi_KM (en euskera)
- Experimentos para estructurar y enriquecer los índices de nombres en OOCC (véanse los resultados a continuación)
Entidades en OOCC
Las Obras Completas (OOCC) de Mitxelena (2011) contienen en su volumen XV un índice de nombres, que fue producido a mano por los editores, siguiendo el siguiente método: A los índices en Fonética Histórica Vasca se les añadieron las menciones de nombres propios en los demás textos incluidos en OOCC. Hemos recogido los nombres del listado, junto a las referencias a sus menciones en los textos, en esta instancia de Wikibase. A continuación, intentamos añadir a cada mención por una parte el contexto original, y por otra, hemos intentado identificar a la entidad mencionada con su identificador en Wikidata. Entendemos este experimento como contribución a mejorar la accesibilidad de la obra de Mitxelena.
Entidades mencionadas en OOCC en su contexto 1
Las menciones de las entidades aparecen juntas (una línea de tabla por entidad)
#title: concepts part of "OOCC índice de nombres", and their occurrences in OOCC
PREFIX iwb: <https://wikibase.inguma.eus/entity/>
PREFIX idp: <https://wikibase.inguma.eus/prop/direct/>
PREFIX ip: <https://wikibase.inguma.eus/prop/>
PREFIX ips: <https://wikibase.inguma.eus/prop/statement/>
PREFIX ipq: <https://wikibase.inguma.eus/prop/qualifier/>
select ?entity ?oocc_label ?wikidata (count(distinct ?aipu) as ?zenbat_aipu) (group_concat (distinct ?text; SEPARATOR = "|") as ?contexts)
where {
?entity idp:P32 iwb:Q45164; rdfs:label ?oocc_label. filter(lang(?oocc_label)="eu")
?entity ip:P92 ?aipu. optional {?aipu ipq:P93 ?text.}
optional {?entity idp:P1 ?wd. bind(iri(concat(str(wd:),?wd)) as ?wikidata)}
} group by ?entity ?oocc_label ?wikidata ?zenbat_aipu ?contexts order by desc(?zenbat_aipu)
Entidades mencionadas en OOCC en su contexto 2
Las menciones de las entidades aparecen separadas, cada una en una línea de tabla.
#title: concepts part of "OOCC índice de nombres" and their occurrences-in-context in OOCC
PREFIX iwb: <https://wikibase.inguma.eus/entity/>
PREFIX idp: <https://wikibase.inguma.eus/prop/direct/>
PREFIX ip: <https://wikibase.inguma.eus/prop/>
PREFIX ips: <https://wikibase.inguma.eus/prop/statement/>
PREFIX ipq: <https://wikibase.inguma.eus/prop/qualifier/>
select distinct ?entity ?oocc_label ?wikidata ?testua ?testu_izena ?aipua
where {
?entity idp:P32 iwb:Q45164; rdfs:label ?oocc_label. filter(lang(?oocc_label)="eu")
?entity ip:P92 ?aipu_st. ?aipu_st ips:P92 ?testua.
?testua rdfs:label ?testu_izena. filter(lang(?testu_izena)="eu")
optional {?aipu_st ipq:P93 ?aipua.}
optional {?entity idp:P1 ?wd. bind(iri(concat(str(wd:),?wd)) as ?wikidata)}
} group by ?entity ?oocc_label ?wikidata ?testua ?testu_izena ?aipua order by ?oocc_label ?testua ?aipua
Entidades mencionadas en OOCC (gráfico de barras)
Este grafo muestra las identidades con 20 o más menciones en OOCC.
#defaultView:BarChart
#title: concepts part of "OOCC índice de nombres", and their occurrences in OOCC
PREFIX iwb: <https://wikibase.inguma.eus/entity/>
PREFIX idp: <https://wikibase.inguma.eus/prop/direct/>
PREFIX ip: <https://wikibase.inguma.eus/prop/>
PREFIX ips: <https://wikibase.inguma.eus/prop/statement/>
PREFIX ipq: <https://wikibase.inguma.eus/prop/qualifier/>
select ?entity ?oocc_label ?wikidata ?zenbat_aipu where
{ filter(?zenbat_aipu >= 20)
{ select ?entity ?oocc_label ?wikidata (count(distinct ?aipu) as ?zenbat_aipu) where
{ ?entity idp:P32 iwb:Q45164; rdfs:label ?oocc_label. filter(lang(?oocc_label)="eu")
?entity ip:P92 ?aipu.
optional { ?entity idp:P1 ?wd. bind(iri(concat(str(wd:),?wd)) as ?wikidata) }
} group by ?entity ?oocc_label ?wikidata ?zenbat_aipu
}
} order by desc(?zenbat_aipu)
Entidades mencionadas en OOCC (visualicación de tipo grafo)
Para delimitar el conjunto de datos, este grafo sólo muestra entidades identificadas en Wikidata.
#defaultView:Graph
#title: entities part of "OOCC índice de nombres" and the OOCC parts they are referenced in
PREFIX iwb: <https://wikibase.inguma.eus/entity/>
PREFIX idp: <https://wikibase.inguma.eus/prop/direct/>
PREFIX ip: <https://wikibase.inguma.eus/prop/>
PREFIX ips: <https://wikibase.inguma.eus/prop/statement/>
PREFIX ipq: <https://wikibase.inguma.eus/prop/qualifier/>
select distinct ?entity ?entityLabel ?testua ?testuaLabel ?rgb
where {
?entity idp:P32 iwb:Q45164; idp:P1 ?wd; rdfs:label ?entitylabel. filter(lang(?entitylabel)="eu")
bind(replace(str(?entitylabel),"\\.[^\\.]*", "") as ?entityLabel)
?entity idp:P92 ?testua.
?testua rdfs:label ?testuaLabel. filter(lang(?testuaLabel)="eu")
bind ("FFFF99" as ?rgb)
}
Entidades mencionadas en el índice de OOCC que no han podido ser encontrados en contexto
Para las entidades mencionadas en este listado no hemos podido encontrar el contexto original.
#title: concepts part of "OOCC índice de nombres" with no found context
PREFIX iwb: <https://wikibase.inguma.eus/entity/>
PREFIX idp: <https://wikibase.inguma.eus/prop/direct/>
PREFIX ip: <https://wikibase.inguma.eus/prop/>
PREFIX ips: <https://wikibase.inguma.eus/prop/statement/>
PREFIX ipq: <https://wikibase.inguma.eus/prop/qualifier/>
select distinct ?entity ?oocc_label ?wikidata
where {
?entity idp:P32 iwb:Q45164; rdfs:label ?oocc_label. filter(lang(?oocc_label)="eu")
filter not exists {?entity ip:P92 ?aipu. ?aipu ipq:P93 ?text. }
optional {?entity idp:P1 ?wd. bind(iri(concat(str(wd:),?wd)) as ?wikidata)}
} group by ?entity ?oocc_label ?wikidata ?aipu
Para las entidades de este listado, no hemos podido encontrar alguno de los contextos originales.
#title: references to "OOCC índice de nombres" entities with no found context
PREFIX iwb: <https://wikibase.inguma.eus/entity/>
PREFIX idp: <https://wikibase.inguma.eus/prop/direct/>
PREFIX ip: <https://wikibase.inguma.eus/prop/>
PREFIX ips: <https://wikibase.inguma.eus/prop/statement/>
PREFIX ipq: <https://wikibase.inguma.eus/prop/qualifier/>
select distinct ?entity ?oocc_label ?agertokia
where {
?entity idp:P32 iwb:Q45164; rdfs:label ?oocc_label. filter(lang(?oocc_label)="eu")
{?entity ip:P92 ?aipu. ?aipu ipq:P80 ?agertokia. } minus {filter not exists {?entity ip:P92 ?aipu. ?aipu ipq:P93 ?text. }}
} group by ?entity ?oocc_label ?agertokia
Entidades mencionadas en OOCC, con denominaciones alternativas
En la primera vuelta, las entidades se han buscado y encontrado en contexto usando la grafía usada en el índice OOCC. Para los que no se pudieron encontrar, se procedió a la definición de nobres alternativos (nombres de artista o grafias alternativas)
#title: alternative entity labels (for finding them in text)
PREFIX iwb: <https://wikibase.inguma.eus/entity/>
PREFIX idp: <https://wikibase.inguma.eus/prop/direct/>
PREFIX ip: <https://wikibase.inguma.eus/prop/>
PREFIX ips: <https://wikibase.inguma.eus/prop/statement/>
PREFIX ipq: <https://wikibase.inguma.eus/prop/qualifier/>
select distinct ?entity ?oocc_label (group_concat(str(?alt_label);SEPARATOR=" | ") as ?bilaketarako)
where {
?entity idp:P32 iwb:Q45164; rdfs:label ?oocc_label. filter(lang(?oocc_label)="eu")
?entity skos:altLabel ?alt_label. filter(lang(?alt_label)="eu")
} group by ?entity ?oocc_label ?bilaketarako
¿Cuántas entidades aparecen en los textos de OOCC?
#title: OOCC-ko lanetan zenbat izendun entitate *ezberdin* aipatzen diren
PREFIX iwb: <https://wikibase.inguma.eus/entity/>
PREFIX idp: <https://wikibase.inguma.eus/prop/direct/>
PREFIX ip: <https://wikibase.inguma.eus/prop/>
PREFIX ips: <https://wikibase.inguma.eus/prop/statement/>
PREFIX ipq: <https://wikibase.inguma.eus/prop/qualifier/>
select distinct ?oocc_item ?wikidata ?oocc_itemLabel (count(distinct ?entity) as ?zenbat_entitate)
where {
?oocc_item idp:P89 ?oocc_id.
?entity idp:P92 ?oocc_item.
optional {?oocc_item idp:P1 ?wd. bind(iri(concat(str(wd:),?wd)) as ?wikidata)}
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],eu,es". }
} group by ?oocc_item ?wikidata ?oocc_itemLabel ?zenbat_entitate order by desc(?zenbat_entitate)
Entidades de OOCC en Wikidata
Personas en el índice de OOCC encontradas en Wikidata
#title: OOCC-ko izendegiko sarrerak, aipamen-kopuruaren arabera, Wikidatako identifikatzaileekin
PREFIX iwb: <https://wikibase.inguma.eus/entity/>
PREFIX idp: <https://wikibase.inguma.eus/prop/direct/>
PREFIX ip: <https://wikibase.inguma.eus/prop/>
PREFIX ips: <https://wikibase.inguma.eus/prop/statement/>
PREFIX ipq: <https://wikibase.inguma.eus/prop/qualifier/>
select distinct ?entity ?entityLabel ?wikidata (count(distinct ?oocc_item) as ?zenbat_artikulutan)
where {
?oocc_item idp:P89 ?oocc_id.
?entity idp:P92 ?oocc_item.
optional {?entity idp:P1 ?wd. bind(iri(concat(str(wd:),?wd)) as ?wikidata)}
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],eu,es". }
} group by ?entity ?entityLabel ?wikidata ?zenbat_artikulutan
order by desc(?zenbat_artikulutan)
Personas en el índice de OOCC encontradas en Wikidata con algún metadato
#title: Wikipedia-aligned OOCC name index
PREFIX iwb: <https://wikibase.inguma.eus/entity/>
PREFIX idp: <https://wikibase.inguma.eus/prop/direct/>
PREFIX ip: <https://wikibase.inguma.eus/prop/>
PREFIX ips: <https://wikibase.inguma.eus/prop/statement/>
PREFIX ipq: <https://wikibase.inguma.eus/prop/qualifier/>
select distinct ?entity ?oocc_label ?wikidata ?wikidataLabel ?wikidata_desc ?jaio (sample(?jaiolekuLabel) as ?jaio_leku) ?jarduerak
where {
?entity idp:P32 iwb:Q45164; rdfs:label ?oocc_label. filter(lang(?oocc_label)="eu")
?entity idp:P1 ?wd. bind(iri(concat(str(wd:),?wd)) as ?wikidata)
SERVICE <https://query.wikidata.org/sparql> {
select ?wikidata ?wikidataLabel ?wikidata_desc ?jaioleku ?jaiolekuLabel ?jaio (group_concat(str(?jarduera); SEPARATOR="; ") as ?jarduerak) where {
?wikidata wdt:P31 wd:Q5.
optional {?wikidata schema:description ?wikidata_desc. filter(lang(?wikidata_desc)="eu")}
optional {?wikidata wdt:P569 ?jaio.}
optional {?wikidata wdt:P19 ?jaioleku}
optional {?wikidata wdt:P106 [rdfs:label ?jarduera]. filter(lang(?jarduera)="eu")}
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],mul,en". }
} group by ?wikidata ?wikidataLabel ?wikidata_desc ?jaio ?jaioleku ?jaiolekuLabel ?jarduerak
}
} group by ?entity ?oocc_label ?wikidata ?wikidataLabel ?wikidata_desc ?jaio ?jaio_leku ?jarduerak
order by ?oocc_label
Artículos de Wikipedia que describen personas listadas en el índice OOCC
#title: Wikipedia articles about people in OOCC name index
PREFIX iwb: <https://wikibase.inguma.eus/entity/>
PREFIX idp: <https://wikibase.inguma.eus/prop/direct/>
PREFIX ip: <https://wikibase.inguma.eus/prop/>
PREFIX ips: <https://wikibase.inguma.eus/prop/statement/>
PREFIX ipq: <https://wikibase.inguma.eus/prop/qualifier/>
select ?entity ?oocc_label (count(distinct ?aipu) as ?zenbat_aipu) ?wikidata ?wikidataLabel ?wikipedia_eu ?wikipedia_es ?wikipedia_en ?wikipedia_fr
where {
?entity idp:P32 iwb:Q45164; rdfs:label ?oocc_label. filter(lang(?oocc_label)="eu")
?entity idp:P1 ?wd. bind(iri(concat(str(wd:),?wd)) as ?wikidata)
?entity ip:P92 ?aipu.
SERVICE <https://query.wikidata.org/sparql> {
select ?wikidata ?wikidataLabel ?wikipedia_eu ?wikipedia_es ?wikipedia_en ?wikipedia_fr where {
?wikidata wdt:P31 wd:Q5.
optional {?wikipedia_eu schema:about ?wikidata. filter(regex(str(?wikipedia_eu), "eu.wikipedia.org"))}
optional {?wikipedia_es schema:about ?wikidata. filter(regex(str(?wikipedia_es), "es.wikipedia.org"))}
optional {?wikipedia_en schema:about ?wikidata. filter(regex(str(?wikipedia_en), "en.wikipedia.org"))}
optional {?wikipedia_fr schema:about ?wikidata. filter(regex(str(?wikipedia_fr), "fr.wikipedia.org"))}
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],mul,en". }
}}
} group by ?entity ?oocc_label ?zenbat_aipu ?wikidata ?wikidataLabel ?wikipedia_eu ?wikipedia_es ?wikipedia_en ?wikipedia_fr
order by desc(?zenbat_aipu)
Lugares de nacimiento de las personas listadas en el índice de OOCC
#defaultView:Map
#title: Birthplaces of wikidata-aligned people in OOCC izendegi
PREFIX iwb: <https://wikibase.inguma.eus/entity/>
PREFIX idp: <https://wikibase.inguma.eus/prop/direct/>
PREFIX ip: <https://wikibase.inguma.eus/prop/>
PREFIX ips: <https://wikibase.inguma.eus/prop/statement/>
PREFIX ipq: <https://wikibase.inguma.eus/prop/qualifier/>
select ?entity ?entityLabel ?wikidata ?label ?jaio_label ?desc ?jaio_data ?jaio_gps ?jpg
where {
?entity idp:P32 iwb:Q45164; rdfs:label ?oocc_label. filter(lang(?oocc_label)="eu")
bind(concat("OOCC izendegian: ",str(?oocc_label)) as ?entityLabel)
?entity idp:P1 ?wd. bind(iri(concat(str(wd:),?wd)) as ?wikidata)
SERVICE <https://query.wikidata.org/sparql> {
select ?wikidata ?label ?jaio_label ?jaio_gps ?jaio_data ?desc ?jpg where {
?wikidata rdfs:label ?label; wdt:P19 [rdfs:label ?jaio_label; wdt:P625 ?jaio_gps]. filter(lang(?label)="en") filter(lang(?jaio_label)="eu")
optional {?wikidata wdt:P569 ?jaio_data.}
optional {?wikidata wdt:P18 ?jpg.}
optional {?wikidata schema:description ?desc. filter(lang(?desc)="en")}
}}
} group by ?entity ?entityLabel ?wikidata ?label ?jaio_label ?desc ?jaio_data ?jaio_gps ?jpg
Para el ejercicio en Prácticas de Traducción II: personas no descritas en la Wikipedia en castellano
Esta consulta produce una lista de los huecos más siginificativos en la Wikipedia castellana: Las personas del índice de nombres en OOCC que sí que tienen artículo de Wikipedia en euskera, pero no en castellano.
#title: OOCC name index people with Basque Wikipedia article, but without Spanish Wikipedia article
PREFIX iwb: <https://wikibase.inguma.eus/entity/>
PREFIX idp: <https://wikibase.inguma.eus/prop/direct/>
PREFIX ip: <https://wikibase.inguma.eus/prop/>
PREFIX ips: <https://wikibase.inguma.eus/prop/statement/>
PREFIX ipq: <https://wikibase.inguma.eus/prop/qualifier/>
select ?entity (count(distinct ?aipu) as ?zenbat_aipu) ?wikidata ?wikidataLabel ?jaio_leku ?jaio_urte ?wikipedia_eu ?wikipedia_es ?wikipedia_en ?wikipedia_fr
where {
?entity idp:P32 iwb:Q45164; rdfs:label ?oocc_label. filter(lang(?oocc_label)="eu")
?entity idp:P1 ?wd. bind(iri(concat(str(wd:),?wd)) as ?wikidata)
?entity ip:P92 ?aipu.
SERVICE <https://query.wikidata.org/sparql> {
select ?wikidata ?wikidataLabel ?jaio_leku (year(?jaio_data) as ?jaio_urte) ?wikipedia_eu ?wikipedia_es ?wikipedia_en ?wikipedia_fr where {
?wikidata wdt:P31 wd:Q5.
?wikipedia_eu schema:about ?wikidata. filter(regex(str(?wikipedia_eu), "eu.wikipedia.org"))
filter not exists {?wikipedia_es schema:about ?wikidata. filter(regex(str(?wikipedia_es), "es.wikipedia.org"))}
optional {?wikipedia_en schema:about ?wikidata. filter(regex(str(?wikipedia_en), "en.wikipedia.org"))}
optional {?wikipedia_fr schema:about ?wikidata. filter(regex(str(?wikipedia_fr), "fr.wikipedia.org"))}
optional {?wikidata wdt:P19 [rdfs:label ?jaio_leku]. filter(lang(?jaio_leku)="eu")}
optional {?wikidata wdt:P569 ?jaio_data.}
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],mul,en". }
}}
} group by ?entity ?zenbat_aipu ?wikidata ?wikidataLabel ?jaio_leku ?jaio_urte ?wikipedia_eu ?wikipedia_es ?wikipedia_en ?wikipedia_fr
order by desc(?zenbat_aipu)