Wikidata-IATEXT, WikiCite y Scholia en los Wikidata Days 2019 - Contribución al corpus de datos bibliográficos de Wikidata

· Iván Hernández Cazorla - Blog

Presentación del proyecto Wikidata-IATEXT como oportunidad para demostrar el potencial de Wikidata y WikiCite como corpus de datos bibliográficos.
#conocimiento_libre #wikidata #investigación

Actualización (2024): con la transición al prose.sh, he aprovechado para hacer cambios menores en el estilo.


El 7 de junio presenté durante los Wikidata Days 2019, por primera vez, el proyecto Wikidata-IATEXT en la Nova School of Business and Economics (Nova SBE) de la Universidade Nova de Lisboa. Antes de continuar quiero agradecer a Catarina Reis, de Social Sciences DataLab, y a Miguel Mimoso Correia, de la Teresa Alexandre Soares dos Santos Library, por haberme invitado a este evento en el que tanto y tan bien trabajaron.

# Sobre el proyecto Wikidata-IATEXT

Propuse este proyecto al Instituto de Análisis y Aplicaciones Textuales (IATEXT) de la Universidad de Las Palmas de Gran Canaria (ULPGC) en febrero de 2018. La propuesta inicial consistió, en pocas palabras, en curar datos sobre sus miembros y sus respectivas publicaciones científicas, y estructurararlos en Wikidata para contribuir a la ciencia abierta. La propuesta fue bien recibida por la directiva del IATEXT, por lo que pude comenzar a trabajar al mes siguiente.

La motivación principal del proyecto era contribuir a Wikidata como corpus de datos bibliográficos enlazados. Con esta contribución se podría demostrar el potencial que tiene Wikidata y el conocimiento libre, en general, y los datos científicos abiertos, específicamente. Por supuesto, antes de proponer el proyecto al IATEXT quería saber si alguien más había trabajado masivamente la producción científica de algún instituto de investigación. Tal y como se puede comprobar en la Tabla 1, este trabajo era prácticamente una novedad, por lo que era una buena oportunidad para demostrar el potencial de Wikidata como base de datos libres y de WikiCite a un instituto de investigación de la ULPGC.

Tabla 1. Estado previo
En torno a...
4300 institutos de investigación en Wikidata. 86 institutos de investigación con al menos 1 investigador enlazado con la propiedad «miembro de» (P463)
25 institutos universitarios con al menos una publicación enlazada a uno de sus miembros.

Fue realizado entre marzo y septiembre de 2018, y a pesar de haberse alargado, el proyecto no alcanzó a crear los elementos de todas las publicaciones científicas de los miembros del IATEXT. A pesar de esto, el proyecto ha situado al IATEXT como uno de los institutos universitarios con mayor cantidad de enlace a elemenetos de publicaciones científicas e investigadores. Gracias a estos datos que se han volcado ahora es posible visualizar en Scholia, un servicio web de visualización de los elementos de Wikidata relacionados con el ámbito científico, tanto el IATEXT como organización, sus miembros (por ej., Yolanda Arencibia Santana) y sus respectivas publicaciones científicas (por ej., Lenguas en contacto. El elemento prehispano en el léxico del español hablado en Canarias durante el periodo áureo).

Seguir hablando del proyecto redundaría en las presentaciones realizadas, la ya mencionada en los Wikidata Days 2019 (Portugal) y la presentación oficial a los miembros del IATEXT, realizada el pasado 13 de junio. Además en el apartado «Recursos» de esta misma entrada hay disponibles dos reportes, uno en inglés y otro en español, que aclaran la metodología utilizada y cuáles han sido los resultados. Esos reportes ofrecen datos interesantes, así como las presentaciones, al menos hasta que publiquemos el artículo sobre el proyecto Wikidata-IATEXT.

# Wikidata Days 2019

Cartel horizontal de los Wikidata Days 2019

Wikidata Days 2019 - share, collaborate, transform: shaping data in a changing world. Miguelmcorreia (CC BY SA 4.0 International)

Este evento, al que tuve el placer de ser invitado, fue realizado entre los días 7 y 8 de junio. El programa constaba de dos partes: el primer día, dedicado a las ponencias y presentaciones que abordaban la ciencia abierta y la difusión científica en los proyectos Wikimedia; y el segundo día, durante el que se llevó a cabo un taller de iniciación en Wikidata.

En este evento tuve el placer de conocer a Alessandro Marchetti, wikimedista y miembro de Wikimedia Italia, WikiClassics y WikiDonne, quien fue el principal encargado de dirigir el taller del día 8. Además, presentó una ponencia muy interesante sobre el beneficio mútuo del conocimiento libre los proyectos Wikimedia y el científico. La otra ponencia fue realizada por Helena Patricio, directora del Servicio de Colecciones Especiales de la Biblioteca Nacional de Portugal, quien expuso temas muy interesantes y de incumbencia para todos aquellos que trabajan con bibliotecas, semántica, datos enlazados y Wikidata.

Ese mismo día, Catarina Reis y Miguel Mimoso Correia presentaron su proyecto bajo el título Q392754: Generating Nova SBE scholarly profiles using Wikidata and Scholia – a pilot project. Aunque ya lo sabía previamente por conversaciones que habíamos mantenido, fue muy interesante conocer cómo desarrollaron un proyecto muy similar al nuestro, Wikidata-IATEXT, pero con otro sujeto: una facultad, la NovaSBE.

Lo que más me gustó del taller que realizamos el segundo día fue que, a pesar de que Alessandro Marchetti fue el encargado de dirigirlo, todos los asistentes participamos activamente y aportamos ideas, dudas y soluciones. Fue una actividad muy dinámica en la que todos aprendimos algo y con la que nos quedamos con ganas de más. Cuando finalizó la primera parte, dedicada a la orientación de los participantes por los proyectos involucrados en el taller (Wikidata y Commons), pude sentarme con Catarina Reis y Miguel Mimoso Correia a discutir nuestros proyectos, intercambiar opiniones y resultados, y ayudarnos con cuestiones técnicas. Quiero aprovechar para felicitarles, no solo por haber tenido la iniciativa de organizar el proyecto bajo el auspicio de la biblioteca de su facultad y de Wikimedia Portugal, sino también por los tan buenos resultados que obtuvieron con su proyecto y lo que, junto al nuestro, han demostrado: es imprescindible invertir tiempo y trabajo en contribuir a la ciencia abierta, disponibilizar el conocimiento científico y sus datos bibliográficos, no solo para los científicos, sino para la sociedad en general.

# Wikidata y Commons: el creciente fértil de la ciencia abierta

I Jornadas de Institutos Universitarios de Humanidades en Canarias, realizadas en la Universidad de Las Palmas de Gran Canaria

I Jornadas de Institutos Universitarios de Humanidades en Canarias, realizadas en la Universidad de Las Palmas de Gran Canaria. Santamarcanda (CC BY-SA 4.0 International)

Wikipedia es sin lugar a dudas el proyecto Wikimedia más conocido internacionalmente. Si saliésemos a la calle y preguntásemos por ella, la gran mayoría lo confirmaría. Sin embargo, al menos desde mi punto de vista, el creciente fértil de la ciencia abierta se encuentra en Wikidata y Commons. Ya he escrito suficiente, al menos en esta entrada, del potencial de Wikidata y del interesante objetivo que se propone WikiCite: el uso de esta base de datos como corpus de datos bibliográficos enlazados, abiertos y libres. Pero no puedo permitir cerrar esta entrada sin exponer algunos detalles de la importancia de Commons para la ciencia abierta.

Commons constituye, sin lugar a dudas, la mediateca de archivos libres más grande de la internet. No solo es un proyecto en el que incluso se podrían subir los documentos de artículos, ponencias u otras obras científicas para su libre difusión y uso, sino que también es la plataforma ideal para documentar el ámbito científico: desde los propios investigadores y las instituciones, hasta la realización de su profesión y actividades de dicho ámbito. Y lo mejor, como en cualquier proyecto Wikimedia, es que el trabajo en estos proyectos lo hace la comunidad, voluntariamente o no, para la comunidad.

Por ejemplo, volviendo al IATEXT, cabe destacar el crecimiento y la estructuración que ha desarrollado su categoría en la mediateca libre. Gracias a los voluntarios del proyecto y a la licencia de las fotos que tiene el IATEXT en su Flickr se ha conseguido documentar:

Y creo que ya me he alargado suficiente, ¡más de lo que esperaba! Así que por ahora lo dejaré aquí y quien sabe si más pronto que tarde escribo algo relacionado e interesante sobre Commons.

# Conclusiones

¡Necesitamos más eventos de este tipo! Sea dónde sea, es importante divulgar este tipo de proyectos e iniciativas en pro del conocimiento libre y la ciencia abierta. Los proyectos Wikimedia son un foco de trabajo muy importante que no se debe descuidar y en el que se puede contribuir tanto individual como institucionalmente. Eventos como este permiten difundir tanto los proyectos relacionados con la ciencia abierta y el conocimiento libre, como enseñar a contribuir de una manera amigable, dinámica y sencilla. Son, sin lugar a dudas, un precedente para poder organizar posteriormente un congreso destinado a la ciencia abierta y libre.

¿Cuáles son los pasos a seguir? Continuar el desarrollo de este tipo de proyectos, utilizar los datos curados y demostrar su potencial. También esencial formar con talleres o cursos a los miembros de las instituciones para que contribuyan por sí mismos, directa o indirectamente, a la ciencia abierta.

¡Se me olvidaba! Si has llegado hasta aquí gracias por haber leído esta entrada. Sé que ha sido larga pero me gustaría destacar un último dato: no olvides que el conocimiento libre y los proyectos Wikimedia son posible gracias a ustedes, a la comunidad visible e invisible, anónima o no, y que cualquier puede colaborar, ya sea con documentación multimedia, estructurando datos o mejorando la mayor enciclopedia del mundo. ¡Anímense si no lo están ya! Y si tienen dudas no duden en contactar conmigo, intentaré ayudarles en todo lo que pueda.

# Recursos


Formo parte de Molécula, un grupo de tres cowboys del espacio y alquimistas que programan mucho e intentan contribuir a la comunidad del software libre. Si te gusta lo que escribo o lo que contribuyo, puedes invitarnos a un café, té o maté. ¡Estamos en proceso de liberar varios proyectos!

Todas las entradas de este blog están bajo la licencia CC BY-SA 4.0. Las imágenes y otros recursos que no son de mi autoría tienen especificada su respectiva licencia. En caso de no tenerla, no dudes en reportármelo.

We are a team of three space cowboys and alchemists who develop software and try to contribute to the free software community. If you like what I write or what I contribute, you can invite us for a coffee, tea or maté. I still have have to finish developing several projects and, of course, release them!

All blog posts are licensed under CC BY-SA 4.0. The images or other resources that are not my autorship have their licenses specified. In case there is something it hasn't, don't hesitate to report it to me.