Jump to content

Wikidata:Modelo de datos

From Wikidata
This page is a translated version of the page Wikidata:Data access and the translation is 92% complete.

Wikidata para desarrolladores: acceso a datos




Wikidata contiene actualmente más de 110 millones de elementos y más de 1,3 millones de lexemas, y estos números seguirán creciendo. Hay muchos métodos disponibles para acceder a todos esos datos, y este documento los expone y ayuda a los posibles usuarios a elegir el mejor método para satisfacer sus necesidades.

Es crucial elegir un método de acceso que te proporcione los datos que necesitas de la forma más rápida y eficiente, sin sobrecargar innecesariamente Wikidata; esta página está aquí para ayudarte a hacerlo.

Antes de empezar

Usando los datos de Wikidata

Nuestro logo

Wikidata ofrece un amplio abanico de datos sobre nuestro universo al tiempo que enlaza a otras bases de datos. Los datos se publican bajo la licencia de «Dedicación al dominio público» CC0. Cualquier persona puede editarla, y es la comunidad de editores de Wikidata la que la mantiene.

Los cambios en las API y en los formatos de datos empleados para acceder a Wikidata están sujetos a la Política de Interfaz Estable. Los cambios en las interfaces estables se anunciarán apropiadamente. Tenga en cuenta que no todas las fuentes de datos mencionadas en esta página se consideran interfaces estables.

Proyectos de Wikimedia

Este documento trata sobre el acceso a datos desde fuera de los proyectos Wikimedia. Si necesitas presentar datos de Wikidata en otro proyecto Wikimedia, donde puedes emplear funciones de analizador sintáctico, Lua y/u otros métodos sólo internos, consulta Cómo usar datos en proyectos Wikimedia.

Buenas prácticas en materia de datos

Voluntarios como estas personas —y usted— hacen posible Wikidata.

Wikidata le ofrece sus datos de manera libre y sin requisitos de atribución, bajo CC-0. Sin embargo, apreciaríamos mucho si mencionara Wikidata como el origen de sus datos. Esto nos permitirá garantizar que el proyecto permanezca por mucho tiempo y le proporcione datos actualizados y de alta calidad. También promocionaremos los mejores proyectos utilizando los datos de Wikidata. Algunos ejemplos para atribuir Wikidata: "Proporcionado por Wikidata", "Proporcionado por Wikidata Tags", "Proporcionado por datos de Wikidata", "Proporcionado por la magia de Wikidata", "Utiliza datos de Wikidata", "Con datos de Wikidata", "Datos de Wikidata", "Fuente: Wikidata", "Incluye datos de Wikidata", ... También puede usar uno de los archivos prefabricados de nosotros.

Some examples for attributing Wikidata: "Powered by Wikidata", "Powered by Wikidata data", "Powered by the magic of Wikidata", "Using Wikidata data", "With data from Wikidata", "Data from Wikidata", "Source: Wikidata", "Including data from Wikidata" and so forth. You can also use one of our ready-made files.

Puede utilizar el logotipo de Wikidata (ver arriba), pero no debe hacerlo de ninguna manera que implique el respaldo de Wikidata o de la Fundación Wikimedia.

Por favor, ofrezca a sus usuarios una forma de reportar problemas en los datos y encuentre la forma de regresar esto a la comunidad de editores de Wikidata. Actualmente estamos trabajando en la racionalización de este proceso. Hasta entonces, anuncie dónde recopila los problemas en el chat del proyecto.

Mejores prácticas de acceso

Al acceder a los datos de Wikidata, observa las siguientes mejores prácticas:

  • Sigue la política User-Agent – envía una buena cabecera User-Agent.
  • Sigue la política del robot: envía Accept-Encoding: gzip,deflate y no hagas demasiadas peticiones a la vez.
  • Si recibes una respuesta 429 Demasiadas solicitudes, deja de enviar más solicitudes durante un tiempo (consulta la cabecera de respuesta Retry-After)
  • Cuando esté disponible (como con el servicio de consulta Wikidata), establece el tiempo de espera más bajo que tenga sentido para tus datos.
  • Cuando utilices la API de acciones de MediaWiki, haz un uso generoso del parámetro maxlag y consulta el resto de directrices establecidas en API:Etiquette.


Buscador

¿Qué es esto?

Wikidata ofrece un índice de Elasticsearch para las búsquedas tradicionales a través de sus datos: Special:Search

¿Cuándo usarlo?

Utiliza la búsqueda cuando necesites buscar una cadena de texto, o cuando conozcas los nombres de las entidades que estás buscando pero no las entidades exactas en sí mismas. También es adecuada para casos en los que puedes especificar tu búsqueda basándote en algunas relaciones muy simples en los datos.

No utilices la búsqueda cuando las relaciones en tus datos se describan mejor como complejas.

Detalles

Puedes hacer tu búsqueda más potente con estas palabras clave adicionales específicas de Wikidata: haswbstatement, inlabel, wbstatementquantity, hasdescription, haslabel. Esta funcionalidad de búsqueda está documentada en la página de la extensión CirrusSearch. También tiene su propia acción API.

Interfaz de datos enlazados (URI)

¿Qué es esto?

La interfaz de datos enlazados proporciona acceso a entidades individuales a través de URI: http://www.wikidata.org/entity/Q???. Tales URI se denominan URI de concepto. Tenga en cuenta que las URI de concepto utilizan HTTP, no HTTPS.

¿Cuándo usarlo?

Utiliza la interfaz de datos enlazados cuando necesites obtener entidades individuales y completas que ya conozcas.

No lo utilices cuando no tengas claro qué entidades necesitas –&nbspprimero intenta buscar o consultar. Tampoco es adecuado para solicitar grandes cantidades de datos.

Detalles

Conoce Q42

Cada elemento o propiedad posee un URI persistente que se obtiene al añadir su ID (tales como Q42 o P12) al espacio de nombres de conceptos de Wikidata:

El espacio de nombres para los datos de Wikidata sobre entidades es de https://wikidata.org/wiki/Special:EntityData.

Agregar el ID de una entidad a este prefijo crea la forma "abstracta" (formato neutral) de la URL de datos de la entidad. Cuando solicita la URL Special:EntityData, la página especial aplica negociación de contenido para determinar el formato de salida de Wikidata. Lo más probable es que haya abierto la URL en un navegador web normal, y se mostrará una página HTML de los datos de Wikidata sobre la entidad, porque un navegador web prefiere HTML sobre otros formatos. Los clientes de datos vinculados recibirían los datos de Wikidata sobre la entidad en un formato diferente como JSON o RDF, dependiendo del encabezado HTTP $accept-field de su solicitud.

Por ejemplo, tomemos este concepto URI para Douglas Adams: – es una referencia a la persona del mundo real, no a la descripción concreta de Wikidata:
http://www.wikidata.org/entity/Q42
Como ser humano con ojos y un navegador, es probable que quieras acceder a los datos sobre Douglas Adams utilizando el concepto URI como URL. Al hacerlo, se activa una redirección HTTP y se redirige al cliente a la URL de datos que contiene los datos de Wikidata sobre Douglas Adams: https://www.wikidata.org/wiki/Special:EntityData/Q42.

Cuando necesita evitar la negociación de contenido, por ejemplo, para ver contenido no HTML en un navegador web, puede especificar el formato de los datos de la entidad añadiendo la extensión correspondiente a la URL de datos; algunos ejemplos son .json, .rdf, .ttl, .nt o .jsonld. Por ejemplo, https://www.wikidata.org/wiki/Special:EntityData/Q42.json muestra el elemento Q42 en formato JSON.

Salida RDF menos verbosa

Por defecto, los datos RDF que devuelve la interfaz de datos enlazados pretenden ser completos en sí mismos, por lo que incluyen descripciones de otras entidades a las que hacen referencia. Si deseas excluir esa información, puedes añadir el parámetro de consulta ?flavor=dump a la(s) URL(s) que solicites.

Al agregar &flavor= a la URL, puedes controlar exactamente qué tipo de datos se devuelven.

  • ?flavor=dump: Excluye las descripciones de las entidades a las que se hace referencia en los datos.
  • ?flavor=simple: Proporciona sólo afirmaciones veraces (afirmaciones mejor valoradas sin calificativos ni referencias), junto con enlaces a sitios web e información sobre versiones.
  • ?flavor=full (default): Un argumento"completo" devuelve todos los datos. (No es necesario especificar esto porque es el predeterminado.)

Si deseas una visión más profunda de lo que cada opción implica exactamente, puedes echar un vistazo al código fuente.

Revisiones y almacenamiento en caché

Puedes solicitar revisiones específicas de una entidad con el parámetro de consulta de revision: https://www.wikidata.org/wiki/Special:EntityData/Q42.json?revision=112.

Los siguientes formatos de URL son utilizados por la interfaz de usuario y por el actualizador del servicio de consulta, respectivamente, por lo que si utilizas uno de los mismos formatos de url hay una buena probabilidad de que obtengas respuestas más rápidas (caché):

Servicio de consultas de Wikidata

¿Qué es esto?

El Servicio de consultas de Wikidata (WDQS) es el punto final SPARQL propio de Wikidata. Retorna los resultados de las consultas realizadas en el lenguaje de consulta SPARQL: https://query.wikidata.org

¿Cuándo usarlo?

Utiliza WDQS cuando sólo conozcas las características de los datos deseados.

No utilices WDQS para realizar búsquedas de texto o difusas – FILTER(REGEX(...)) es un antipatrón. (Utiliza la búsqueda en estos casos).

WDQS tampoco es adecuado cuando es probable que los datos deseados sean grandes, un porcentaje sustancial de todos los datos de Wikidata. (Considera el uso de un volcado en tales casos).

Detalles

Puede consultar los datos en Wikidata a través de nuestro punto final SPARQL, el Servicio de consultas de Wikidata. El servicio se puede utilizar como una interfaz web interactiva, o programáticamente al enviar las solicitudes GET o POST a https://query.wikidata.org/sparql. Los datos RDF pueden ser alternativamente accesos a través de una interfaz de Fragmentos de Datos Vinculados [1] en https://query.wikidata.org/bigdata/ldf. Consulte el manual de usuario y las páginas de la comunidad locales para más información.

El servicio de consultas se utiliza mejor cuando el conjunto de resultados previsto tiene un alcance limitado, es decir, cuando se tiene una consulta de la que se está seguro que especifica con precisión el conjunto de datos resultante. Si tu idea del conjunto de resultados está menos definida, el tipo de trabajo que realizarás con el servicio de consultas se parecerá más a una búsqueda; con frecuencia, primero tendrás que realizar este tipo de trabajo relacionado con la búsqueda para afinar tu consulta. Véase la sección Buscar.

The query service at query.wikidata.org only contains the main graph of Wikidata. The Items related to scholarly articles are in a separate query service at query-scholarly.wikidata.org. For more details see Wikidata:SPARQL query service/WDQS graph split.

Punto final de fragmentos de datos enlazados

¿Qué es esto?

El punto final de fragmentos de datos enlazados (LDF) es un método más experimental de acceder a los datos de Wikidata especificando patrones en tripletas: https://query.wikidata.org/bigdata/ldf. El cálculo se realiza principalmente en el lado del cliente.

¿Cuándo usarlo?

Utiliza el punto final LDF cuando puedas definir los datos que buscas utilizando patrones triples, y cuando tu conjunto de resultados sea probablemente bastante grande. Es conveniente utilizar este punto final cuando se dispone de una potencia de cálculo considerable.

Dado que es experimental, no utilices el punto final LDF si necesitas un punto final absolutamente estable o un conjunto de resultados rigurosamente completo. Y, como ya se ha mencionado, utilízalo solo si tienes suficiente potencia de cálculo, ya que el punto final LDF descarga el cálculo en el lado del cliente.

Detalles

Si dispones de información parcial sobre lo que buscas, como cuando tienes dos de los tres componentes de tu(s) tripleta(s), puedes encontrar lo que buscas utilizando la interfaz de fragmentos de datos enlazados en https://query.wikidata.org/bigdata/ldf. Consulta el manual de usuario y las páginas de la comunidad para obtener más información.

API REST de Wikibase

¿Qué es esto?

La API REST de Wikibase es una interfaz basada en OpenAPI que permite a los usuarios interactuar, recuperar y editar elementos y declaraciones en instancias de Wikibase – incluyendo por supuesto Wikidata: API REST de Wikidata

¿Cuándo usarlo?

La API REST de Wikibase todavía está en desarrollo, pero para Wikidata está pensada a reemplazar funcionalmente la API de Acción, ya que es una interfaz dedicada hecha sólo para Wikibase/Wikidata.

Los casos de uso para la API de Acción también se aplican a la API REST de Wikibase. Utilízala cuando tu trabajo implique:

  • Editar Wikidata
  • Obtener datos directos sobre las propias entidades

No utilices la API REST de Wikibase cuando sea probable que tu conjunto de resultados sea grande. (Considera usar un volcado en esos casos).

Es preferible no utilizar la API REST de Wikibase cuando necesites acotar aún más el resultado de tu solicitud a la API. En tales casos, es mejor enmarcar tu trabajo como una búsqueda (para Elasticsearch) o una consulta (para WDQS).

Detalles

La API REST de Wikibase tiene documentación OpenAPI usando Swagger. También puedes consultar la documentación para desarrolladores.

API de acción de MediaWiki

¿Qué es esto?

La API de Wikidata es la propia API de Acción de MediaWiki, ampliada para incluir algunas acciones específicas de Wikibase: https://wikidata.org/w/api.php

¿Cuándo usarlo?

Utiliza la API cuando tu trabajo involucre:

  • Editar Wikidata
  • Obtener datos sobre las entidades mismas, como su historial de revisiones
  • Obtener todos los datos de una entidad en formato JSON, en pequeños grupos de entidades (hasta 50 entidades por solicitud).

No utilices la API cuando sea probable que tu conjunto de resultados sea grande. (Considere la posibilidad de utilizar un volcado en tales casos).

La API tampoco es adecuada para situaciones en las que se desea solicitar el estado actual de entidades en JSON. (Para estos casos, considera el uso de la interfaz de datos enlazados, que es más probable que proporcione respuestas más rápidas).

Por último, probablemente sea una mala idea utilizar la API cuando necesites acotar aún más el resultado de tu solicitud a la API. En tales casos, es mejor enmarcar tu trabajo como una búsqueda (para Elasticsearch) o una consulta (para WDQS).

Detalles

La API de acción de MediaWiki utilizada para Wikidata está meticulosamente documentada en la página de la API de Wikidata. Puedes explorar y experimentar con ella usando el API Sandbox.

Existen múltiples puntos finales específicos de Wikibase. Estos son algunos ejemplos de solicitudes:

Bots

Damos la bienvenida a los bots que se comporten bien

También es posible acceder a la API mediante el uso de un bot. Consulte Wikidata:Bots para más información.

Flujo de cambios recientes

¿Qué es esto?

El flujo de Cambios recientes proporciona un flujo continuo de cambios de todos los wikis de Wikimedia, incluido Wikidata: https://stream.wikimedia.org

¿Cuándo usarlo?

Utiliza el flujo de cambios recientes cuando tu proyecto requiera que reacciones a los cambios en tiempo real o cuando necesites todos los cambios más recientes procedentes de Wikidata – por ejemplo, cuando ejecutes tu propio servicio de consultas.

Detalles

El flujo de cambios recientes contiene todas las actualizaciones de todas las wikis que utilizan el protocolo de eventos enviados por el servidor. Tendrás que filtrar las actualizaciones de Wikidata en el lado del cliente.

Puedes encontrar la interfaz web en stream.wikimedia.org y leer todo sobre ella en la página EventStreams.

Wikidata Vector Database

¿Qué es esto?

The Wikidata Vector Database stores high-dimensional vector representations of Wikidata entities. It enables semantic search based on meaning and context rather than keyword matching, and supports natural-language queries against entities.

¿Cuándo usarlo?

Use vector search for exploration purposes, for example, when you want to uncover entities without explicitly knowing their labels, or when you need to narrow a search down to a smaller, more relevant subgraph of Wikidata as a starting point for further research before moving on to more structured tools.

The vector database can also be used in AI/ML pipelines, such as enabling semantic search in RAG workflows or applying vector distances to tasks like classification and other types of analysis.

Detalles

You can find more information on the Wikidata Vector Database page. The Wikidata Vector Database is available at wd-vectordb.wmcloud.org, and the API documentation can be found at wd-vectordb.wmcloud.org/docs.


Wikidata MCP

Main page: Wikidata:MCP

¿Qué es esto?

The Wikidata MCP (Model Context Protocol) provides a set of standardized tools that allow large language models (LLMs) to explore and query Wikidata programmatically. It is designed for agentic AI or AI workflows that need to search, inspect, and query Wikidata, without relying on hardcoded assumptions about its structure or content.

¿Cuándo usarlo?

Use the Wikidata MCP when you want to integrate Wikidata directly into a GenAI model or into AI/ML workflows. The MCP provides a set of tools for exploring and accessing Wikidata, but it is limited to read-only use and does not include editing functionality.

Detalles

The Wikidata MCP is implemented as an HTTP service available at wd-mcp.wmcloud.org. To use it, add https://wd-mcp.wmcloud.org/mcp/ as a connector in your AI client.

Volcados

¿Qué es eso?

Los volcados de Wikidata son exportaciones completas de todas las entidades de Wikidata: https://dumps.wikimedia.org

¿Cuándo usarlo?

Utiliza un volcado cuando el conjunto de resultados vaya a ser muy grande. El volcado también es importante para configurar tu propio servicio de consulta.

No utilices un volcado si necesitas datos actuales: los volcados tardan mucho tiempo en exportarse y aún más en sincronizarse con tu propio servicio de consulta. Los volcados tampoco son adecuados cuando tienes limitaciones importantes de ancho de banda, espacio de almacenamiento y/o potencia de cálculo.

Detalles

Si los registros que necesitas recorrer son muchos, o si es probable que tu conjunto de resultados sea muy grande, es el momento de plantearte trabajar con un volcado de la base de datos: (enlace al último volcado completo).

Encontrarás documentación detallada sobre todos los volcados de Wikimedia en la página "Volcados de datos" de Meta y sobre los volcados de Wikidata en particular en la página de descarga de la base de datos.

Herramientas

Servicio de consultas local

No es tarea fácil conseguir un volcado de Wikidata e implementar las herramientas anteriores para trabajar con él, pero puedes dar un paso más. Si tienes la capacidad y los recursos para hacerlo, puedes alojar tu propia instancia del Servicio de Consulta de Wikidata y consultarlo tanto como quieras, sin competir con ningún otro.

Para configurar tu propio servicio de consultas, sigue estas instrucciones del equipo del servicio de consultas, que incluyen la obtención de tu propia copia local de los datos. También puedes encontrar información útil en la entrada del blog de Adam Shorland sobre el tema.