Wat zijn de criteria voor data op Wikidata?

leestijd: 4 min

Om vrije bruikbaarheid van de database te garanderen, hanteert de Wikidata-gemeenschap een aantal criteria. Als je als organisatie data wilt toevoegen, moet deze data hieraan voldoen. Uitleg over de belangrijkste punten vind je verderop in dit artikel.

Data op Wikidata is: 

  • Vrij: vrijgegeven onder de Creative Commons Public Domain Mark (CC-0) 
  • Relevant: je data beschrijft duidelijk identificeerbare concepten of materiële entiteiten die nuttig zijn in de context van een generieke kennisbank over de wereld.
  • Verifieerbaar: Wikidata is een secundaire database, die verwijst naar andere betrouwbare en gepubliceerde bronnen.  
  • Bewerkbaar:  Wikidata is evenals de andere Wikimedia-projecten door iedereen overal te bewerken. Als organisatie moet je er dus rekening mee houden dat je data gewijzigd en verbeterd kan worden. 
  • Onderhouden: Wikidata is een levende database, geen statische data-dump van gegevens. Data aanwezig op het platform wordt onderhouden. 

Vrije data onder Creative Commons Publiek Domein verklaring  #

Als je als organisatie data gaat toevoegen aan Wikidata, dan dien je deze data vrij te geven onder een Creative Commons Publiek Domein verklaring (CC-0). Hiermee doe je afstand van je recht om aanspraak te maken op eventuele auteursrechten die je als organisatie mogelijk hebt op de data, en geef je aan dat je deze rechten ook nooit meer gaat claimen. 

Je data wordt daarmee vrij van alle auteursrechten, en daardoor herbruikbaar en bewerkbaar. Hierdoor kan je data zo wijd mogelijk verspreid worden. Iedereen kan je data gebruiken voor elke doeleinde, b.v. voor onderwijs maar ook commercieel.

De CC-O verklaring vereist ook geen naamsvermelding. Met een verplichting tot naamsvermelding is het gebruiken en combineren van data met andere bronnen bijna onmogelijk.  

Relevantie #

Data toegevoegd aan Wikidata moet relevant zijn; de data moet verwijzen naar een duidelijk afgebakend, in bronnen beschreven concept, en/of moet bruikbaar zijn op een van de verschillende Wikimedia-projecten. Deze relevantie van de informatie op Wikidata dient twee doelen: 

  1. Wikidata kan dienen als algemene kennisbank voor de hele wereld 
  2. Wikidata wordt gebruikt als centrale plek voor links naar de verschillende taalversies van Wikipedia en Wikimedia-projecten. 

Een item mag worden alleen worden toegevoegd aan Wikidata als het op zijn minst een van deze twee genoemde doelen dient, en als het voldoet aan één van de hieronder genoemde criteria. 

Het item:  

  • verwijst naar een duidelijk identificeerbare conceptuele of materiële eenheid (gebouw, persoon, planten- of diersoort, boek, gebeurtenis etc.). Deze eenheid moet kunnen worden beschreven door serieuze en publiek toegankelijke bronnen. 
  • bevat minimaal één geldige sitelink naar een pagina op Wikipedia, Wikivoyage, Wikisource, Wikiquote, Wikinews, Wikibooks of Wikimedia Commons
  • vervult een structurele noodzaak, het is bijvoorbeeld nodig om andere items beter bruikbaar te maken (b.v. een boek waarnaar verwezen wordt als referentie bij andere items) 

De criteria hierboven zijn bewust een beetje vaag. Wikidata is een database in ontwikkeling en de criteria bewegen mee met deze ontwikkeling. Kijk voor een nadere omschrijving van
Wikimedia-waardigheid op de Wikidata-notability pagina:
Wikidata:Notability 

Verifieerbaar #

Wikidata is geen database die feiten over de wereld verzamelt, maar is een secundaire kennisbank met een verzameling links en verwijzingen naar bronnen over die kennis. Wikidata zal bijvoorbeeld niet als feit stellen wat het inwonertal van Nederland is, maar geeft aan wat het inwonertal is op basis van een specifieke bron (zoals het World Factbook). Ieder ‘statement’ of ‘eigenschap’ op Wikidata moet dus verwijzen naar een externe, betrouwbare bron, waar die bewering geverifieerd kan worden.

Data op Wikidata kan dus zeker ook meerdere, soms elkaar tegensprekende, waarden hebben volgens verschillende bronnen, b.v. een kunstenaar die volgens verschillende bronnen verschillende geboortedata heeft.  

Koppeling met andere databases #

Wikidata is een kennisbank die de hele wereld wil beslaan. In januari 2022 bevatte Wikidata bijvoorbeeld items over ruim 9 miljoen personen. Om al deze items duidelijk te identificeren en te onderscheiden en om Wikidata als datahub voor andere informatiebronnen te laten fungeren, is autoriteitscontrole een belangrijk onderdeel van de werkzaamheden op Wikidata. 

Wikidata items worden zoveel mogelijk gelinkt met gerespecteerde en gezaghebbende databases. Binnen de kunst- en cultuursector wordt o.a. gerefereerd aan de volgende databases binnen Wikidata: 

  • Mensen en organisaties: Getty’s Union List of Artists Names (ULAN), RKDartists, Virtual International Authority File (VIAF)
  • Plaatsen: Getty’s Thesaurus of Geographic Names (TGN)
  • Concepten en kernwoorden: Getty’s Art and Architecture Thesaurus (AAT)

Bij twijfel; neem contact op!  #

Heb je een dataset maar twijfel je of hij geschikt is voor Wikidata?
Neem contact op met de vrijwilligers van Wikidata en leg het hen voor. 

Wikidata:Projectchat 

Of laat een bericht achter via Facebook. Er is een openbare groep voor erfgoedinstellingen en Wikidata waar je vragen kunt stellen:
https://www.facebook.com/groups/Wikidata.GLAM 

Meer informatie  #

Wikidata:Introduction

Gerelateerde artikelen #

Wat is publiek domein?