Hopp til innhold

Wikipedia:Wikidata

Fra Wikipedia, den frie encyklopedi
Wikidata-logoen
Wikidata-logoen

Wikidata er et Wikimedia-prosjekt som er en kunnskapsdatabase for Wikipedia, de andre Wikimedia-prosjektene og andre, eksterne nettsteder. Utvikling av Wikidata har gått i flere steg, hvor første steg besto av innsamling av språklenkene (også kalt interwikilenkene), som ble samlet på Wikidata fremfor å ligge lokalt på hver enkelt utgave av Wikipedia. Senere steg er å utvide Wikidata til å holde utsagn om de omtalte elementene. Disse tilsvarer sider på Wikipedia. Det finnes også en god del oppføringer på Wikidata som ikke har motstykke på Wikipedia.

Hvordan legge til språklenker/interwiki

[rediger kilde]

Se Wikipedia:Interwiki

Hvordan endre signaturseksjonen til et eksisterende element

[rediger kilde]

Den øverste seksjonen på en side med et element inne på Wikidata er det som omtales som signaturseksjonen. Denne inneholder det som identifiserer elementet. Selve identifikatoren til et element er Q-iden, men det finnes også en etikett, beskrivelse og alias. Disse er tilgjengelig på flere språk. I tillegg finnes det nettstedlenker som også kan brukes til å identifisere et element, men disse gis spesiell behandling.

For å åpne signaturseksjonen for redigering finnes det en lenke [rediger] oppe til høyre. Klikker du på denne lenka så åpnes hele signaturseksjonen for redigering.

Et elements etikett (label) er ikke en unik identifikasjon, den vil identifisere alle sider som har denne etiketten. For eksempel finnes det flere steder som heter Oslo, slik et oppslag på siden d:Special:ItemDisambiguation/nb/Oslo viser. En etikett er språkspesifikk, slik at oppslag på andre språk kan gi andre svar enn på bokmål. Etiketten kan brukes sammen med beskrivelsen for å gi en unik identifikasjon, men dette har som oftest mindre betydning i normal bruk. Et særtilfelle finnes hvis et element blir identifisert fra et annet og det første er «nær» det andre elementet. I disse tilfellene kan etiketten brukes som unik identifikasjon. Det gjør at etiketten for «Oslo» gir elementet for hovedstaden i Norge hvis landet er konteksten for spørringen.

Etiketten til en egenskap er definert litt annerledes enn et element. For et vanlig element er etiketten normalt utilstrekkelig identifikasjon, men for en egenskap er den tilstrekkelig. Vanligvis spiller ikke den lille forskjellen noen rolle, men den gjør at vi kan bruke navngitte egenskaper i oppslag. Fordi etiketter kan være utsatt for tilfeldige endringer så brukes vanligvis P-ider og ikke etiketter når de skal aksesseres i maler.

Hvis du skal redigere etiketten uten bruk av Javascript så finnes det en side d:Special:SetLabel.

Et elements beskrivelse (description) skal klargjøre hva elementet omhandler. Beskrivelsen er språkspesifikk, og det er ingen krav om at oversettelser mellom språk skal følge hverandre. Det er nok likevel slik at de følger hverandre nokså tett. Når beskrivelsen brukes sammen med en etikett så skal det gi en unik identifikasjon. Dette er med på å sikre at elementer ikke omtaler det samme.

Hvis du skal redigere beskrivelsen uten bruk av Javascript så finnes det en side d:Special:SetDescription.

Et element har kallenavn (aliases) som er alternative navn. For eksempel er byen Oslo også kalt «Christiania» og «Kristiania», og Trondheim er også kalt «Nidaros» og «Trondhjem». For å fange opp dette kan disse navnene listes som kallenavn. Mange av navnene som listes i dette feltet er omdirigeringer på skrivefeil, og disse er vanligvis ikke ønsket på Wikidata. Det finnes ingen grense for hvor mange kallenavn som kan tas med, men det en tommelfingerregel er at navn som er i bruk eller som har vært vanlige tas med. Grunnen til at så mange av dem er tatt med er at de ble inkludert ukritisk av noen tidligere script.

Hvis du skal redigere kallenavn uten bruk av Javascript så finnes det en side d:Special:SetAliases.

Hvordan legge til utsagn om elementer

[rediger kilde]

Elementer gis utsagn på Wikidata, og dette tilsvarer omtale i artikler på Wikipedia. Slike utsagn omhandler en egenskap og dennes tilordnede verdi. Forskjellige egenskaper har forskjellig type verdi. Noen typer viser til konkrete verdier, og noen til andre elementer. Egenskapene kan ha tilordnede føringer som begrenser hvordan de kan brukes.

For å legge til nye utsagn så bruker du lenka [legg til] under seksjonen «Utsagn». Hver gang du klikker på denne så lages det et nytt tomt utsagn. Når du er ferdig og lagrer så flyttes det nye utsagnet inn blant de andre, og hvis det allerede finnes tilsvarende utsagn så flyttes det inn i denne gruppen. Hvis det allerede finnes en gruppe utsagn av samme type så vil det finens en [legg til] nederst i denne. Hvis du bruker lenka under seksjonen så må du spesifisere egenskapen som skal brukes, men bruker du lenka i en eksisterende gruppe så er egenskapen den samme som i gruppen.

Egenskaper har forskjellig type, og om du har valgt feil egenskap så gir ofte feltet en feilmelding når du fyller det inn eller lagrer. På siden d:Special:ListProperties finnes en oversikt over alle egenskapene som er tilgjengelig, mens på d:Special:ListDatatypes finnes en oversikt over alle datatypene som brukes i egenskapene.

Når egenskaper brukes i et utsagn så sier de ikke bare noe om verdien, det du fyller inn, men også elementet hvor det er brukt. Legger du til et utsagn som lenker til et kommunestyre, så impliserer det at siden antakelig er om en kommune. Egenskapen gir typeinformasjon både om elementet hvor den brukes og om elementet den lenker til. Dette brukes sammen med annen informasjon til å lage oversikter over hvilken egenskaper som er brukt feil. Du kan teste elementer på siden d:Special:ConstraintReport. Skal du teste for eksempel elementet til Norge så fyller du inn «Q20» som er dette elementets Q-id. Rapprten vil da bli som på Norge (Q20).

Utsagn kan også ha utsagn om det primære utsagnet, såkalte kvalifikatorer. Disse er ikke annet enn miniutsagn som kommer i en litt forenklet utgave, og som omhandler selve utsagnet i konteksten til elementet. For å legge til slike så åpner du det primære utsagnet for redigering. Det vil da bli tilgjengelig en lenke [Legg til kvalifikator] samtidig som de eksisterende kvalifikatorene åpnes for redigering.

Utsagn, og deres kvalifikatorer, har referanser. Disse skal dokumentere det som står i utsagnet og eventuelle kvalifikatorer. Det er ikke slik at en referanse skal dokumentere utsagnet og alle kvalifikatorer på en gang, men alle referanser bør tilsammen dokumentere utsagnet og kvalifikatorene. For å legge til referanser klikker du på lenka der det står [tall referanse[r]]. Det vil da bli tilgjengelig en lenke [legg til referanse]. Du må eksplisitt åpne hver enkelt referanseseksjon for redigering. Når de er åpnet for redigering så legger du til utsagn på samme måte som tidligere.

Referanser har en dobbeltrolle som kilde, og fordi Wikidata omhandler data så gjør det at disse oppføringene kan peke til datastrukturer. Hva som utgjør siteringen kan derfor være litt uklart.

Hvordan endre tilgjengelig språk

[rediger kilde]

Når du kommer inn på et element på Wikidata så er standardspråket engelsk, hvis du ikke kommer fra et språkspesifikt Wikimedia-prosjekt. I de siste tilfellene beholdes vanligvis det gjeldende språket. Dette kan endres via språklenken oppe til venstre for dine private lenker. Sett denne til det språket du foretrekker. Dette språket vil beholdes gjennom sesjonen, eller når du er innlogget på samme kontoen. Språkvalget på Wikidata har ikke konsekvenser for språkvalg på andre Wikimedia-prosjekt.

Språkvalg på de fleste Wikimedia-prosjektene vil kun påvirke innpakningen av innholdet, det som kalles «chrome», mens selve innholdet beholdes på prosjektets definerte språk. På Wikidata endres hele siden, også innholdet. Det betyr at noe innhold kan forsvinne. Blant annet i signatur-seksjonen kan enkelte linjer bli borte eller bli lagt til.

Noen språkvalg for utsagn på spesielle språk, eller i signaturseksjonen, kommer fra Babel-bokser du setter opp på din brukerside. Hvis du ikke er innlogget, eller ikke har satt opp Babel-bokser, så får du standardvalg utfra språket du har valgt for sidevisning. Disse standardvalgene er ofte nokså tilfeldige, så er du ofte på Wikidata så lag brukerkonto og sett opp Babel-bokser.

Hvis du lurer på hvilke språk du har satt opp, og hvordan de kjedes sammen, så kan du gå til siden d:Special:MyLanguageFallbackChain. Du vil da få en liste av hvordan denne ser ut, og hvordan de enkelte språkene erstatter hverandre.

Hvordan lage maler

[rediger kilde]

Verdier fra utsagn i elementer kan hentes inn og brukes i maler. Dette gjøres enten ved hjelp av parserfunksjonen {{#property}} eller via Luascript. Det krever vanligvis mindre endring av eksisterende maler å bruke parserfunksjonen, men den er mindre fleksibel enn et Luascript. Svært ofte ender en også med mer skreddersøm om det brukes scripting, ikke minst fordi en lett ender med spesielle løsninger for spesifikke egenskaper. Dette er også en av grunnene til at en ønsker å bruke scripting, nettopp fordi en må gjøre spesifikke tester for å sjekke om dataene er gyldige.

I det etterfølgende er det antatt at arbitrary access er tilgjengelig. Dette er nå påslått på alle prosjekter i Wikimedia-universet, men det er ikke gitt at det er påslått for eksterne wikier.

Parserfunksjonen {{#property}} tar to argumenter; egenskapen til utsagnene som skal hentes inn og elementet som skal være kilden for utsagnene. Det er kun egenskapen som er filtermekanisme, det betyr at alt som er tilgjengelig i elementet og som bruker denne egenskapen hentes inn. For å presentere dette bruker parserfunksjonen en listeform som er gitt av språkdefinisjonene. Det finens ingen ytterligere formateringsmuligheter (Når dette skrives 18. sep. 2015 kl. 18:27 (CEST)). Egenskapen kan angis med P-id og ved etiketten til egenskapen. For eksempel er både «P17» og «land» godtatte identifikatorer på bokmål.

Hvis det ikke er angitt hvilke element som skal brukes, så brukes det elementet som er koblet til siden. Når parserfunksjonen brukes på en side i hovedrommet så er dette svært ofte det riktige elementet. Det er mulig å angi at et annet element skal brukes, for eksempel i navigasjonsmaler. For å hente data fra et eksplisitt element brukes from som i {{#property:P17|from=Q64}}, eller {{#property:land|from=Q64}}. I dette tilfellet vil kallet bli erstattet med «Tyskland». Her finnes det ingen kontekst for spørringen og «Berlin» alene er tvetydig.

Ytterligere informasjon om parserfunksjonen finnes på mw:Wikibase/Notes/Inclusion syntax.

Luascript aksesseres via parserfunksjonen {{#invoke}}. Denne tar en henvisning til et script som ligger på en side i modulrommet, og en henvisning til en funksjon som er beskrevet på denne siden. Et slikt script kan gjøre svært mye som ikke er mulig i parserfunksjonen {{#property}}, men det kommer med en kostnad. Slike script er kompliserte og få på dette prosjektet kan vedlikeholde dem. Det er ikke slik at disse scriptene er vedlikeholdsfrie, hver gang det blir gjort endringer i datamodellen forplanter disse endringene seg ut i samtlige script.

Det er noe støtte for funksjoner som støtter forenklede oppslag, og disse bør brukes der det er mulig. For eksempel gir mw.wikibase.getEntityObject() alt av data i elementet, utfra det som er gjeldende datamodell. Det alternative kallet mw.wikibase.getStatements() gir kun utsagn i elementet, dermed blir mengden variasjoner mindre. Det finnes også et kall mw.wikibase.getBestStatements() som begrenser utsagn slik at de som er deprecated utelates. Hvis kode bruker disse kallene så begrenses konsekvensene ved endring i datamodellen.

Ytterligere informasjon om scriptet aksess finnes på mw:Extension:Wikibase Client/Lua.

Et grunnleggende konsept i datamodellen er at alle tomme datastrukturer fjernes, men selv om dette skal skje i teorien så skjer det ikke alltid. Hvis det ikke finnes claims så skal strukturen fjernes, men den kan likevel beholdes av forskjellige grunner eller som følge av feil. I claims finnes de enkelte utsagn i en understruktur som er indeksert på egenskapens P-id, og under hver av disse er mainsnak. Dette er strukturen som er utsagnets hovedoppføring. Det kan hektes på ekstra snak som er kvalifikatorer og referanser. Snaks holder strukturer som er typespesifikke, og disse er forskjellige. Slik datamodellen brukes nå bruker en egenskap stort sett en spesifikk valuetype, men det er ikke gitt at det skal være slik. Det finnes to (tre) typer som er avvikende og som alltid kan forekomme, verdiene novalue og somevalue. Det finnes også en dårlig beskrevet verdi true. I praksis må det testes på forekomst av data skal en unngå problemer.

Ytterligere informasjon om datamodellen finnes på mw:Wikibase/DataModel/Primer og mw:Wikibase/DataModel.

Se også

[rediger kilde]

Eksterne lenker

[rediger kilde]