Kennisgraaf
Wanneer we (basis-)registraties beschikbaar stellen als Linked Data is er nog steeds een grote hoeveelheid domeinkennis nodig om de data goed te kunnen gebruiken. Zo kunnen bijvoorbeeld alleen BAG en BGT specialisten die data en het datamodel goed kennen gemakkelijk interacteren met de data. In de praktijk zijn veel gebruikers geïnteresseerd in data over hun huis, wijk of leefomgeving. Om die reden slaan we de complexe basisregistraties en andere overheidsdatasets plat tot een Knowledge Graph voor een bepaald doeleinde. Hierbij is het mogelijk om bepaalde versimpelingen toe te passen, zoals het abstraheren van historie in de registraties.
1. Datamodel van de Kennisgraaf
In de praktijk praten gebruikers vaak niet in termen als nummeraanduiding, verblijfsobject of bestuurlijk gebied, maar over adressen, gebouwen en wijken. Gebruikers denken in termen van hun fysieke leefomgeving (Figuur 1).
2. Schema.org model
In het maken van een gebruiksvriendelijk datamodel kan ervoor gekozen worden om termen uit de basisregistraties te hergebruiken (zoals Pand of Perceel). Er kan ook voor gekozen worden om de data naar een nog meer generiek en open standaard te brengen, zoals Schema.org. Deze standaard is geïntrodueerd door Google en behelst een manier van data omschrijving waarmee moderne zoekmachines goed aan de slag kunnen. Objecten, pagina's en websites die met deze standaard zijn omschreven zijn dan ook over het algemeen goed vindbaar op het web. In Figuur 2 wordt een voorbeeld van een datamodel in Schema.org gegeven.
2.1 Schema.org vertaling
Tabel 1 geeft een overzicht van de directe transformaties die in de KG zijn opgenomen. Waar (inclusief) is aangegeven, betekent dit dat deze transformatie een aantal bronconcepten omvat in één KKG-concept of omgekeerd.
2.2 Bevindingen
Bevindingen bij het eerste gebruik van een op Schema.org gebaseerde kennisgraaf:
- Door de mapping naar Schema.org worden we uitgenodigd om informatie simpeler te ontsluiten. Data wordt in termen van de alledaagse wereld ontsloten, begrijpelijk voor de niet-specialistische gebruiker.
- Doordat Schema.org alledaagse begrippen zoals Adres, Plaats, Huis hanteert is de data eenvoudiger te bevragen.
- Doordat verscheidene begrippen soms worden 'plat geslagen' in Schema.org wordt de structuur eenvoudiger (bijvoorbeeld Nummeraanduiding en OpenbareRuimte wordt PostAdres).
- Sommige voor de hand liggende begrippen zitten (nog) niet in Schema.org. Brug bijvoorbeeld wel, maar Weg niet.
- Schema.org is in het Engels. Het is soms nog lastig om de juiste Nederlandse vertaling te vinden.
- De koppeling tussen Schema.org en de bronsystemen is eenvoudig te leggen (prov:wasDerivedFrom voor instanties; sdo:additionalType voor definities).
- Een toekomstige iteratie van de knowledge graph o.b.v. Schema.org moet het evenwicht zien te vinden tusen 'breedte en diepte' van de ontologie: de rijkdom van de onderliggende data ontsluiten, maar op een manier die geen domeinkennis vereist.
- Doordat meerdere geo-objecten nu als 1 object ontsloten worden heeft de gebruiker meer begeleiding nodig bij het kiezen van dubbel voorkomende eigenschappen (m.n. geometrie).
- Voor een aantal object typen is maar weinig informatie bekend (bijvoorbeeld een Bak). Je hebt dan alleen de geometrie en de bronhouder. Het is niet duidelijk of deze informatie nuttig is voor veel gebruikers.
- Een aantal object typen worden op een te laag niveau ontsloten in de bron (bijvoorbeeld Wegdeel, Waterdeele). Om voor de gebruiker nuttig te zijn zouden deze gegroepeerd ontsloten moeten worden. Bijvoorbeeld 1 water i.p.v. 100 losse waterdelen.
3. Data Lineage
Essentieel uitgangspunt bij het transformeren van de data naar de Knowledge Graph is dat de data lineage herleidbaar blijft. Attributen en objecten komen uit een bepaalde dataset en een bepaald gegeven binnen deze dataset. Deze lineage houden we traceerbaar middels de prov standaard zoals gestandaardiseerd door het W3C.
Een specifiek voorbeeld van hoe data lineage automatisch wordt bijgehouden is te vinden in Tabelen 3 tot en met 9. Dit betreft de cellen met waarde "wasDerivedFrom". Deze zelfde relatie is ook te vinden in de implementatie bevraging die aan het einde van deze pagina is opgenomen.
4. Van Overheids Bron tot Kadaster Kennisgraaf (KGG)
Om technisch tot een invulling te komen van een Knowledge Graph bovenop onze registratieve Linked Data, maken wij gebruik van zgn. LD Views. LD Views zijn geautomatiseerde afbeeldingen van registratieve datasets naar een geïntegreerde kennisgraaf. Met deze aanpak transformeren we de registratieve laag naar een additionele laag dat gebruik maakt van bovengenoemd datamodel.
Schema.org Place (sdo:Place) is het centrale element in de kennisgrafiek en als zodanig is elke LD View die in de kennisgrafiek is geconstrueerd een specifiek type sdo:Place. Momenteel zijn er verschillende soorten plaatsen in de kennisgrafiek, waaronder: Panden, Gebieden, Waterdelen, Wegdelen, Terreindelen en Overige. Elk van deze bestaat uit een of meer LD Views. Een technische bespreking van wat deze LD View zijn en hoe ze concreet worden geconstrueerd, vindt u hier.
Om beter weer te kunnen geven hoe LD Views en hun corresponderende sdo:Place categorie inhoudelijk zijn opgebouwd introduceren we het gedetailleerde tabel formaat in Tabel 2:
Kadaster Kennisgraaf (KKG) | Overheids Bron | ||
---|---|---|---|
Objecttype | Eigenschap | Objecttype | Eigenschap |
Objecttype | eigenschapA | BronObjecttype | bronEigenschap |
eigenschapB | [[Klasse]] | ||
eigenschapC | "waarde" |
De dikgedrukte rijen in dit tabel formaat moeten als volgt gelezen worden:
- Rij 1 geeft aan dat de linker twee kolommen gegevens in de Kadaster Kennisgraaf (KKG) beschrijven. Deze rij geeft ook dat dat de rechter twee kolommen gegevens in een Kadastrale bron aanduiden, waar de gegevens in de kennisgraaf op gebaseerd worden.
- Rij 2 geeft aan dat zowel in de kennisgraaf alsook in de bron een onderscheid wordt gemaakt tussen objecttype en eigenschap.
De niet-dikgedrukte rijen in dit tabel formaat moeten als volgt gelezen worden:
- Rij 1-3 geven aan dat ze objecten van hetzelfde objecttype in de kennisgraaf beschrijven.
- Rij 1 legt een specifieke afbeelding (View) vast van een Bronklasse/bronEigenschap combinatie, naar een Klase/eigenschap combinatie in de kennisgraaf. De meeste afbeeldingen (Views) zijn van dit karakter.
- Rij 2 legt een ander soort afbeelding (View) vast: eigenschap2 in de kennisgraaf is niet direct gebaseed op 1 gegeven in een bron, maar vormt een link naar een ander objecttype in de kennisgraaf. Dit andere objecttype komt elders in dezelfde tabel voor.
- Rij 3 legt weer een ander soort afbeelding (Viev) vast: eigenschap3 in de kennisgraaf heeft een constante waarde. Deze waarde is niet afkomstig uit een specifieke locatie in de bron, maar maakt onderdeel uit van de LD View.
4.1 Van Gebouw/Pand naar Schema.org Place.
Tabel 3 geeft de gedetailleerde vertaling voor panden weer. Hier wordt een Schema.org Schema.org Place gebaseerd op BAG Pand, BGT pand en BRT gebouw.
Naast de transformaties in Tabel 3 worden ook nog de volgende filters toegepast.
- Nummeraanduiding
- Nummeraanduidingen waarvan de registratie is afgesloten worden niet meegenomen in de LD View. Nummeraanduidngen met status naamgeving ingetrokken worden niet meegenomen in de LD View.
- Openbare ruimte
- Openbare ruimtes waarvan de registratie is afgesloten worden niet meegenomen in de LD View. Openbare ruimtes met status naamgeving ingetrokken worden niet meegenomen in de LD View.
- Verblijfsobject
- Verblijfsobjecten met status niet geraliseerd verblijfsobject, verblijfsobject ingetrokken of verblijfsobject ten onrechte opgevoerd worden niet meegenomen in de LD View. Verblijfsobjecten waarvan de registratie is afgesloten worden niet meegenomen in de LD View.
- Pand
- Panden met status niet gerealiseerd pand, pand gesloopt of pand ten onrechte opgevoerd worden niet meegenomen in de LD View. Panden aarvan de registratie is afgesloten worden niet meegenomen in de LD View.
4.2 Van administratief gebieden / registratief gebied / woonplaats / buurt / wijk / gemeente (BAG, BGT, BRT, CBS, RCE) naar Schema.org Place
Tabel 4 geeft de inhoudelijke afbeelding (View) voor gebieden weer. Hier bestaat de sdo:Place categorie Gebieden uit de BAG Woonplaats, een aantal BGT gebieden, Openbare Ruimtes (BGT en BAG) en Wijken en Buurten.
Naast de transformaties in Tabel 4 worden ook de volgende filters toegepast.
- BAG Woonplaats
- Woonplaatsen met status woonplaats ingetrokken worden niet meegenomen in de LD View.
- Openbare ruimte
- Openbare ruimtes waarvan de registratie is afgesloten worden niet meegenomen in de LD View. Openbare ruimtes met status naamgeving ingetrokken worden niet meegenomen in de LD View.
4.3 Van terreindeel (BGT, BRT) naar Schema.org Place
Tabel 5 geeft de inhoudelijke afbeelding (View) voor gebieden weer. Hier bestaat de sdo:Place categorie Terreindelen uit de BGT (Begroeid en onbegroeid terreindeel) en BRT.
Kadaster Kennisgraaf (KKG) | Overheids Bron | ||
---|---|---|---|
Objecttype | Eigenschap | Objecttype | Eigenschap |
Place | wasDerivedFrom | BGT Begroeid Terreindeel | identificatie |
BGT Onbegroeid Terreindeel | identificatie | ||
BRT Terrein | identificatie | ||
additionalType | "BGT Begroeid Terreindeel" | ||
BGT Begroeid Terreindeel | functie | ||
fysiek voorkomen | |||
plus functie | |||
plus fysiek voorkomen | |||
plus type | |||
type | |||
"BGT Onbegroeid Terreindeel" | |||
BGT Onbegroeid Terreindeel | fysiek voorkomen | ||
plus fysiek voorkomen | |||
"BRT Terrein" | |||
BRT Terrein | fysiek voorkomen | ||
type | |||
voorkomen | |||
geo | [[GeoShape]] | ||
name | BGT Begroeid Terreindeel | "Een begroeid terreindeel van bronhouder: bronhouder naam" | |
BGT Onbegroeid Terreindeel | "Een begroeid terreindeel van bronhouder: bronhouder naam" | ||
BRT Terrein | naam | ||
GeoShape | wasDerivedFrom | BGT Begroeid Terreindeel | identificatie |
BGT Onbegroeid Terreindeel | identificatie | ||
BRT Terrein | identificatie | ||
name | "BGT geometrie" | ||
"BRT geometrie" | |||
polygon | BGT Begroeid Terreindeel | geometrie | |
BGT Onbegroeid Terreindeel | geometrie | ||
BRT Terrein | geometrie |
4.4 Van waterdeel (BGT, BRT) naar Schema.org Place
Tabel 6 geeft de inhoudelijke afbeelding (View) voor gebieden weer. Hier bestaat de sdo:Place categorie Waterdelen uit de BGT en de BRT.
Kadaster Kennisgraaf (KKG) | Overheids Bron | ||
---|---|---|---|
Objecttype | Eigenschap | Objecttype | Eigenschap |
Place | wasDerivedFrom | BGT Waterdeel | identificatie |
BRT Waterdeel | identificatie | ||
additionalType | "BGT Waterdeel" | ||
BGT Waterdeel | plus type | ||
type | "BRT Waterdeel" | BRT Waterdeel | functie |
type | |||
geo | [[GeoShape]] | ||
[[GeoCoordinates]] | |||
name | BGT Waterdeel | "Een waterdeel van bronhouder: bronhouder naam" | |
BRT Waterdeel | naam | ||
GeoShape | wasDerivedFrom | BGT Waterdeel | identificatie |
BRT Waterdeel | identificatie | ||
name | "BGT geometrie" | ||
"BRT geometrie" | |||
polygon | BGT Waterdeel | geometrie | |
BRT Waterdeel | geometrie | ||
GeoCoordinates | wasDerivedFrom | BRT Waterdeel | identificatie |
name | "BRT geometrie" | ||
latitude | BRT Waterdeel | geometrie | |
longitude | BRT Waterdeel | geometrie |
4.5 Van wegdeel (BGT, BRT) naar Schema.org Place
Tabel 7 geeft de inhoudelijke afbeelding (View) voor gebieden weer. Hier bestaat de sdo:Place categorie Wegdelen uit de BGT en de BRT.
Kadaster Kennisgraaf (KKG) | Overheids Bron | ||
---|---|---|---|
Objecttype | Eigenschap | Objecttype | Eigenschap |
Place | wasDerivedFrom | BGT Wegdeel | identificatie |
BRT Wegdeel | identificatie | ||
additionalType | "BGT Wegdeel" | ||
BGT Wegdeel | functie | ||
fysiek voorkomen | |||
plus functie | |||
plus fysiek voorkomen | "BRT Wegdeel" | BRT Wegdeel | fysiek voorkomen |
hoofdverkeersgebruik | |||
type infrastructuur | |||
type weg | |||
verhardingstype | |||
geo | [[GeoShape]] | ||
[[GeoCoordinates]] | |||
name | BGT Wegdeel | "Een wegdeel van bronhouder: bronhouder naam" | |
BRT Wegdeel | naam | ||
GeoShape | wasDerivedFrom | BGT Wegdeel | identificatie |
BRT Wegdeel | identificatie | ||
name | "BGT geometrie" | ||
"BRT geometrie" | |||
polygon | BGT Wegdeel | geometrie | |
BRT Wegdeel | geometrie | ||
GeoCoordinates | wasDerivedFrom | BRT Wegdeel | identificatie |
name | "BRT geometrie" | ||
latitude | BRT Wegdeel | geometrie | |
longitude | BRT Wegdeel | geometrie |
4.6 Van Monument (RCE) naar Schema.org Place
Tabel 8 geeft de inhoudelijke afbeelding (View) voor gebieden weer. Hier bestaat de sdo:Place categorie RCE Monumenten.
Kadaster Kennisgraaf (KKG) | Overheids Bron | ||
---|---|---|---|
Objecttype | Eigenschap | Objecttype | Eigenschap |
Place | wasDerivedFrom | RCE Monument | rijksmonument nummer |
additionalType | "RCE Monument" | ||
geo | [[GeoShape]] | ||
name | RCE Monument | naam | |
GeoShape | wasDerivedFrom | RCE Monument | geometrie |
name | "RCE geometrie" | ||
polygon | RCE Monument | geometrie as WKT |
4.7 Van Brug (BGT) naar Schema.org Bridge
Tabel 9 geeft de inhoudelijke afbeelding (View) voor bruggen weer. Hiervoor wordt het Schema.org objecttype sdo:Bridge gebruikt. Schema.org Bridge is een subtype van Schema.org Place.
Kadaster Kennisgraaf (KKG) | Overheids Bron | ||
---|---|---|---|
Objecttype | Eigenschap | Objecttype | Eigenschap |
Bridge | wasDerivedFrom | BGT Brug | identificatie |
additionalType | type overbruggingsdeel | ||
geo | [[GeoShape]] | ||
name | BGT Brug | "Een brugdeel van bronhouder: bronhouder naam" | |
GeoShape | wasDerivedFrom | BGT Brug | geometrie |
name | "BGT geometrie" | ||
polygon | BGT Brug | geometrie |