Download Service via Atom feed

From Geonovum Wiki
Jump to: navigation, search


Aan de slag met INSPIRE

Doelgroep
Processtappen
Bronnen
Over deze wiki

Aanmerking

Aanmerkingsregister

Inrichten organisatie
Thematic Clusters

1. Dataharmonisatie

Documentatie dataharmonisatie
Principes dataharmonisatie
Generic Conceptual Model
INSPIRE ID
Codelijsten
Portrayal
Geometrie
Data-validatie
Checklist dataharmonisatie
Extensies
FAQ Dataharmonisatie

2. Metadata

Metadata aanmaken
Waar moet mijn metadata aan voldoen?
Invulinstructie voor datasets
Voorbeeld XML voor INSPIRE dataset metadata
Metadata en Taal
Metadata-validatie
Geharmoniseerde Gebruiksvoorwaarden
FAQ Metadata

3a. Network Services

Informatie Network Services
Vereisten Services
Quality of Services
Rights Management Layer
Agree operation
RM en GeoGedeeld
View service maken
Recente wijzigingen specificaties
INSPIRE vereisten opnemen in een Capabilities document
Category Layers
Meertaligheid in een Capabilities document
Voorbeeld XML voor Capabilities
Portrayal
FAQ View Services
Download service maken
Recente wijzigingen specificaties Download Services
Download Service via Atom feed
Automatisch genereren van OpenSearch description
Download Service Pre-defined Datasets via WFS
Download Service Direct Access via WFS
Download service via WCS
Download service via SOS
FAQ Download Services
Metadata Services
Scenario's voor het aanmaken van service metadata
Invulinstructie voor services
Voorbeeld XML voor INSPIRE service metadata
Valideren Metadata Services
Domain Model
Oorspronkelijk Domain model
Domain model en datasets
Koppeling Data en Services
Valideren Services

3b. Spatial Data Services

Wat is een Spatial Data Service
Categorieën van Spatial Data Service
Bepalen categorie Spatial Data Service
Invocable Spatial Data Service
Interoperable Spatial Data Service
Harmonised Spatial Data Service
Metadata templates voor Spatial Data Service

4. Publiceren

Publiceren Inspire aanduiding

5. Validatie

INSPIRE vervolg

Monitoring en Rapportage

Veelvoorkomende vragen

FAQ Metadata
FAQ View Services
FAQ Download Services
FAQ Data Harmonisatie

Extra informatie

Terminologie
Normatief Kader TC 211
UML notatie


 


Inrichten organisatie 1. Data harmonisatie 2. Metadata 3. Services 4. Publicatie Inspire portal 5. Validatie


Atom formaat
De Atom standaard is een (voorgestelde) standaard van IETF, the Internet Engineering Task Force. Atom is een XML-formaat om (op internet beschikbare) informatie te publiceren in feeds. Deze feeds bevatten vaak een algemeen deel en verscheidene items. Zo'n item (entry) bestaat uit elementen die de informatie beschrijven en ernaar verwijzen. Items kunnen bijvoorbeeld nieuwsberichten zijn, weblog posts of gepubliceerde video's.

De GeoRSS specificatie (zie http://georss.org) breidt feeds uit met elementen over de geografische eigenschappen van gegevens te publiceren. Dit is bijvoorbeeld een puntlocatie of bounding box van het gebied waar de gegevens betrekking op hebben.

Deze pagina beschrijft de eisen van INSPIRE aan Atom feeds en verwijst naar enkele voorbeelden.


Referenties

De Technical Guidance voor Download Services: Technical Guidance for the implementation of INSPIRE Download Services

De Atom specificatie is te vinden op: http://tools.ietf.org/html/rfc4287

De GeoRSS specificatie is te vinden op: georss.org.

De OpenSearch specificatie is te vinden op: [1].


INSPIRE Download Services en Atom feeds

De Technical Guidance voor Download Services beschrijft hoe pre-defined datasets via Atom gepubliceerd kunnen worden, om te voldoen aan de Implementing Rule voor Download Services. Globaal komt het erop neer dat de Download Service via enkele Atom feeds wordt beschreven en de download locaties aanbiedt van de bestanden om gehele datasets of delen daarvan te downloaden.

Atom feeds van een Pre-defined dataset bevat daarvoor (onder andere):

1. gegevens over de aanbieder van de download service. Deze gegevens staan in de Atom Service feed;

2. algemene gegevens over de download service, zoals een id, locatie en de datum van laatste wijzigingen en copyrights en verwijzingen naar de Atom Dataset Feeds. Deze gegevens staan in de Atom Service feed.

3. per dataset, deel van een dataset: beschrijvende gegevens, zoals een titel, beknopte samenvatting, copyrights en andere rechten, het CRS, het geografisch gebied van de data en verwijzingen (URL) naar de data zelf. Deze gegevens staan in de Atom Dataset feed(s);

4. indien van toepassing: verwijzingen naar feeds in een andere taal (meertaligheid INSPIRE).

5. verwijzingen naar OpenSearch functionaliteit om de feeds te kunnen doorzoeken. Deze gegevens staan in de Atom Service feed;

De afbeelding hieronder geeft de samenhang van de feeds weer voor pre-defined datasets, die als (statisch) bestand te downloaden zijn van een standaard webserver.
Atom feeds overview.png

Een Atom service feed kan naar meerdere Atom Dataset feeds verwijzen. Een Dataset feed kan vervolgens per combinatie van CRS, taal en formaat naar meerdere bestanden wijzen. Zie de afbeeldingen hieronder.
Atom feeds structuur.png

Elementen in Atom feeds voor Download Services

De onderstaande tabel bevat een overzicht van de elementen van een Atom-feed, zoals de Technical Guidance die beschrijft en die van toepassing zijn op de gehele feed. Het betreft geen volledige opsomming van alle details, zie daarvoor de Technical Guidance zelf.

Element
Type

Belangrijkste extra attributen / elementen

Verplicht?
Omschrijving
title

Taal (xml:lang)

Ja
Een voor mensen leesbare titel van de feed als geheel, m.a.w. van de Download Service, inclusief opgave van de taal van dit element.
subtitle

Taal (xml:lang)
Nee
Een voor mensen leesbare subtitel, met extra toelichting over de feed als geheel, inclusief opgave van de taal van dit element.
link

service metadata

Soort link (rel="describedby")

Type (type="application/xml")

NB: gewijzigd in versie 3.1

Ja

Link naar de metadata record van deze download service in de discovery service.

link
zelf referentie

Soort link (rel="self")

Taal (hreflang="en")

Titel (title="Title of this document")

Type (type="application/atom+xml")

Ja

Verwijzing naar de URL van de feed zelf

Dit is een vereiste van Atom en is bijvoorbeeld handig als een feed lokaal wordt opgeslagen of gekopieerd, dan is de oorspronkelijke (online) locatie van de feed via deze link nog te achterhalen.

link
alternatieve talen

Soort link (rel="alternate")

Type (bijv. type="text/html")

Alternatieve taal (bijv. hreflang="de")

Titel (bijv. title="An HTML version of this document in German")

Verplicht als er meerdere talen van de Download Service zijn
Als een Download Service ook in andere talen beschikbaar is, dient deze link opgenomen te worden en te verwijzen naar de feed in de andere talen.
link
OpenSearch document

Soort link (rel="search")

Type (bijv. type="application/opensearchdescription+xml")

Taal (bijv. hreflang="en")

Verwijst naar een OpenSearch description van de Download Service.
link
alternatieve formaten

Soort link (rel="alternate")

Type (bijv. type="text/html")

Titel (bijv. title="An HTML version of this document")

Nee
Dit gaat om alternatieve formaten van de feed zelf, dus niet van de datasets. Bijvoorbeeld als er een website is over de Download Service.
id


Ja
Dit is de identifier van de feed. De waarde dient een URI te zijn, aanbevolen is de URI van de feed te gebruiken.
rights


Ja
Informatie over de rechten en restricties die gelden voor de feed. Vaak komt dit overeen met de waarde voor 'accessConstraints' in de overeenkomstige service metadata record. Individuele entries in de feed kunnen ook hun eigen rechten en restricties hebben.
updated


Ja
Datum en tijd van de laatste wijzgingen van de feed.
author
Contactinformatie over de feed, Name en email Ja Het kan contactinformatie zijn van een individu of een organisatie die verantwoordelijke is voor de feed. Tenminste moet een naam en e-mailadres worden verstrekt.


Voor elke Dataset feed, dient de Atom Service feed een entry-element te bevatten. Voor elk entry-element zijn de volgende subelementen beschikbaar:

Element
Type

Belangrijkste extra attributen / elementen

Verplicht?
Omschrijving
INSPIRE dataset identifier
INSPIRE elementen INSPIRE custom elementen, spatial_dataset_identifier_code spatial_dataset_identifier_namespace Ja
Verwijzingen naar de INSPIRE dataset identifier code en namespace. De XML elementen zijn door INSPIRE specifiek voor Download Services gedefinieerd.
title

Taal (xml:lang)

Ja
Een voor mensen leesbare titel van de entry, m.a.w. van de dataset (of deel daarvan), inclusief opgave van de taal van dit element
link
Metadata
Soort link (rel="describedby" en type="application/xml")
Ja
Link naar het metadata record van de dataset
link
Dataset feed
Soort link (rel="alternate" en type="application/atom+xml")
Ja
Link naar de Atom dataset feed horend bij de dataset van de entry.
subtitle

Taal (xml:lang)
Nee
Een voor mensen leesbare subtitel, met extra toelichting over de entry, inclusief opgave van de taal van dit element
id


Ja
Dit is de identifier van de datasets. De waarde dient een URI te zijn, aanbevolen is de URL van de dataset te gebruiken, dus dezelfde URL als in het href-attribuut van de link van de dataset.
rights


Nee
Informatie over de rechten en restricties die gelden voor de entry. Indien dit niet opgegeven is, geldt de informatie zoals opgegeven bij de rights van de gehele feed.
updated


Ja
Datum en tijd van de laatste wijzgingen van de feed
author
Contactinformatie over de dataset, Name en email Nee Gegevens voor contact over de datasets. Naam en emailadres zijn, op basis van de INSPIRE Metadata IR, minimaal vereist. Indien dit niet opgegeven is, geldt de informatie zoals opgegeven bij de rights van de gehele feed.
georss

Nee
Het gebied waar de dataset betrekking op heeft, uitgedrukt met bijvoorbeeld een boundingbox. De geometrie wordt opgegeven conform GeoRSS(-Simple). De coordinaten staan in latitude/longitude  conform WGS84.
category
CRSen

Well-known definitie van het CRS (attribuut term) en eventueel het label voor de leesbare toelichting.

Ja
CRSen waarin de dataset feed de data aanbiedt.



Dataset feeds bevatten de informatie om de bestanden daadwerkelijk te kunnen downloaden. Dataset feeds bevatten de onderstaande elementen.

Element
Type

Belangrijkste extra attributen / elementen

Verplicht?
Omschrijving
title

Taal (xml:lang)

Ja
Een voor mensen leesbare titel van de dataset feed, inclusief opgave van de taal van dit element
subtitle

Taal (xml:lang)
Nee
Een voor mensen leesbare subtitel, met extra toelichting over de dataset feed, inclusief opgave van de taal van dit element
id


Ja
Dit is de identifier van de dataset feed. De waarde dient een URI te zijn, de URL van de dataset feed zelf.
rights


Nee
Informatie over de rechten en restricties die gelden voor de dataset feed.
updated


Ja
Datum en tijd van de laatste wijzgingen van de feed
author
Contactinformatie over de dataset feed, met naam en emailadrees Ja Gegevens voor contact over de datasets. Naam en emailadres zijn, op basis van de INSPIRE Metadata IR, minimaal vereist. Indien dit niet opgegeven is, geldt de informatie zoals opgegeven bij de rights van de gehele feed.
link

Spatial Object description, via een link met rel="describedby" en type="text/html", vindt verwijzing naar een (INSPIRE) Registry en/of een ander registry plaats

Ja
Een of meerdere elementen die aangeven welke Spatial Object Types die in de dataset zitten. De waardes hiervan komen uit de INSPIRE Registry in geval de data aan een Data specifictie voldoet, zie http://inspire-registry.jrc.ec.europa.eu/registers/FCD/ voor waardes (spatial object types).
link
Service feed
Soort link (rel="up")

Type link (type="application/atom+xml")

Nee
Link naar de Atom service feed ("omhoog" / terug verwijzing naar de service feed)

Een dataset feed bevat tenminste een entry van een dataset om te downloaden. Elke entry in een Dataset feed beschrijft per combinatie van een formaat en CRS een te downloaden bestand. Per entry gelden de volgende regels.

Element
Type

Belangrijkste extra attributen / elementen

Verplicht?
Omschrijving
link
Dataset

Soort link (rel="alternate"),

Formaat / type (type)

Groote in octetten  / bytes (length)

Taal van het bestand  waarnaar verwezen is (hreflang), indien het een van de alternatieve talen betreft

Ja

Link naar de dataset of delen daarvan, bijvoorbeeld naar een GML document. Het type geeft het formaat aan, bijvoorbeeld "application/gml+xml;version=3.2" voor een ongecomprimeerd GML bestand. De dataset kan ook gecomprimeerd aangeboden worden of in een ander formaat. Dit is bijvoorbeeld bij rasterdata van Elevation te verwachten.

Voor datasets die in meerdere CRSen beschikbaar zijn, volgt nog een voorgestelde oplossing.

georss

Nee
Het gebied waar de dataset betrekking op heeft, uitgedrukt met bijvoorbeeld een boundingbox. De geometrie wordt opgegeven conform GeoRSS(-Simple). De coordinaten staan in latitude/longitude  conform WGS84.
category
CRSen

Well-known definitie van het CRS (attribuut term) en eventueel het label voor de leesbare toelichting.

Ja
CRSen waarin de dataset feed de data aanbiedt.

Nota bene: voor een nadere beschrijving van alle details wordt verwezen naar de Technical Guidance.


Meertaligheid

Door gebruik te maken van de Atom-ondersteuning voor andere talen, wordt automatisch voldaan aan de eisen van INSPIRE voor meertaligheid van de service.


OpenSearch

Download Services die via Atom feeds aangeboden worden, dienen (verplicht) OpenSearch zoekfunctionaliteit te bieden om de Service en dataset feeds te doorzoeken. De Atom service feed verwijst naar het OpenSearch Document dat die OpenSearch functionaliteit beschrijft. De Technical Guidance beschrijft in paragraaf 5.4 welke eisen INSPIRE aan deze OpenSearch functionaliteit en beschrijving stelt. Het is mogelijk om via NGR automatisch een OpenSearch description te genereren


Voorbeeld OpenSearch description De wiki pagina automatisch een OpenSearch description te genereren bevat een voorbeeld OpenSearch Description. Dit bestand bevat onder andere template zoek-requests naar de (basale) OpenSearch functionaliteit om te zoeken in de Atom feed voorbeelden (zie hieronder).



De OpenSearch description bevat template requests om de feeds te bevragen, gebruikmakend van de INSPIRE dataset identifier, namespace en CRS code. Deze staan in de Query-elementen van de OpenSearch description.

Een voorbeeld OpenSearch request voor zoeken van alle aangeboden bestanden van een dataset is: http://www.nationaalgeoregister.nl/geonetwork/opensearch/dut/download?spatial_dataset_identifier_code=f7d22d90-7651-11e0-a1f0-0800200c9a63&spatial_dataset_identifier_namespace=http://www.cultureelerfgoed.nl&crs=http://www.opengis.net/def/crs/EPSG/0/4258&language=nl

De waardes komen uit de description: <Query role="example" inspire_dls:spatial_dataset_identifier_namespace="http://www.cultureelerfgoed.nl" inspire_dls:spatial_dataset_identifier_code="f7d22d90-7651-11e0-a1f0-0800200c9a63" inspire_dls:crs="http://www.opengis.net/def/crs/EPSG/0/4258" language="nl" title="Unesco Werelderfgoed in CRS EPSG:4258 (ShapeFile)" count="1"/>

Voorbeeld Atom feeds

In het Nationaal GeoRegister staan enkele voorbeelden van Download Services via ATOM feeds.


Validators

Voor het valideren van een Atom feed kan de W3C validator gebruikt worden. Deze controleert of de syntax van de feed juist is en controleert alleen de standaard ATOM elementen. De W3C validator kent de GeoRSS elementen niet. Als de syntax klopt, dan komen er als het goed is alleen foutmeldingen voor de GeoRSS elementen.

Locatie W3C validator: http://validator.w3.org/feed/


INSPIRE validator

De test met de W3C validator is niet voldoende voor INSPIRE. INSPIRE vereist namelijk dat bepaalde elementen aanwezig zijn die in standaard ATOM optioneel zijn. Ook heeft INSPIRE inhoudelijke eisen voor bepaalde elementen. Zoals voor het element category. Voor een inhoudelijke toets is daarom het ESDIN Test Framework beschikbaar.

Deze validator met handleiding is te downloaden van de website van Geonovum: http://www.geonovum.nl/validatie.


Voordelen / nadelen

Enkele genoemde voor- en nadelen van Atom zijn:

Voordelen:

  • eenvoudig te gebruiken met standaard web technologie: browsers en newsreaders om te openen, code / programmeerbibliotheken om te verwerken en maken
  • te indexeren door zoekmachines (gebeurt bij ISO metadata meestal niet)
  • relatief eenvoudig XML formaat


Nadelen

  • Niet standaard ondersteuning voor in geo-software
  • zoals nu gebruikt in de TG: veel overlap met ISO metadata
  • zoals nu beschreven: mogelijkerwijs zijn veel feeds nodig om op te stellen