pzh@pzh.gov.pl

5 star open data czyli schemat pięciu poziomów otwartości danych

Model 5-star open data został opracowany przez Tima Bernersa-Lee, twórcę sieci WWW i prekursora Linked Data, z myślą o otwartych danych publicznych. Koncepcja o prostych założeniach opisuje, w jaki sposób dane powinny być dostępne, oznaczone oraz ze sobą powiązane.

Schody wiedzy

5 star open data to użyteczne narzędzie służące klasyfikowaniu zasobów pod kątem ich otwartości. Im wyższy poziom otwartości danych, tym dane są lepiej przygotowane do dalszego przetwarzania. Otwarte dane są udostępniane bez ograniczeń do celów komercyjnych i niekomercyjnych. Ogólne zalecenia dotyczące otwierania danych dotyczą dwóch aspektów. Nie zaleca się upowszechniania danych na pierwszym poziomie otwartości, a dla danych udostępnianych na poziomie 3 i wyższym zaleca się udostępniać przez API, co pozwala na ich maszynowe przetwarzanie.

Poziom 1 * Są to dane w dowolnym formacie, udostępniane bez ograniczeń licencyjnych. Mogą to być dane w postaci plików graficznych (JPEG), zdjęcie tabeli, skanów z obrazem danych lub tekstu, czy pliki tekstowe lub pliki pdf. Charakterystyczne dla tego poziomu jest to, że dane są nieustrukturyzowane lub mają niejednorodną strukturę. Można je odczytać, ale dalsze ich wykorzystywanie wymaga dodatkowej pracy, polegającej na zidentyfikowaniu, odczytaniu i przeniesieniu danych (często ręcznie).

Poziom 2 ** Na tym poziomie dane przybierają postać sformatowanego arkusza kalkulacyjnego. Najważniejszą jego cechą jest to, że dane mają charakter ustrukturyzowany (można je odczytać komputerowo za pomocą pliku w formacie arkusza kalkulacyjnego lub edytora tekstu). Jednak dane te są w formacie zamkniętym, dla którego stosowanie w oprogramowaniu jest ograniczone przez restrykcje patentowe, licencyjne lub podobne.

Poziom 3 *** Dane publikowane są w otwartym i ustrukturyzowanym formacie, np. CSV lub JSON. Dane udostępniane są w niezastrzeżonym formacie.

Poziom 4 **** Czwarty poziom otwartości pozwala jednoznacznie określić znaczenie udostępnianych danych. Technicznym sposobem wyrażania takiego znaczenia w sposób zrozumiały dla maszyn jest identyfikacja konkretnych właściwości danych za pomocą zrozumiałych dla maszyny URI zgodnie z modelem RDF (model opisu danych). Dane publikowane są w niezastrzeżonym formacie.

Poziom 5 ***** Poziom piąty umożliwia łączenie danych z innymi danymi za pomocą linków (dane zawierają połączenia strukturalne online do innych zbiorów informacji). Dzięki temu możliwe jest odnajdywanie połączeń pomiędzy różnymi zbiorami danych. Dane publikowane są w niezastrzeżonym formacie.