pzh@pzh.gov.pl

Czym są otwarte dane publiczne?

Autorzy: Artur Żarski, Maria Piotrowicz, Monika Bińkowska

Dane publiczne to liczby i pojedyncze wydarzenia lub obiekty na możliwie najniższym poziomie agregacji, które nie zostały poddane przez administrację publiczną przetworzeniu do postaci raportów, wykresów itp. oraz nie został im nadany odpowiedni kontekst lub interpretacja.

Są to m.in. informacje o dochodach, wydatkach, edukacji, mieszkalnictwie, poziomie zanieczyszczenia powietrza, oświacie (w tym wynikach egzaminów), bibliotekach, portach lotniczych i wiele innych.

Otwarte dane publiczne mają wiele zastosowań:

·        Poprawa funkcjonowania instytucji publicznych i ułatwienie pracy urzędów
·        Zwiększenie zaangażowania obywateli w sprawy publiczne
·        Budowanie środowiska innowacyjnego
·        Rozwiązywanie problemów społecznych i gospodarczych

Dane, aby efektywnie służyły do realizacji wskazanych wyżej celów, powinny:

·        być przygotowane w sposób przyjazny dla użytkownika; kluczowy jest tu komunikatywny, zrozumiały dla odbiorcy język;

·        spełniać wszystkie filary otwartości (kwestie prawne);

·   być udostępnione w formacie przeznaczonym do odczytu maszynowego (format pliku zorganizowany tak, aby aplikacje komputerowe mogły łatwo zidentyfikować, rozpoznać i uzyskać określone dane, w tym poszczególne stwierdzenia faktów i ich wewnętrzną strukturę) i w otwartych formatach (format pliku, który nie jest powiązany z platformą oraz jest udostępniany obywatelom bez żadnych ograniczeń, które utrudniałyby ponowne wykorzystywanie dokumentów) do ich ponownego wykorzystywania.

Komisja Europejska opracowała następujące standardy otwartości danych:

·     dane są dostępne – udostępnione bez żadnych ograniczeń szerokiemu gronu użytkowników (w szczególności: obywatele, firmy, uczelnie, instytucje) do dowolnych celów;

·      dane są upublicznione w wersji źródłowej – dostępne w oryginalnej  i niezmienionej formie, a nie w postaci analiz, podsumowań, skrótów czy streszczeń; wszystko po to aby możliwe było np. łączenie danych pochodzących na przykład z różnych źródeł;

·     dane są kompletne – udostępnione w całości

·     dane są aktualne – udostępnione na tyle szybko, aby zachować wartość tych danych;

·      dane są odczytywalne maszynowo – udostępnione w formatach przeznaczonych do odczytu maszynowego i formacie otwartym (np. CSV, XML, arkusz kalkulacyjny). Trudne do maszynowego odczytu są formaty PDF, HTML czy pliki tekstowe, które stają się użyteczne do ponownego wykorzystywania dopiero po ich skonwertowaniu na jeden z formatów otwartych;

·     dane są udostępnione niedyskryminująco – dostępne dla każdego bez konieczności rejestracji, weryfikacji tożsamości poprzez podawanie hasła, loginu czy podpisywania jakichkolwiek umów;

·      dane są dostępne bez ograniczeń prawnych – dane nie są przedmiotem praw autorskich, patentów, znaków towarowych lub tajemnicy handlowej i mogą być wykorzystywane w dowolnych celach bez konieczności ubiegania się o jakąkolwiek zgodę na ich używanie;

·     dane są niezastrzeżone – dostępne w formacie powszechnie stosowanym, który nie jest kontrolowany przez żaden podmiot.

Z kolei informacją publiczną jest „każda wiadomość wytworzona przez szeroko rozumiane władze publiczne oraz osoby pełniące funkcje publiczne, a także inne podmioty, które tę władzę realizują, bądź gospodarują mieniem komunalnym lub majątkiem Skarbu Państwa, w zakresie swych kompetencji. Taki charakter będzie miała również wiadomość niewytworzona przez podmioty publiczne, lecz odnosząca się do tych podmiotów. Stąd informacją publiczną jest każda wiadomość wytworzona lub odnosząca się do władz publicznych, a także wytworzona lub odnosząca się do innych podmiotów wykonujących funkcje publiczne w zakresie wykonywania przez nie zadań władzy publicznej i gospodarowania mieniem komunalnym lub majątkiem Skarbu Państwa” [definicja Naczelnego Sądu Administracyjnego].