pzh@pzh.gov.pl

Co to są metadane?

Co to są metadane?

Autorzy: Artur Żarski, Katarzyna Lewtak, Grzegorz Masiewicz

Istotnym elementem związanym z udostępnianiem danych np. na portalach otwartych danych jest opis informacji, które zostają tam opublikowane, czyli tzw. metadane.

Metadane to nic innego jak „dane o danych” lub też „informacja o informacji”. To ustrukturyzowane informacje służące do opisu zasobów informacji lub obiektów informacji, które dostarczają nam szczegółowych danych, dotyczących atrybutów zasobów lub obiektów informacji. A wszystko w celu ułatwienia odnalezienia, identyfikacji, a także zarządzania tymi zasobami.

Metadane opisujące zasób informacyjny to na przykład:

  • tytuł – nazwa zasobu informacyjnego, która umożliwia jego identyfikację;
  • słowa kluczowe – zestaw słów lub wyrażeń zwięźle opisujących zasób informacyjny;
  • opis – streszczenie lub krótkie określenie zawartości zasobu informacyjnego;
  • aktualność danych – (data utworzenia, data ostatniej modyfikacji) a także częstotliwość aktualizacji (informacja o częstotliwości aktualizacji zasobu informacyjnego lub metadanych).

Metadane noszą w sobie ustrukturyzowane dane i zawierają opis dokumentów będących określonymi nośnikami informacji. Są to określenia umożliwiające wyszukanie pożądanej informacji wraz z odpowiedzią w jakiej relacji pozostaje ona w stosunku do innych informacji.

Zapisywanie metadanych możliwe jest w: pliku txt, arkuszu kalkulacyjnym, pliku XML.

Rodzaje metadanych:

  • metadane wyszukiwania – służą do wyboru zbiorów, mogą stać się przedmiotem zainteresowań danej osoby o konkretnych wymaganiach, obejmują one np.:
    • nazwę i opis zbioru danych;
    • podstawowe przeznaczenie i zakres stosowania danych;
    • datę pozyskania danych i ich aktualizacji;
    • producenta, dostawcę i głównych użytkowników danych;
    • obszar, do którego dane się odnoszą (współrzędne);
    • nazwy geograficzne lub jednostki podziału administracyjnego;
    • strukturę zbiorów i sposób dostępu do danych;
  • metadane rozpoznania, które zawierają więcej szczegółów o zbiorze, umożliwiają:
    • ocenę jakości danych;
    • określenie przydatności zbioru danych pod względem wymagań użytkowników;
    • nawiązanie kontaktu z dysponentem danych celem uzyskania dalszych informacji;
  • metadane stosowania – zawierają szczegóły zbioru, które gwarantują:
    • odczytania danych oraz ich transferu;
    • interpretacji danych i praktycznego korzystania z nich w aplikacji użytkownika;
  • metadane konserwatorskie – jest to połączenie pozostałych rodzajów metadanych; wspierają one długoterminowe przechowywanie materiałów cyfrowych.

Funkcje jakie pełnią metadane (wg M. Nahotko “Metadane. Sposób na uporządkowanie Internetu”):

  • ukazanie opisu bibliograficznego i opisu elektronicznego dokumentu;
  • ułatwienie wyszukiwania danych;
  • zabezpieczenie danych przed dostępem osób do tego niepowołanych;
  • ułatwienie oceny przydatności określonych danych;
  • nadzór nad zarządzaniem danymi;
  • ukazanie informacji o historii danych.

Wskaźniki jakości metadanych:

  • kompletność (ang. completeness) dotyczy ilości i rozkładu elementów metadanych w rekordach z punktu widzenia zawartości pojedynczych rekordów, jak i rozkładu danych w całej bazie danych;
  • poprawność (ang. correctness) – określana nieraz jako dokładność (ang. accuracy), analizuje poprawność rekordów, wartości metadanych, pisownię (gramatyka, znaki specjalne bądź interpunkcję);
  • spójność obejmuje pojedyncze bazy danych oraz współpracujące biblioteki cyfrowe. Można mówić o spójności zapisu elementu danych, tworzonych linkach między zasobami powiązanymi relacjami;
  • analiza zdublowanych rekordów, które powstają w działaniach lokalnych oraz podczas wymiany/integracji danych.

Korzyści płynące ze stosowania metadanych:

  • szybsze uzyskanie informacji na temat zbiorów danych, dostępnych dla interesującego nas obszaru;
  • łatwiejsze zarządzanie zasobami danych w obrębie organizacji;
  • możliwość lepszego zaplanowania działań dotyczących aktualizacji danych;
  • zwiększenie prawdopodobieństwa zdublowania zbiorów danych zgromadzonych wcześniej przez inne organizacje;
  • poszerzenie kręgu użytkowników danych.