Zgodnie z zasadami FAIR istotny element każdego zbioru danych stanowią metadane. Metadane to dane o danych. Są kluczem do uzyskania dostępu do danych badawczych, ich zrozumienia i ponownego wykorzystania. Istnieją trzy główne typy metadanych:
- Metadane opisowe – dostarczają informacji niezbędnych do odszukania czy też identyfikacji zbioru danych. Mogą zawierać elementy takie jak tytuł, streszczenie, autora i słowa kluczowe.
- Metadane strukturalne – opisują relacje i zależności pomiędzy poszczególnymi zbiorami oraz elementami tych zbiorów w celu np. ułatwienia nawigacji.
- Metadane administracyjne – zawierają informacje pomocne w zarządzaniu danym zasobem. Zawierają informacje takie jak sposób i datę jego utworzenia, typ pliku i informacje dotyczące dostępu. Istnieje kilka podzbiorów danych administracyjnych. Dwa z nich często wymieniane jako oddzielne typy metadanych to:
- metadane zarządzania prawami, które dotyczą praw własności intelektualnej,
- metadane konserwacji, które zawierają informacje potrzebne do archiwizacji i utrzymania zasobu.
Metadane powinny informować m.in. o: strukturze danych, ograniczeniach ich dotyczących (jeśli takie istnieją), o tym co dane oznaczają i w jaki sposób je cytować.
Przykładowe pola metadanych:
- Dataset name: Determination of the influence of green corrosion inhibitors on aluminium alloys in alkaline media
- Version: 1.0
- Author/s: Ryl Jacek; Wysocka Joanna; Krakowiak Stefan; Cieślik Mateusz
- Description: The studies are devoted to search for green corrosion inhibitors of aluminium and its alloys, offering high corrosion inhibition efficiency in alkaline media. The project will aim at development of instantaneous impedance measurements for accurate determination of the adsorption isotherms.
- Format: DTA
- Licence: Creative Commons Attribution 4.0 International
- Funding Agency/ies: Ministry of Science and Higher Education, Republic of Poland
- Keywords: corrosion inhibitor, green chemistry, aluminium alloys, instantaneous impedance measurements
- DOI: (wszystkie zbiory danych zdeponowane w repozytorium MOST Danych otrzymają unikalne identyfikatory DOI)
- Discipline: Chemical sciences
- Language: English
Na całym świecie powstają inicjatywy mające na celu sformalizowanie specyfikacji metadanych, aby umożliwić łatwe ponowne wykorzystanie danych. Przykładami takich inicjatyw są: Research Data Alliance (RDA), OpenAire i Metadata 2020.
Standardy metadanych mają na celu usystematyzowanie sposobu opisu danych. Metadane przygotowane według standardu posiadają stałą strukturę opisu o wyraźnie zdefiniowanych polach, dzięki czemu opis jest zawsze zrozumiały zarówno dla ludzi jak i programów komputerowych.
Występuje wiele standardów metadanych. Wyszczególnić można standardy ogólne, dziedzinowe i instytucjonalne. Ogólne standardy metadanych to Dublin Core i Data Cite, czy też Data Documentation Initiative (DDI). Są one uniwersalne dziedzinowo i powszechnie stosowane. Wybrane standardy metadanych wykorzystuje się także w różnych dziedzinach i instytucjach np.: DC (nauki o życiu), EML (ekologia), SDMX (ECB, EUROSTAT, IMF, OECD, UN), SAFE (ESA), INSPIRE ISO 19139 (nauki o ziemi), Project Open Data Metadata Schema v1.1 (Agencje federalne USA), TEI i CDWA (dyscypliny humanistyczne).
Metadane to także opis zmiennych, codebook i słownik danych (controlled vocabulary) zawierający:
- nazwy zmiennych (skrócone i pełne, np. AGE i Age of the respondent),
- jednostki miar (np. mm),
- dozwolone wartości (np. zakres od 0 do 100),
- definicje zmiennych (np. Age=Age of the respondent in years).
Przykładowe słowniki danych:
- Biologia – Convention of Biological Diversity Controlled Vocabulary (CBDVoc)
- Ekonomia i nauki społeczne – Central Europe Glossary (CEG)
- Medycyna – Unified Medical Dictionary (UMD)
- Edukacja, nauki społeczne – UNESCO thesaurus
Zapisywanie metadanych możliwe jest w: pliku txt, arkuszu kalkulacyjnym, pliku XML.
Istnieje wiele przydatnych narzędzi do tworzenia metadanych. Przykładami są: Nesstar Publisher zgodny ze standardami DDI i Dublin Core, a także narzędzia takie jak STATA, SPSS, a także eENVplus oraz Edytor Metadanych, które przygotowano z myślą o tworzeniu metadanych w standardzie Inspire.
Czy wiesz, że...
Metadata harvesting to zautomatyzowany sposób gromadzenia metadanych z różnych źródeł w celu stworzenia zagregowanych metadanych i powiązanych usług. Protokół inicjatywy Open Archives Initiative do zbierania metadanych (OAI-PMH), wykorzystuje XML w celu wymiany metadanych w sieci. OAI-PMH został wprowadzony w roku 2001 i jest szeroko stosowany przez biblioteki cyfrowe, repozytoria instytucjonalne i archiwa cyfrowe w celu ułatwienia wymiany danych między systemami i rozszerzenia dostępu do zbiorów.