Długoterminowa strategia przechowywania, archiwizacji i ochrony danych powinna być opisana w Planie Zarządzania Danymi. Archiwizacja ma na celu ograniczenie kosztów związanych z przechowywaniem danych oraz utrzymanie ich dostępności. Coraz częściej funkcje archiwów pełnią otwarte repozytoria danych badawczych takie jak MOST DANYCH. W Internecie można znaleźć wiele dziedzinowych i instytucjonalnych repozytoriów danych. Czasami organizacja finansująca badania wymaga zdeponowania danych badawczych w konkretnym repozytorium, czasem pozwala deponującemu na samodzielne dokonanie wyboru.
Aby wyszukać odpowiednie repozytorium dla naszych danych możemy skorzystać z wyszukiwarki repozytoriów np. RE3DATA. Przy wyborze powinniśmy kierować się kilkoma wskazówkami:
- należy dokładnie zapoznać się z warunkami korzystania z serwisu i sprawdzić czy spełnia on nasze wymagania,
- warto również dowiedzieć się gdzie i na jakich zasadach będą przechowywane nasze dane oraz w jaki sposób będą zabezpieczone,
- aby zbiór danych spełniał wymogi zasad FAIR musi być możliwy do odnalezienia, dlatego należy upewnić się, że dane repozytorium zapewnia przypisanie naszym zbiorom identyfikatora DOI. Ważne jest również odpowiednie powiązanie zbioru z jego autorami, dlatego istotna jest opcja wprowadzenia do opisu identyfikatora naukowca (np. numeru ORCID),
- przy wyborze warto też sprawdzić czy inni naukowcy z naszej dyscypliny korzystają z danego repozytorium,
- należy dowiedzieć się, czy repozytorium wspiera używany w naszej dyscyplinie standard metadanych,
- trzeba mieć na uwadze, że niektóre repozytoria mogą pobierać opłatę za archiwizację danych – tzw. Data Processing Charge,
- ważnym aspektem aktywności naukowej jest popularyzacja dorobku naukowego, dlatego warto upewnić się, że zasoby wybranego przez nas repozytorium znajdują się w bazach indeksujących repozytoria danych badawczych. Przykładami takich baz są Data Citation Index, Mendeley Data czy Google Dataset Search.
Czy wiesz, że...
Dobre praktyki archiwizacji danych wymagają stosowania reguły 3-2-1 – tworzenie trzech kopi zapasowych, na dwóch odrębnych nośnikach, w tym jednej kopii w innej lokalizacji fizycznej np. inny budynek lub "chmura".