JAKIE POWINNY BYĆ OTWARTE DANE BADAWCZE?
Otwarte dane badawcze powinny być:
- Zapisane – w formatach łatwych do otworzenia i odczytania, najlepiej przy pomocy oprogramowania typu open source. W innych przypadkach zalecane jest wskazanie (bądź udostępnienie) oprogramowania umożliwiającego te działania. Format danych powinien być „otwarty”, czyli dawać możliwość ich ponownego wykorzystania (modyfikacji, przetwarzania). Dane powinny być zapisane z wykorzystaniem standardowego kodowania (ASCII, Unicode).
- Przechowane (bezpieczna archiwizacja) – zdeponowane długoterminowo w repozytorium/archiwum.
- Dostępne – na określonych warunkach dostępu do danych i oprogramowania. Zalecane licencje dla danych badawczych to Creative Commons Zero (CC 0) – oświadczenie o zrzeczeniu się praw lub Creative Commons By (CC BY) – uznanie autorstwa, choć ta ostatnia niesie ze sobą ryzyko nawarstwiania atrybucji (konieczność podawania autorów wszystkich danych, z których skorzystaliśmy). Pozostałe licencje w pewnych zakresach są niewłaściwe dla udostępniania danych, gdyż w ostatecznym rozrachunku ograniczają ich otwartość.
- Łatwe do znalezienia – np. poprzez zastosowanie DOI. Powiązanie danych z publikacją oraz innymi materiałami sprawia, że liczba ścieżek dotarcia do danych się zwiększa.
- Zrozumiałe – to znaczy opisane w sposób kompletny i zrozumiały, tak aby osoby trzecie mogły je odczytać i ponownie wykorzystać. Zalecane jest stosowanie ujednoliconych standardów tworzenia metadanych (Dublin Core, OpenAIRE Guidelines). Należy dołączyć także dokumentację dotyczącą samego zbioru danych (nazwy i opis zmiennych, rekordów, wartości, opisy zastosowanych schematów klasyfikacyjnych, informacje o urządzeniach pomiarowych, dane przetworzone wraz z oprogramowaniem lub algorytmami zastosowanymi do ich uzyskania), jak i całego projektu (opis celu i kontekst badań, sposoby pozyskiwania danych, procedury, struktura plików z danymi, relacje między plikami, formularze zgody, informacje o różnych wersjach zbiorów danych itp.).
- Zaufane – z określonym autorstwem oraz afiliacją osób odpowiedzialnych za zebranie, przygotowanie czy przetworzenie danych, co pomaga w ocenie ich rzetelności, jakości i wiarygodności.
- Interoperacyjne – zapewniające możliwość ich swobodnej wymiany między naukowcami, instytucjami i innymi zainteresowanymi, możliwość ponownego wykorzystania w innych kontekstach niż ten, w którym zostały zebrane. Interoperacyjność oznacza także możliwość łączenia ich z innymi danymi (dzięki współpracy różnych systemów).
- Odtwarzalne – zapewniające możliwość ponownego wykorzystania w dowolnej formie oraz wykonania jakichkolwiek operacji: pobierania, zapisania, maszynowego przetwarzania, modyfikacji, zmiany, redystrybucji.
Źródło: E. Strzelczyk, Otwarte dane badawcze – kolejny krok do otwierania nauki, [dostęp 16.03.2020]