, , ,

RADOGOST – cyfrowe archiwum, które może zmienić polską archeologię?

|


, , ,

Każdego roku w Polsce powstają setki raportów z badań archeologicznych. Tysiące stron opisów, planów, zdjęć, analiz specjalistycznych. To ogromny zasób wiedzy o przeszłości. A jednak przez lata brakowało jednego miejsca, w którym te dane byłyby bezpieczne, uporządkowane i realnie dostępne. Projekt RADOGOST powstał właśnie po to, by dokumentacja archeologiczna nie znikała w szafach i na zapomnianych dyskach, lecz zaczęła pracować dla całego środowiska.

Każda osoba zajmująca się archeologią dobrze wie, że najważniejsze wcale nie są same wykopaliska. Po kilku tygodniach teren zostaje zasypany, a ślady działalności człowieka znów znikają z krajobrazu. To dokumentacja jest prawdziwym efektem badań: szczegółowe opisy warstw, rysunki profili, plany obiektów, dokumentacja fotograficzna, wyniki analiz ceramiki, kości, metali, próbek przyrodniczych. W praktyce to właśnie ona jest jedynym trwałym świadectwem przeprowadzonych prac.

Problem polega na tym, że dokumentacja przez dziesięciolecia była przechowywana bardzo różnie. Oczywiście istnieją archiwa wojewódzkich urzędów ochrony zabytków i to do nich trafia znaczna część materiałów z badań. Sam fakt istnienia archiwum nie rozwiązuje jednak wszystkich problemów. Część dokumentacji trafiała także do muzeów, jednostek naukowych, firm archeologicznych albo zostawała na prywatnych dyskach badaczy. Czasem była papierowa, czasem cyfrowa, czasem w obu wersjach naraz. Niektóre materiały były dobrze opisane, inne dało się odnaleźć tylko wtedy, gdy wiedziało się, kogo zapytać. Do tego dochodzi problem formatów, opisów, wersji plików, kontroli dostępu i możliwości szybkiego przeszukiwania zasobu. To właśnie dlatego zwykły załącznik do sprawozdania, płyta DVD albo pendrive przestały wystarczać. W wielu przypadkach są już wręcz anachronizmem.

Archiwum może więc formalnie istnieć, ale dane nadal mogą być trudne do odnalezienia i ponownego wykorzystania. W efekcie ogromna część wiedzy o przeszłości pozostawała w praktyce niewidzialna dla środowiska, choć formalnie przecież wiemy, że istnieje.

Kliknięcie w powyższy obrazek przenosi na stronę repozytorium

RADOGOST – więcej niż cyfrowy magazyn

RADOGOST ma odpowiadać właśnie na ten problem. Jego nazwa nawiązuje do słowiańskiego bóstwa, ale sama idea jest jak najbardziej współczesna: stworzyć miejsce, w którym archeologiczne dane badawcze można bezpiecznie zdeponować, opisać i udostępnić w sposób zgodny ze standardami otwartej nauki. Ważne jest jednak, by nie mylić repozytorium z przypadkowym folderem w chmurze. RADOGOST nie ma być tylko miejscem, do którego wrzuca się pliki „na wszelki wypadek”. Jego sens polega na tym, że dane są porządkowane przez metadane, czyli zestandaryzowane informacje opisujące zawartość zbioru. Dzięki nim można ustalić, czego dotyczą dane, kto je wytworzył, z jakiego stanowiska pochodzą, jakimi metodami je uzyskano, jakiego okresu dotyczą i na jakich zasadach można z nich korzystać.

To z pozoru techniczny szczegół, ale w praktyce zmienia bardzo dużo. Bez metadanych nawet najlepszy plik może stać się cyfrowym odpowiednikiem kartonu bez podpisu. Dotyczy to nie tylko starych archiwów, lecz także współczesnych artykułów, raportów czy komunikatów prasowych wrzucanych luzem do internetu, na prywatne strony, fanpejdże w mediach społecznościowych czy nawet platformy typu Academia.edu. Dziś samo istnienie pliku nie wystarcza. Może gdzieś leżeć, ale nikt go nie znajdzie. Dopiero dobrze opisane metadane sprawiają, że pojedynczy plik staje się częścią większego systemu wiedzy. Zamiast przeglądać setki stron papierowych inwentarzy, badacz w jednym systemie może odnaleźć informacje o badaniach prowadzonych w danym regionie, w określonym przedziale czasowym i o konkretnym charakterze. W jedną chwilę zyskuje dostęp do danych, które wcześniej wymagały żmudnych i czasochłonnych kwerend. W przyszłości może to oznaczać koniec sytuacji, w której każdy badacz od nowa poświęca setki godzin na tworzenie własnych map osadniczych dla tego samego regionu. Ten czas można byłoby przeznaczyć na to, co w archeologii najciekawsze: zadawanie nowych pytań, porównywanie danych i prowadzenie bardziej twórczych analiz.

Otwarte nie znaczy bez kontroli

W przypadku archeologii słowo „otwarte” zawsze wymaga dopowiedzenia. Otwartość danych badawczych jest ważna, ale nie wszystkie informacje powinny być natychmiast dostępne dla każdego użytkownika internetu. Dotyczy to zwłaszcza precyzyjnych lokalizacji stanowisk, danych wrażliwych konserwatorsko albo materiałów, które są jeszcze w trakcie opracowywania. RADOGOST uwzględnia ten problem. System pozwala różnicować poziomy dostępu i korzystać z embarga. Oznacza to, że dane mogą zostać zabezpieczone i opisane już teraz, ale nie muszą od razu w całości trafić do publicznego obiegu. Według założeń twórców obecny maksymalny okres embarga wynosi trzy lata.

To rozsądny kompromis. Z jednej strony chroni interes badaczy, którzy potrzebują czasu na opracowanie wyników. Z drugiej ogranicza sytuację, w której dokumentacja przez lata pozostaje całkowicie niewidoczna dla środowiska. Dane mogą być przygotowane do udostępnienia, a nie odkładane na bliżej nieokreśloną przyszłość. Równie istotne są licencje. Każdemu plikowi można przypisać zasady korzystania, dzięki czemu inni użytkownicy wiedzą, czy i jak mogą go używać, przetwarzać oraz cytować. To ważne, bo ponowne wykorzystanie danych nie powinno oznaczać dowolności. Otwarta nauka nie zwalnia z obowiązku rzetelnego wskazywania autorów i źródeł.

Widok listy zdeponowanych zbiorów danych w repozytorium RADOGOST. Już na tym poziomie widać podstawowe informacje o tytule, autorach, dacie deponowania, DOI oraz ewentualnym embargu na dostęp do danych
Widok listy zdeponowanych zbiorów danych w repozytorium RADOGOST. Już na tym poziomie widać podstawowe informacje o tytule, autorach, dacie deponowania, DOI oraz ewentualnym embargu na dostęp do danych

Czy to będzie płatne i czy przetrwa?

Wokół każdego cyfrowego narzędzia szybko pojawia się pytanie o koszty. W tym przypadku warto jasno powiedzieć: zgodnie z informacjami uzyskanymi od twórców repozytorium, RADOGOST nie jest pomyślany jako płatna usługa deponowania i pobierania danych. Byłoby to sprzeczne z ideą otwartej nauki, która stoi za całym przedsięwzięciem. To infrastruktura naukowa, która ma wspierać obieg danych, ich zabezpieczenie i ponowne wykorzystanie. Równie ważne są limity techniczne, bo mówimy przecież o dokumentacji, która potrafi zajmować dziesiątki gigabajtów. W RADOGOST limit wielkości pojedynczego pliku wynosi 4,7 GB, a w trakcie jednego transferu można przesłać pliki o łącznej wielkości 20 GB. Nie oznacza to jednak limitu 20 GB na cały zbiór danych: po zapisaniu jednej partii można dodawać kolejne. To wartości, które w praktyce pozwalają myśleć nie tylko o klasycznych raportach PDF.

RADOGOST już zresztą działa, jest ogólnodostępny pod adresem radogost.dariah.pl i każdy może go przetestować bez opłat za korzystanie z repozytorium. Jest też wciąż rozwijany przez zespoły z Uniwersytetu Warszawskiego, Uniwersytetu Marii Curie-Skłodowskiej oraz Interdyscyplinarnego Centrum Modelowania Matematycznego i Komputerowego UW. Nie jest to więc wyłącznie projekt informatyczny, lecz przedsięwzięcie tworzone na styku archeologii, archiwistyki, zarządzania danymi badawczymi i technologii cyfrowych.

Pozostaje oczywiście pytanie, czy dane zdeponowane dziś będą dostępne za pięć, dziesięć albo dwadzieścia lat. Uczciwa odpowiedź brzmi: nikt odpowiedzialny nie powinien obiecywać działania „do końca świata”. Takie deklaracje dobrze wyglądają w folderach promocyjnych, ale nie są poważną odpowiedzią na realne pytanie o trwałość cyfrowej infrastruktury. W trakcie pracy w redakcji „Archeologii Żywej” widziałem już co najmniej kilka inicjatyw, które miały podobne ambicje i publikowały nawet śmielsze zapowiedzi. W ich przypadku często na zapowiedziach się kończyło. RADOGOST nie powstał jednak jako prywatna inicjatywa jednej osoby lub firmy ani krótkotrwała strona przygotowana przy okazji pojedynczego grantu. Jest związany z DARIAH-PL, czyli polską częścią większej infrastruktury badawczej dla humanistyki i nauk o sztuce. DARIAH funkcjonuje w europejskim ekosystemie infrastruktury badawczej, a polska sieć ma status ważnego elementu krajowej infrastruktury naukowej.

Znaczenie ma też udział stabilnych instytucji: Uniwersytetu Warszawskiego, UMCS oraz ICM UW. Zwłaszcza ICM ma doświadczenie w rozwijaniu podobnych repozytoriów danych badawczych i oprogramowania. Innymi słowy, RADOGOST nie startuje od zera, lecz korzysta z kompetencji już budowanych przy innych repozytoriach. Do tego dochodzi szerszy kontekst. Polityka europejska i krajowa coraz mocniej przesuwa się w stronę otwartego dostępu do danych badawczych, zwłaszcza tych finansowanych ze środków publicznych. To nie jest chwilowa moda, lecz kierunek, który będzie wpływał na granty, wymagania instytucji naukowych i sposób rozliczania projektów.

RADOGOST powstał jako wyspecjalizowane repozytorium archeologiczne w szerszym ekosystemie narzędzi rozwijanych na bazie oprogramowania Dataverse i doświadczeń RepOD
RADOGOST powstał jako wyspecjalizowane repozytorium archeologiczne w szerszym ekosystemie narzędzi rozwijanych na bazie oprogramowania Dataverse i doświadczeń RepOD

Najwyższy czas na konserwatorski standard?

Dlaczego archeolog miałby z tego korzystać? Najprostsza odpowiedź brzmi: dla bezpieczeństwa, widoczności i wygody. Dane przechowywane wyłącznie na prywatnym dysku, w firmowym archiwum albo na pojedynczym nośniku są zawsze zagrożone. Dyski się psują, ludzie zmieniają pracę, instytucje reorganizują archiwa, a opisy plików po latach przestają być oczywiste nawet dla ich autorów. Repozytorium porządkuje ten chaos. Jest jeszcze jeden wątek, który warto mocniej podkreślić. Skoro RADOGOST powstaje w ramach oficjalnej infrastruktury naukowej i odpowiada na realny problem przechowywania danych archeologicznych, wojewódzkie urzędy ochrony zabytków powinny poważnie rozważyć wejście we współpracę z twórcami repozytorium. Nie chodzi o to, by z dnia na dzień zlikwidować wszystkie dotychczasowe procedury. Chodzi o zmianę priorytetu. Dokumentacja z badań archeologicznych nie powinna w pierwszej kolejności trafiać na płytę, pendrive albo przypadkowy nośnik, którego trwałość i dostępność są ograniczone. Docelowo priorytetową formą przekazania dokumentacji powinien być uporządkowany depozyt cyfrowy w repozytorium.

Dla urzędów konserwatorskich mogłoby to oznaczać rozwiązanie całego szerokiego problemu magazynowania danych. Zamiast kolejnych pudeł z płytami, opisanych pendrive’ów, folderów na lokalnych dyskach i pytań, kto ma dostęp do właściwej wersji dokumentacji, urząd otrzymywałby jeden link prowadzący do uporządkowanego, bezpiecznego i trwale opisanego zasobu. Taki odnośnik mógłby zostać wpisany do sprawy, decyzji, protokołu odbioru dokumentacji albo wewnętrznego systemu obiegu dokumentów. Dla archeologów oznaczałoby to mniej uznaniowości i większą pewność, że przekazywana dokumentacja nie trafi do cyfrowego niebytu. Dla całego środowiska – krok w stronę standardu, który odpowiada realiom archeologii XXI wieku.

Oczywiście wymagałoby to jasnych procedur, uzgodnienia poziomów dostępu, zasad ochrony informacji wrażliwych i integracji z praktyką administracyjną. Ale skoro samo repozytorium zostało zaprojektowane właśnie z myślą o takich problemach, nie wydaje się to zadaniem ponad siły. Kierunek moim skromnym zdaniem jest więc dość oczywisty. Jeśli państwo wymaga dokumentacji badań archeologicznych, powinno wspierać taki sposób jej przekazywania, który naprawdę zabezpiecza dane i pozwala z nich korzystać. Pokusa budowania własnych, osobnych rozwiązań przez każdą instytucję jest zrozumiała: uczelnie, muzea i urzędy mają swoje potrzeby, procedury i zasoby. Tyle że właśnie ten rozproszony model testowaliśmy już przez ostatnie dekady i naprawdę trudno udawać, że zadziałał. Po co więc ponownie wymyślać koło od nowa, skoro mamy już narzędzie stworzone dokładnie do tego celu?

Nie jest idealnie, ale to dobry początek

Nie znaczy to oczywiście, że RADOGOST jest narzędziem idealnym już na starcie. Próba stworzenia możliwie uniwersalnego repozytorium ma swoją cenę: formularz dodawania danych może odstraszyć niektórych już na starcie. Nawet jeśli pola obowiązkowe są oznaczone gwiazdką, sama liczba widocznych opcji, identyfikatorów, słowników, powiązań, afiliacji i metadanych może sprawiać wrażenie, że przed zwykłym zdeponowaniem dokumentacji z badań trzeba najpierw przejść mały kurs zarządzania danymi badawczymi.

Być może warto byłoby rozważyć prostszy tryb podstawowy, w którym osoba chcąca po prostu dodać dokumentację z badań widzi tylko niezbędne pola, a bardziej zaawansowane opcje może rozwinąć dopiero wtedy, gdy rzeczywiście ich potrzebuje. Jeszcze lepszym rozwiązaniem byłoby zaprzęgnięcie do tego narzędzi AI: użytkownik mógłby wkleić abstrakt, fragment sprawozdania albo gotowy opis badań, a system proponowałby wstępnie wypełnione metadane, słowa kluczowe, chronologię, typ badań czy nawet gotowy blok JSON do sprawdzenia i wklejenia. Oczywiście po stronie człowieka musiałaby pozostać ostateczna kontrola, ale taki asystent znacząco obniżyłby próg wejścia. Z opublikowanych informacji o serwisie wynika, że dostępny jest już chatbot, ale podczas testów nie udało mi się odkryć jak go uruchomić. To drobiazg, lecz dość dobrze pokazuje szerszy problem: narzędzie może mieć przydatne funkcje, ale jeśli użytkownik nie wie, gdzie ich szukać, w praktyce one nie działają. Podobnie nie wszystkie pola pomocy rzeczywiście pomagają. Gdy po najechaniu na pytajnik przy „Powiązany plan zarządzania danymi” dowiadujemy się, że chodzi o „Related Data Management Plan”, to nie jest wyjaśnienie, tylko tłumaczenie etykiety na angielski.

Druga sprawa to język i sposób wyszukiwania. Rozumiem presję na anglojęzyczność metadanych, zwłaszcza w projektach finansowanych ze środków europejskich i wpisanych w międzynarodowy obieg naukowy. Ale podstawowym językiem widocznym dla polskiego użytkownika powinien być jednak język polski. Skoro repozytorium ma służyć także archeologom, muzealnikom, urzędnikom konserwatorskim i osobom pracującym z polską dokumentacją, nie utrudniajmy im życia bez potrzeby. Tym bardziej że mechanizmy tłumaczeń już w serwisie funkcjonują. Szczególnie dziwnie wygląda sytuacja, w której periodyzacja, nawet jeśli technicznie oparta na identyfikatorach PeriodO, pojawia się użytkownikowi jako „Neolithic”, zamiast po prostu „neolit”. Nie wspominając już o tym, że w wyszukiwaniu (także zaawansowanym) trzeba w związku z tym wpisać właśnie „Neolithic”, a nie „neolit”. Tak być nie powinno! Przydałyby się także szybkie filtry wyszukiwania po epokach, okresach i kulturach archeologicznych, bo właśnie w taki sposób wielu archeologów naturalnie myśli o materiale, zaś od daty zdeponowania o wiele ważniejsza wydaje się data prowadzenia badań.

Pozostaje też kwestia bardzo dużych zbiorów danych. Jak wspomniałem same limity przesyłania są obiecujące: pojedynczy plik może mieć 4,7 GB, a w jednej transzy można przesłać 20 GB. Problem zaczyna się jednak wtedy, gdy dokumentacja z badań ma kilkadziesiąt albo kilkaset gigabajtów. Największy znaleziony przeze mnie zbiór pochodzi z badań Berenike w 2021 r. i waży trochę ponad 100 GB. Formalnie działa, ale praktycznie oznacza to, że bez pobrania całości trudno zapoznać się z zawartością, a użytkownik musi liczyć, że przy rozpakowywaniu jednej z wielu części nie pojawi się błąd. To zapewne nie jest łatwe do rozwiązania technicznie, ale trochę kłóci się z ideą wygodnej otwartości danych. Dobrze byłoby więc w przyszłości pomyśleć o lepszym podglądzie zawartości dużych pakietów, wygodniejszym grupowaniu plików i narzędziach, które pozwolą sprawdzić, co znajduje się w zbiorze, zanim pobierze się dziesiątki gigabajtów.

Nie miałem też okazji przetestować podglądu modeli 3D bezpośrednio w serwisie. Zakładam, że większość takich plików z racji objętości, ukryta jest właśnie w skompresowanych paczkach. Jedyny model gotowy do poglądu, który znalazłem wyświetlił komunikat „Plik jest abyt duży dla funkcji podglądu” (pisownia oryginalna). Na co dzień bardziej przydatny byłby zresztą prosty lightbox do zdjęć i grafik, bo obecnie użytkownik widzi wyłącznie skompresowane miniaturki. Nie udało mi się też natrafić na plik gdzie mógłbym skorzystać z opcji OCR lub HTR, które ponoć też już funkcjonują w systemie.

Repozytorium pozwala wyszukiwać dane także za pomocą mapy. To jedna z najważniejszych funkcji dla archeologii
Repozytorium pozwala wyszukiwać dane także za pomocą interaktywnej mapy

Najpoważniejsze wątpliwości mam jednak w kwestii sposobu lokowania i nazywania badanych stanowisk. W Polsce funkcjonuje już system identyfikacji stanowisk archeologicznych, który ma swoje wady, ale mimo upływu dekad działa całkiem nieźle. Można wręcz powiedzieć, że jest jedną z niewielu rzeczy utrzymujących pewien stopień organizacji w ogromnym i rozproszonym zasobie informacji o stanowiskach. Tymczasem w RADOGOST dominuje logika zbiorów danych, współrzędnych geograficznych i identyfikatorów GeoNames. Mapa częściowo rozwiązuje problem, bo lokalizacja jest obowiązkowa i wyszukiwanie przestrzenne działa, ale lokalizacja nie zastępuje identyfikatora stanowiska. Przy kilkudziesięciu zbiorach nie będzie to kłopotliwe, lecz przy kilkuset lub kilku tysiącach zacznie mieć znaczenie, czy dokumentację „Białogórze, st. 1” da się znaleźć po oznaczeniu funkcjonującym w polskiej praktyce archeologicznej, czy dopiero przez klikanie po mapie i zgadywanie, jak deponujący opisał zbiór. Być może wynika to z doświadczeń zespołów pracujących także poza Polską, gdzie współrzędne, GeoNames i międzynarodowe słowniki są naturalniejszym punktem odniesienia. W polskich realiach warto jednak rozważyć obowiązkowe albo przynajmniej wyraźnie wyeksponowane pola dla obszaru AZP, numeru stanowiska na obszarze i numeru stanowiska w miejscowości. Nie jako konkurencję dla mapy czy GeoNames, lecz jako konieczne spięcie repozytorium z istniejącym systemem ewidencji. Bez tego dane będą co prawda zdeponowane poprawnie technicznie, ale ich powiązanie z konkretnym stanowiskiem nadal może zależeć od dobrej woli, konsekwencji i terminologii osoby dodającej zbiór.

Są to jednak problemy do rozwiązania, a nie argumenty przeciwko samemu repozytorium. Przeciwnie: pokazują raczej, że RADOGOST wszedł już na etap, na którym można go testować w realnych warunkach i zgłaszać konkretne potrzeby użytkowników. Najważniejsze, by rozwój systemu nie zatrzymał się na samym fakcie uruchomienia platformy. Jeśli ma to być narzędzie dla całego środowiska, musi być nie tylko poprawne technicznie i zgodne ze standardami, ale też wygodne dla ludzi, którzy po całym sezonie badań chcą po prostu bezpiecznie zdeponować swoją dokumentację i mieć pewność, że inni będą potrafili ją odnaleźć.

Podobno najważniejszy jest kontekst

Jeżeli RADOGOST zostanie szeroko przyjęty, może z czasem zmienić sposób uprawiania archeologii w Polsce: ułatwić tworzenie syntez regionalnych i ponadregionalnych, przyspieszyć dostęp do danych oraz ograniczyć powielanie tych samych kwerend. Może też sprawić, że ogromny wysiłek wkładany w dokumentację nie będzie kończył się na złożeniu sprawozdania i wgraniu plików na kolejny dysk. To nie jest projekt spektakularny w medialnym sensie. Nie przynosi złotych skarbów ani sensacyjnych odkryć. A jednak jego znaczenie dla przyszłości archeologii może okazać się większe niż niejednego znaleziska.

Często powtarzamy, że w archeologii najważniejszy jest kontekst. Tylko co właściwie znaczy ta deklaracja, jeśli dokumentacja tego kontekstu pozostaje praktycznie niedostępna, a do obiegu trafia najczęściej dopiero jej skrócona, przetworzona wersja w artykułach i sprawozdaniach? RADOGOST może pomóc skończyć z tą fikcją. Może sprawić, że kontekst nie będzie żył tylko do momentu zasypania wykopu, lecz stanie się częścią wspólnego, sprawdzalnego i możliwego do wykorzystania zasobu wiedzy.

Źródło: repozytorium RADOGOST (radogost.dariah.pl), portal Archeowieści (archeowiesci.pl)

Redaktor naczelny AŻ | Strona

Archeolog, doktor nauk inżynieryjno-technicznych, popularyzator. Pierwsza osoba, z którą powinno się kontaktować w sprawie patronatów i ewentualnej współpracy z „Archeologią Żywą”. Jego zainteresowania badawcze koncentrują się wokół kultury materialnej późnego średniowiecza i wykorzystania nowoczesnych technologii w archeologii. Pasjonat multimediów i gier komputerowych. Prowadzący cyklu cotygodniowych popularnonaukowych webinarów pt. „Kontekst Archeologii Żywej”

Dodaj komentarz

Działalność czasopisma „Archeologia Żywa” w latach 2026–2027 jest dofinansowana ze środków Ministra Kultury i Dziedzictwa Narodowego, pochodzących z Funduszu Promocji Kultury – państwowego funduszu celowego – w ramach programu „Czasopisma 2026”.

css.php