Biblioteka Uniwersytetu Warszawskiego. Fot. PAP/Rafał Guz
Tam, gdzie algorytmy sztucznej inteligencji (AI) zawodzą, wciąż niezbędny jest czas i wnikliwość ludzi. Biblioteka Uniwersytecka w Warszawie (BUW) zaprasza wolontariuszy do odszyfrowywania cennych manuskryptów w ramach projektu TranskriBUW.
Inicjatywa oparta na nauce obywatelskiej wykorzystuje metodę crowdsourcingu, dając szansę na bezpośredni kontakt z obiektami historycznymi osobom, które nie są zawodowymi badaczami.
– Żeby właściwie skatalogować obiekt, bibliotekarz musi być badaczem – powiedziała w rozmowie z PAP Agnieszka Kościelniak-Osiak, wicedyrektorka BUW. Wyjaśniła, że to trudne zadanie, ponieważ wiele dokumentów w zbiorach nie posiada np. tak oczywistego elementu jak strona tytułowa, z informacją o autorze i dacie publikacji.
Wiceszefowa podaje przykład tzw. zbiorów specjalnych, np. dokumentów królewskich, gdzie bibliotekarze muszą rozpoznawać typ pisma, pieczęcie czy tytulaturę. – To w oparciu o te dane określamy często odbiorcę i nadawcę, umiejscawiamy dany dokument w czasie i przestrzeni, i dopiero wtedy możemy jego opis umieścić w naszych katalogach. Staje się on wówczas wyszukiwalny dla badaczy. Rozpoznanie zawartości naszych zasobów wymaga więc ogromnej wiedzy i czasu, a my mamy do skatalogowania dziesiątki tysięcy obiektów – zaznaczyła.
Sytuacja badawcza BUW jest szczególna ze względu na historię. – Podczas II wojny światowej biblioteka straciła ponad 90 proc. rękopisów. Jednak od 1945 roku nasze zbiory znów zaczęły być gromadzone – opowiedziała wiceszefowa instytucji. Trafiają tu m.in. spuścizny badaczy z Uniwersytetu Warszawskiego i nie tylko, w tym artefakty kultur orientalnych, Afryki czy Azji. Często są to materiały, o których naukowcy nie zostawili żadnych informacji – zdarza się, że nie wiadomo nawet, w jakim alfabecie zostały sporządzone.
Niektóre zadania nie wymagają jednak specjalistycznej wiedzy, a jedynie zaangażowania. Obecnie wolontariusze biorą na warsztat rysunek mikrograficzny z 1762 r. autorstwa Emanuela Listnaua, przedstawiający portret konny króla Prus Fryderyka II Wielkiego. Portret wykonany jest napisami, które tworzą całość wizerunku. Pomoc pasjonatów pomoże odczytać tekst napisany po niemiecku odręczną “szwabachą”.
Praca wolontariuszy jest niezbędna, ponieważ współczesne technologie mają ograniczone zastosowanie przy rzadkich dokumentach. – Aby wytrenować algorytmy AI, potrzeba tysięcy przykładów i ich translacji, których brakuje przy unikatowych rękopisach. Problemem dla programów komputerowych jest nawet szwabacha – specyficzny gotycki font, który w wersji pisanej odręcznie jest niezwykle trudny do odszyfrowania – zauważają organizatorzy projektu.
Wśród udostępnionych materiałów znajdują się także plany bitwy pod Pragą z 1757 roku oraz projekty przebudowy Pałacu Saskiego. Duże zainteresowanie budzą akta rozwodowe z przełomu XVIII i XIX wieku. - Są napisane bardzo soczystym językiem. To opisy wzajemnych oskarżeń małżonków i opinie przyjaciółek rodziny. Dla badaczy to kopalnia wiedzy o obyczajowości – podkreśliła Agnieszka Kościelniak-Osiak.
Dwa lata temu w ramach akcji transkrypcyjnej przy okazji rocznicy Powstania Warszawskiego wolontariusze pracowali nad notatkami prof. Wacława Borowego z Powstania Warszawskiego – z 95 stron rękopisu udało się przepisać 55.
Urszula Szwed-Strych z BUW, zajmująca się projektem, wyjaśnia, że do transkrypcji trafiają materiały, które osoby bez zaplecza naukowego mają szansę rozszyfrować. – Najważniejsza jest zasada „1:1”. Jeśli autor dokumentu zrobił błąd ortograficzny albo coś skreślił, transkrypcja musi to uwzględniać – zaznaczyła.
Obecnie społeczność uczestników projektu liczy ok. 240 osób. Prace odbywają się głównie w zamkniętej grupie projektu TranskriBUW w mediach społecznościowych oraz na platformie projektu. Każdy może do nich dołączyć.
Ludwika Tomala (PAP)
lt/ zan/