Cyfrowa Infrastruktura Badawcza dla Humanistyki i Nauk o Sztuce DARIAH-PL

Logotyp DARIAH-PL

Projekt Cyfrowa Infrastruktura Badawcza dla Humanistyki i Nauk o Sztuce DARIAH-PL, którego liderem jest Instytut Podstaw Informatyki PAN, a jednym z członków konsorcjum UAM, jest realizowany w latach 2024-2025 w ramach Inwestycji A2.4.1 Krajowego Planu Odbudowy i Zwiększania Odporności (finansowanie infrastruktury badawczej).

Na pięciu wydziałach UAM działa sześć modułów infrastruktury cyfrowej dla humanistyki, wzmacniającej potencjał badawczy uniwersytetu. Dzięki pracom w sieci rozproszonych laboratoriów DARIAH-hub powstaje m.in. innowacyjne oprogramowanie, umożliwiające: digitalizację cennych danych o kulturze, wytwarzanie, przetwarzanie, archiwizację oraz inteligentną analizę danych cyfrowych. Wypracowane narzędzia i zasoby zostaną zintegrowane na powstającej Platformie Badań Interdyscyplinarnych. Kierownikiem projektu na UAM jest dr Brygida Sawicka-Stępińska.

W projekcie wykorzystywane są m.in. narzędzia i zasoby wypracowane w ramach realizowanego w latach 2021-2023 przedsięwzięcia DARIAH.lab, finansowanego ze środków Programu Operacyjnego Inteligentny Rozwój. Projektem Dariah.lab, zrealizowanym w konsorcjum na czele z Poznańskim Centrum Superkomputerowo-Sieciowym, kierowała z ramienia UAM prof. UAM dr hab. Katarzyna Klessa.

Strona internetowa projektu: https://lab.dariah.pl/

Film o projekcie Dariah.lab:

Moduły DARIAH działające na UAM

MultiCo Tools (Wydział Neofilologii)

Koordynator: prof. UAM dr hab. Maciej Karpiński, maciej.karpinski@amu.edu.pl

W zespole MultiCo Tools, działającym na Wydziale Neofilologii, powstało laboratorium badań komunikacji multimodalnej oraz korpus multimodalny MultiCo zdeponowany w publicznym repozytorium CLARIN-PL. Korpus umożliwia wieloaspektową analizę komunikacji międzyludzkiej, uwzględniającą parametry mowy i ruchu. Zawiera 15 godzin wielowarstwowo anotowanych nagrań audio i wideo z wykorzystaniem kamer motion capture, służących do przechwytywania ruchu. Nagrania tworzą trzy podkorpusy: monologi, zawierające wystąpienia parlamentarne oraz TEDex, dialogi, oparte na zadaniach wykonywanych przez uczestników w warunkach laboratoryjnych, oraz multilogi, przedstawiające dyskusje kilkorga mówców w programach sportowych.

Obecnie opracowywane są narzędzia umożliwiające holistyczne podejście do komunikacji interpersonalnej, w tym analizę i interpretację znaczenia ruchu w kontekście komunikacyjnym i kulturowym. Przy użyciu danych z kamer motion capture, w sposób zautomatyzowany analizowana jest przestrzeń gestowa z podziałem na strefy gestykulacyjne, dopasowanie gestowe w komunikacji interpersonalnej oraz elementy rytmu.

HANOI (Wydział Anglistyki)

Koordynatorka: dr Anna Jelec, jelec@amu.edu.pl

HANOI (Handwritten Notes of Interpreters) to jedyny na świecie zbiór notatek i zapisków ręcznie wykonanych przez zawodowych tłumaczy ustnych oraz studentów tłumaczenia wraz z narzędziami do badania ich parametrów. Tłumacze symultaniczni i konferencyjni, którzy pracują w bardzo szybkim tempie, używają specyficznego systemu notowania. Dzięki analizie tych zapisów, tłumacz będzie mógł np. otrzymać rekomendację, jak zwiększyć swoje kompetencje.

Ponadto, tłumacze konsekutywni obsługują wizyty oficjalne i dyplomatyczne, konferencje naukowe, wykłady, kluczowe inwestycje i spotkania na najwyższym szczeblu biznesu, edukacji, kultury i sztuki. Stąd, notacja konsekutywna to wyjątkowy twór językowy:

  • źródło informacji o procesach językowych i poznawczych (związki z kognitywistyką, psychologią, językoznawstwem)
  • zapis na styku dwóch języków i kultur (związki z badaniami nad kulturą)
  • unikalne archiwum spotkań z zakresu biznesu, kultury, sztuki, techniki i humanistyki (związki z badaniem dyskursu, kognitywistyką, socjologią, historią).

Obecne prace obejmują wzbogacenie korpusu skanów notatek o moduł multimodalny pozwalający powiązać wypowiedź źródłową, wykonane przez tłumacza notatki oraz tłumaczenie wypowiedzi. W laboratorium MultiCo powstają nagrania audio i wideo z udziałem tłumaczy ustnych, które umożliwią analizę przebiegu procesu tłumaczenia.

LinguoMusa (Wydział Nauk o Sztuce, Instytut Muzykologii)

Koordynator: prof. UAM dr hab. Piotr Podlipniak, piotr.podlipniak@amu.edu.pl

Laboratorium LinguoMusa opracowuje narzędzia do badań muzyki, mowy i gestu. Zespół specjalistów opracował oprogramowanie do automatycznej analizy nagrań pod kątem informacji o wysokości dźwięku i wzorcach rytmicznych. Narzędzia te są obecnie wykorzystywane do dostarczenia danych na temat następstwa dźwięków w polskiej muzycznej kulturze ludowej na materiale zgromadzonym w Archiwum Audiowizualnym Wydziału Nauk o Sztuce UAM. Modele dystrybucyjne posłużyć mogą jako ważny element rekonstrukcji wiedzy o kulturze ludowej do wykorzystania przez profesjonalnych badaczy muzyki.

Ponadto, trwają prace nad interaktywnym diagramem powstania i rozwoju muzyki i języka ludzkiego. Diagram będzie prezentował aktualny stan wiedzy na temat możliwych przejawów muzykowania i posługiwania się językiem naturalnym w okresie paleolitu. Będzie się składał z rozmieszczonych na osi czasu kart, zawierających odniesienia do hipotetycznych etapów powstawania muzyki i języka wraz z odniesieniami do publikacji naukowych dostarczających przesłanek dla reprezentowanej diachronii zdarzeń oraz posiadania przez dane homininy wskazanych zdolności.

Laboratorium posiada aparaturę umożliwiającą rejestrację parametrów fizjologicznych uczestników badań (EEG, przewodzenie skórne).

Archiwum Audiowizualne Wydziału Nauk o Sztuce (Instytut Historii Sztuki, Instytut Muzykologii)

Koordynatorka: dr Kamila Kłudkiewicz, kamila.kludkiewicz@amu.edu.pl

Strona www: https://archiwum.wnos.amu.edu.pl/home

Archiwum Audiowizualne Wydziału Nauk o Sztuce UAM jest jednostką badawczą, której celem jest zabezpieczenie, naukowe opracowanie oraz udostępnienie następujących materiałów z następujących kolekcji:

  • Fototeka Instytutu Historii Sztuki UAM
  • Archiwum Instytutu Historii Sztuki UAM
  • Zbiory fonograficzne Instytutu Muzykologii UAM

Fototeka IHS UAM stanowi bogaty zbiór reprodukcji (od szklanych diapozytywów z początku XX wieku, odbitek, negatywów, pocztówek po kolorowe slajdy), którego początki sięgają 1903 r. Łącznie liczy ponad 140 tyś obiektów, obecnie inwentaryzowanych i porządkowanych.

Archiwum IHS UAM zawiera dokumenty z czasów Seminarium Historii Sztuki na Uniwersytecie Poznańskim w dwudziestoleciu międzywojennym, niemieckiego Instytutu Historii Sztuki na nazistowskim Uniwersytecie Rzeszy oraz powojennego Instytutu Historii Sztuki UAM. W jego skład wchodzą również spuścizny pracowników IHS UAM (prof. A. Karłowskiej-Kamzowej, prof. E. Iwanoyki, dr Z. Białłowicz-Krygierowej, prof. G. Chmarzyńskiego, prof. Z. Kępińskiego), w tym archiwum prof. Piotra Piotrowskiego.

Archiwum Audiowizualne zawiera ponadto fonograficzną dokumentację trzydziestu obozów etnomuzykologicznych dla studentów, prowadzonych przez Instytut Muzykologii UAM w latach 1976-2006.

Archiwa rozproszone Wydziału Filologii Polskiej i Klasycznej

Koordynator: prof. UAM dr hab. Mirosław Wobalis, miroslaw.wobalis@amu.edu.pl

Zespół WFPiK kładzie nacisk na wytworzenie narzędzi do badań literaturoznawczych i językoznawczych. W module powstają m.in. narzędzia do głębokiej analizy źródeł, mapowania i wizualizacji dzieł literackich czy tworzenia i badania literatury elektronicznej. W zakresie pozyskiwania źródeł zdigitalizowano, opracowano i zdeponowano w bezpiecznym repozytorium ok. 10 tysięcy stron „Kaliszanina”, czasopisma ukazującego się w XIX w. w zaborze rosyjskim i dostępnego dotychczas jedynie w małych wycinkach.

Archiwa rozproszone to zarówno zbiór nowatorskich narzędzi do badań literaturoznawczych i językoznawczych opartych o sztuczną inteligencję, jak i archiwum wstępnie opracowanych materiałów źródłowych w wersji cyfrowej. Narzędzia te obejmują m. in. „Biurko badacza” do cyfrowej edycji źródeł i wsparcia badań, system mapowania literackiego w oparciu o wybrane teksty kultury (w ramach projektu opracowaniu teksty wokół mitu o Tezeuszu) oraz internetowe narzędzie do kolaboratywnej animacji i hipertekstu: INKAH.

Aktualne prace obejmują trzy moduły:

  • archiwum regionalizmów i gwar wielkopolskich,
  • „litterae indipetae” – opracowanie edytorsko-naukowe źródeł łacińskich i greckich stanowiących dziedzictwo kultury polskiej,
  • archiwum polskiej literatury elektronicznej 1980-2020.

Narzędzia normalizacji i analizy tekstów drukowanych i notatek ręcznych (Wydział Matematyki i Informatyki)

Koordynator: prof. Krzysztof Jassem, jassem@amu.edu.pl

Strona www: https://diachronia.csi.wmi.amu.edu.pl/

Zespół WMI opracowuje narzędzia datowania, normalizacji i wyszukiwania w tekstach. Jednym nich jest oprogramowanie do automatycznej diachronicznej normalizacji tekstów polskich. Pozwala ono „uwspółcześnić” teksty historyczne, tłumacząc je na język, jakim się dziś posługujemy. Inne narzędzia służą do np. datowania tekstów czy wyszukiwania informacji.

Przykładowe narzędzia opracowane przez zespół prof. Jassema obejmują:

  • normalizator diachroniczny: oprogramowanie do automatycznej diachronicznej normalizacji tekstów polskich – „uwspółcześniania” tekstów historycznych poprzez tłumaczenie ich na język współczesny, co umożliwia przeszukiwanie zasobów archiwalnych za pomocą współczesnych słów kluczowych
  • oprogramowanie do datowania tekstów: określenie daty powstania tekstu na podstawie jego treści z dokładnością średnio do 14 lat
  • oprogramowanie uwspółcześniające synonimy: wyszukiwanie słów historycznych i zamiana ich na wyrazy współczesne o takim samym lub podobnym znaczeniu a odmiennym brzmieniu
  • oprogramowanie pozwalające na wyszukiwanie w tekście tych samych osób występujących pod różnymi nazwami (np. postaci w tekstach literackich).

Obecnie trwają prace nad normalizacją i ujednoznacznieniem nazw w zdigitalizowanych przez zespół Wydziału Filologii Polskiej i Klasycznej wydaniach czasopisma „Kaliszanin”, ukazującego się w XIX wieku w zaborze rosyjskim. Opracowywane jest również narzędzie do automatycznego rozpoznawania notatek ręcznych pod kątem tego, czy zostały stworzone przez tłumacza zawodowego czy niezawodowego.