Data publikacji w serwisie:

Leksykografia w świecie wirtualnym - rozmowa z dr Filipem Gralińskim

zdjęcie portretowe dr Filipa Gralińskiego

Jagoda Haloszka rozmawia z dr Filipem Gralińskim z Wydziału Matematyki i Informatyki o leksykografii w świecie wirtualnym.

Dr Filip Graliński to informatyk, którego zainteresowania zawsze były na styku informatyki i humanistyki. Szczególną uwagę poświęcał językoznawstwu. Interesowała go dziedzina językoznawstwa nazywana przetwarzaniem danych albo lingwistyką komputerową.

Przetwarzanie języka naturalnego polega na takim przekształcaniu tekstów czy potoku mowy, aby uzyskać ustrukturyzowane pod dowolnym względem dane, często powiązane z wynikiem naukowym. Do tego dochodzą aspekty związane z rozumieniem, tłumaczeniem czy wreszcie generowaniem języka naturalnego przez komputer jak sterowanie głosem, systemy dialogowe itp.

Zdobywanie wiedzy teoretycznej naukowiec z UAM połączył z praktyką. Teksty, które przetwarzał to przede wszystkim legendy miejskie. Korzystając ze specjalnej wyszukiwarki znajdował coraz starsze teksty.

- Skupiłem się na tym jak zmieniał się język polski, jak zmieniały się jego konwencje, zapis czy szyk, a także jakie nowe wyrazy się pojawiły, czy też zniknęły z naszego systemu językowego. Udało nam się zebrać bardzo duży ponad dwustuletni korpus diachroniczny. Dzięki temu, że te masy tekstów m.in. z XIX i XX wieku są bardzo duże, można stosować metody informatyczne oparte na maszynowym liczeniu czy sztucznej inteligencji - mówi dr Graliński.

Naukowiec UAM rozpoczął współpracę z językoznawcą prof. Piotrem Wierzchoniem z Instytutu Językoznawstwa. Wspólnie uzyskali grant „50 000 słów”. Grant jest na pomysł stworzenia indeksu tematycznego z polszczyzny międzywojennej.

- Czasem słyszy się mylne tezy, że gwałtowny wzrost bogactwa polszczyzny nastąpił po II wojnie światowej. My natomiast po prostu pokazujemy – na przykład w pracy „Z kart historii „parcia na” neologizmy”, opublikowanej w „Poradniku Językowym”, że to fałszywy pogląd. Już przed wojną bowiem w wielu dziedzinach nauki i życia polszczyzna była bogata leksykalnie w wielu wymiarach - kwituje naukowiec.

Zainteresowanych efektami pracy naukowców zapraszamy na blog Re-research. pl.

Zachęcamy do przeczytania całego wywiadu dostępnego na stronie "Życia Uniwersyteckiego", aby dowiedzieć się więcej o redatacji wyrazów czy normalizacji diachronicznej. W artykule autorstwa Jagody Haloszki można przeczytać też o wykorzystaniu bazy fotokorpusowej.