Data publikacji w serwisie:

Leksykografia bez komputerów nie istnieje

Przetwarzanie języka naturalnego polega na takim przekształcaniu tekstów, aby uzyskać ustrukturyzowane pod dowolnym względem dane, często powiązane z wynikiem naukowym. Z dr. Filipem Gralińskim z Wydziału Matematyki i Informatyki o leksykografii w świecie wirtualnym rozmawia Jagoda Haloszka.

Skąd w panu zamiłowanie do języka polskiego? Jest pan z wykształcenia informatykiem.

Tak, jestem informatykiem. Natomiast moje zainteresowania badawcze od zawsze były na styku informatyki i humanistyki, a w szczególności językoznawstwa. Obejmowały dziedzinę nazywaną przetwarzaniem języka naturalnego albo lingwistyką komputerową. Moje zainteresowania szły najpierw w stronę bardziej teoretyczną, natomiast później zacząłem zaprzęgać komputer do przetwarzania rzeczywistych, prawdziwych tekstów, które mamy w Internecie. To też wiązało się trochę z moimi innymi zainteresowaniami, bowiem interesuję się również amatorsko folklorem, przede wszystkim folklorem współczesnym. Zaczęło się to od łańcuszków św. Antoniego, później zająłem się legendami miejskimi. Niektóre z nich są humorystyczne, ale zdarzają się też mrożące krew w żyłach. Efektem tych moich zainteresowań jest książka pt. Znikająca nerka, opisująca osiemdziesiąt trzy historie, które „zdarzyły się z pewnością wam lub waszym znajomym”.

Na czym polega przetwarzanie języka naturalnego?

Przetwarzanie języka naturalnego polega na takim przekształcaniu tekstów czy potoku mowy, aby uzyskać ustrukturyzowane pod dowolnym względem dane, często powiązane z wynikiem naukowym. Do tego dochodzą aspekty związane z rozumieniem, tłumaczeniem czy wreszcie generowaniem języka naturalnego przez komputer jak sterowanie głosem, systemy dialogowe itp.

Wspomniał pan o swoich zainteresowaniach legendami miejskimi. Z pewnością wtedy przydawała się specjalistycznie zaprojektowana i opracowana wyszukiwarka.

Tak. Dzięki niej odkryłem wiele nowych, nieznanych legend, ale również z pomocą przyszli mi internauci, którzy podsyłali historie. Okazywało się, że można je wyszukiwać przez charakterystyczne frazy np. „znajomy znajomego opowiadał”. Co zabawne, bardzo dobrym sposobem wyszukiwania legend miejskich są frazy, np. „autentyczna opowieść”, „rzekomo prawdziwa historia”. Rzeczywistość Internetu zaczęła się zmieniać, co zniechęciło mnie do wyszukiwania tekstów. Stwierdziłem wtedy, że trzeba zacząć to jakoś automatyzować.

Cały artykuł dostępny uniwersyteckie.pl

Tekst: Jagoda Haloszka