Dr Barbara Konat z Laboratorium Badania Rozumowań Zakładu Logiki i Kognitywistyki prowadzi badania nad argumentacją i emocjami w języku. Zajmuje się ich komputerowym przetwarzaniem. O jej pracy badawczej, projektach z pogranicza nauki i biznesu oraz o tym, jak zaszczepić emocje sztucznej inteligencji rozmawia Michalina Łabiszak na łamach „Życia Uniwersyteckiego”.
Bada pani emocje w języku, przetwarzając je i analizując komputerowo. Na co przekładają się tego rodzaju badania, jakie obszary wspierają?
Wykorzystuje się je w biznesie. Analiza sentymentu jest bardzo popularną techniką wykorzystywaną przez firmy do analizy emocji, które otaczają markę. Na przykład w mediach społecznościowych firmy poprzez analizę komentarzy, które publikowane są na jej stronie, mogą zidentyfikować emocje, jakie towarzyszą konsumentom oraz obserwować pewne zmiany, które świadczą o zmianie postaw wobec firmy. To pomaga wychwytywać markom momenty eskalacji wśród społeczności skupionej wokół niej w kanałach informacyjnych. Programy te próbuje się także wykorzystywać do predykcji rynków giełdowych czy też kryptowalut, ponieważ są one także oparte na ludzkich emocjach. Choć w tym przypadku jest to trudniejsze – działa tam bardzo wiele zmiennych, a emocje wyrażane w mediach społecznościowych są tylko jedną z nich.
Emocje w tekstach analizowane są z wykorzystaniem technologii, programów komputerowych. Jak nauczyć sztuczną inteligencję czuć?
Komputery nie rozumieją języka, w ogóle nie są to maszyny zbyt inteligentne. Prawdziwa sztuczna inteligencja nie istnieje. Za całym procesem stoi człowiek. Przygotowywanie algorytmów uczenia maszynowego rozpoznających emocje to praca żmudna i czasochłonna, ale i – w swojej istocie – prosta. Opiera się na ludzkiej intuicji i pracy manualnej oraz na pewnych założeniach matematycznych. Aby stworzyć takie narzędzie i zaprogramować maszynę, potrzebujemy ustrukturyzowanej wiedzy pochodzącej od ludzi. Przeprowadza się wśród nich badania polegające na znakowaniu (anotacji) danych językowych metadanymi. W wyniku tego procesu dochodzi się do pewnej intersubiektywnej oceny emocji, które są wzbudzane przez konkretne słowa. Powtarzamy ten proces dla tysięcy słów i dla konkretnych emocji. W taki sposób powstaje baza danych będąca podstawą, wspomnianą „wiedzą” do zaprogramowania komputera. Jak już wspomniałam, nie jest on w stanie identyfikować słów. Słowa stanowią dla niego jedynie pewien ciąg znaków, który może dopasować do ciągu znaków w naszej bazie i dzięki temu wskazać konkretną emocję. To jedna z metod. Inną metodą jest anotowanie całych fraz i przypisywanie im emocji, które wzbudzają. Zasadniczą różnicą jest jednak powstanie intersubiektywnego zbioru uczącego, który zestawia się z algorytmem uczącym się – zapamiętującym frazy oraz przypisane im etykiety. W wyniku tego procesu narzędzie jest w stanie odnieść etykiety nie tylko do konkretnych fraz, których się nauczyło, ale i do innych, im podobnych, wykorzystanych w badanym tekście. Tego typu algorytmy popełniają błędy. Etykiety są bowiem bardzo uproszczone. Błędy te są jednak „nadrabiane” masową skalą wykorzystania tych modeli. W rozpoznawaniu emocji w tekście wykorzystujemy zatem dwie metody: leksykalną i uczenia maszynowego.
Cały wywiad dostępny na Uniwersyteckie.pl
Fot. Adrian Wykrota