Dr Filip Biały z Wydziału Nauk Politycznych i Dziennikarstwa UAM w marcu i kwietniu 2019 roku brał udział w kursach w Londynie i Oksfordzie, podczas których miał okazję poznać narzędzia informatyczne przydatne studentom i praktykom nauk politycznych. Z tego wyjazdu przygotował bardzo ciekawą relację, Zapraszamy do lektury!
Analiza danych, uczenie maszynowe i eksploracja tekstu, czyli jak kształci się politologów w Londynie i Oksfordzie
Współczesna nauka o polityce zaczyna doganiać zmieniającą się rzeczywistość. Wydziały politologiczne coraz częściej dostrzegają, że znajomość nowoczesnych metod analizy danych, opartych o techniki takie jak eksploracja tekstu (text mining) czy uczenie maszynowe (machine learning), jest niezbędna, by wyjaśniać zjawiska i procesy społeczne. Co ważne, nie oznacza to, że humanistyka i nauki społeczne zorientowane na interpretację i rozumienie, stają się zbędne. Wręcz przeciwnie: stoją one obecnie przed ogromną szansą włączenia się w poznawczą rewolucję.
O tym, jak wielki nacisk kładzie się na kształcenie studentów i kadry naukowej w zakresie narzędzi informatycznych, umożliwiających i ułatwiających prowadzenie badań ilościowych i jakościowych, miałem okazję przekonać się uczestnicząc w marcu i kwietniu 2019 roku w specjalnych kursach w Londynie i Oksfordzie. Adeptów nauk politycznych, stosunków międzynarodowych czy medioznawstwa od początku studiów licencjackich zachęca się na tych uczelniach do umiejętnego wykorzystywania potencjału, drzemiącego w dedykowanym naukowcom oprogramowaniu. Znajomość tego ostatniego jest bowiem dla badaczy społecznych ważna na równi z aktualną wiedzą teoretyczną, która, nawiasem mówiąc, jest zasadniczym elementem programu kształcenia od pierwszego roku studiów, i której nikt nie postrzega jako zbędnej bądź niepraktycznej.
Co słuszne w teorii i wartościowe w praktyce
W London School of Economics and Political Science przeszedłem kurs prezentujący sposoby praktycznego wykorzystania w pracy badawczej programów Stata, SPSS, NVIVO, QDA Miner, pakietu WordStat oraz języka R. Dwie pierwsze aplikacje służą do wykonywania analiz statystycznych zgromadzonych danych i są dobrze znane także polskim badaczom. Nieco mniej popularne, zapewne w dużej mierze ze względu na koszt licencji, są trzy kolejne programy, usprawniające prowadzenie jakościowych i ilościowych analiz danych tekstowych. Wielką popularność zyskuje z kolei bezpłatny język R, pozwalający na wykonywanie nawet najbardziej zaawansowanych analiz danych liczbowych i tekstowych przy użyciu np. uczenia maszynowego opartego o sieci neuronowe.
Szkolenia z opisywanych narzędzi organizuje kilka razy w roku wydział metodologii LSE. Zajęcia, na które uczęszczają przeważnie studenci i doktoranci, prowadzą naukowcy wykorzystujący prezentowane oprogramowanie w swojej codziennej pracy. Dzięki temu ściśle techniczna wiedza wzbogacona jest o uwagi płynące z doświadczenia badawczego np. w przeprowadzaniu wywiadów pogłębionych. Uczestnicy poznają także, niejako przy okazji, kryteria metodologiczne, które spełnić powinno dobrze zaplanowane i przeprowadzone badanie społeczne. Jest to nieocenione przede wszystkim dla studentów piszących prace dyplomowe. Autor bądź autorka takiej musi bowiem potrafić zademonstrować i wykorzystać w swojej rozprawie metody wykorzystane do analizy zebranego materiału badawczego.
Ten nacisk na kształcenie metodologiczne może niektórych zdziwić. Przecież tak wiele mówi się od wielu już lat o tym, że studia powinny być nakierowane raczej na praktyczne umiejętności, a nie na pracę naukową, którą podejmie znikomy odsetek studentów. Trudno o większe nieporozumienie. O LSE, której absolwenci rozchwytywani są na rynku pracy, powiedzieć można wiele, ale nie to, że stosuje nieprzystające do rzeczywistości wzorce i sposoby kształcenia. Uczelnia ta dostrzega, że przyswojenie sobie przez studentów rygorów metodologicznych stawianych pracom naukowym czynić z nich będzie świetnych analityków procesów społecznych, politycznych i gospodarczych. A to właśnie takich pracowników poszukują korporacje, instytucje międzynarodowe i administracja publiczna.
O tym, że londyńska uczelnia pragnie nie tylko odpowiadać na najnowsze trendy, lecz także je kształtować, świadczy fakt, iż od tego roku akademickiego uruchomiła nowy kierunek studiów magisterskich – stosowaną naukę o danych społecznych (Applied Social Data Science). Studentów z wcześniejszym przygotowaniem w dziedzinie nauk społecznych kierunek ten wzbogacać ma o umiejętność programowania w językach R i Python oraz posługiwania się złożonymi zbiorami danych. Choć koszt tych studiów wydaje się oszołomiający (ponad 28 tys. funtów za rok), chętnych nie brakuje. Nawet jeśli nie będą oni później pracować naukowo, z uzyskanymi kwalifikacjami nie będą mieli najmniejszego problemu ze znalezieniem zatrudnienia.
Dane małe i duże
Wiele ostatnimi czasy mówi się o niebezpieczeństwach związanych z rozwojem nowoczesnych technik komunikacji. Wielką rolę spełniać powinny nauki społeczne, naświetlając konsekwencje rozwoju technologicznego dla indywidualnej prywatności, a także dla procesu politycznego. Internet jest przestrzenią, w której toczy się co najmniej zimna wojna pomiędzy globalnymi graczami, czego dowodzi choćby przykład amerykańskich wyborów prezydemckich z 2016 roku i udziału w nich osławionej firmy Cambridge Analytica. Oprócz zagrożeń należy jednak dostrzec także nowe szanse dla rozwoju naukowego. Fakt, iż prawie każdy użytkownik internetu pozostawia po sobie cyfrowy ślad, pozwala bowiem na prowadzenie badań w oparciu o niespotykaną dotąd ilość danych.
Big Data, czyli zbiory różnorodnych, dynamicznie przyrastających danych o nie zawsze łatwej do oceny wiarygodności, są potencjalnym źródłem niezwykle cennych informacji na temat zachowań społecznych i politycznych. Coraz więcej instytucji publicznych otwiera swoje zasoby dla badaczy. Na przykład brytyjski parlament udostępnia za pomocą tzw. API katalog wszystkich wystąpień parlamentarnych wygłoszonych od 1803 roku, a ONZ – setki zbiorów danych, przygotowanych przez różne agencje tej organizacji. W oparciu o podobne źródła naukowcy mogą weryfikować istniejące teorie i konstruować zupełnie nowe modele, dostarczając pełniejszej wiedzy o rzeczywistości, pozwalającej na formułowanie coraz trafniejszych prognoz.
Warunkiem, by prowadzić badania wykorzystujące Big Data (a także i zbiory danych znacznie mniejsze, lecz także przerastające tradycyjne możliwości analityczne indywidualnego badacza), jest znajomość technik eksploracji, wykorzystujących już nie tylko narzędzia statystyczne, lecz także uczące się algorytmy, potrafiące odkryć w danych niedostrzegane uprzednio prawidłowości.
Przygotowaniu do podejmowania tego rodzaju badań poświęcone były warsztaty podczas szkoły wiosennej z zaawansowanych metod badawczych na Uniwersytecie w Oksfordzie. Wraz z międzynarodowym gronem studentów, doktorantów i pracowników naukowych z kilkudziesięciu państw, zebranych w murach Lady Margaret Hall, przez pięć dni rozwijałem przede wszystkim umiejętność posługiwania się językiem R, który, wzbogacony o specjalistyczne pakiety, staje się w naukach społecznych coraz potężniejszym narzędziem analitycznym.
Ponieważ badacze polityki mają do czynienia najczęściej z danymi tekstowymi, jeden z głównych kursów dotyczył kluczowych metod analizy tekstu. Należy do nich nie tylko prosta analiza ilościowa, opierająca się na zliczaniu częstotliwości słów, występujących w dużych korpusach tekstowych, lecz także korzystająca z uczenia maszynowego analiza tematyczna oraz skalowanie ideologiczne, pozwalające na lokalizowanie aktorów politycznych w ramach spektrum ideologicznego.
Choć podstawowa analiza tekstu przy użyciu języka R jest bardzo prosta i ogranicza się niekiedy do wprowadzenia kilku linii kodu, bardziej pogłębione studia wymagają opanowania zasadniczej wiedzy z zakresu statystyki. Jednak dopiero w połączeniu z biegłą wiedzą teoretyczną z dziedziny nauk społecznych możliwe jest prowadzenie badań wykraczających poza trywialne obserwacje ilościowe. Sądzić można, że to właśnie ów styk nowoczesnych metod ilościowych oraz zaawansowanej teorii politycznej będzie w najbliższych latach polem pasjonujących odkryć politologicznych.
Co z tego wynika dla polskich nauk politycznych i społecznych?
Aby aktywnie włączyć się w opisywane procesy, polska nauka o polityce powinna, jak sądzę, zweryfikować kilka przesądów, obecnych zresztą nie tylko w rodzimych naukach społecznych. Odrzucić należy w pierwszym rzędzie niemądre przeświadczenie o rozłączności i niewspółmierności wiedzy ścisłej oraz humanistycznej i społecznej. Wiele osób, które w latach szkolnych zmagały się z matematyką, nie wierzy, iż może bezboleśnie opanować podstawy statystyki i programowania. Z kolei „ścisłowcy” spoglądają z wyższością na humanistów, zapominając, że każda uzyskana w wyniku najbardziej nawet złożonej analizy danych liczba uzyskuje sens dopiero wtedy, gdy zostanie zinterpretowana poprzez umieszczenie jej w odpowiednim kontekście.
Przezwyciężenie opisywanych podziałów w naukach politycznych wymaga w praktyce wprowadzenia już na poziomie licencjatu kształcenia podstaw analizy statystycznej (regresja liniowa, logistyczna, ładowych głównych), a także komputerowej analizy tekstu oraz programowania, opierającego się o modele uczenia maszynowego. Nie trzeba dodawać, że absolwenci zdobytą wiedzę spożytkować mogą później także w sektorze komercyjnym. Na przykład umiejętność prowadzenia analizy sentymentu w oparciu o dane pozyskane z mediów społecznych należy do kompetencji poszukiwanych przez przedsiębiorców, a zwłaszcza przez firmy inwestujące w tzw. business intelligence.
Uczelnie i wydziały, które pierwsze zaproponują przedmioty, a może i specjalności i kierunki łączące dogłębną i aktualną wiedzę teoretyczną z umiejętnością posługiwania się komputerowymi narzędziami analizy ilościowej, mają szansę nie tylko na pozyskanie nowych studentów, lecz także na włączenie się w innowacyjne i przyszłościowe badania. Warto tę szansę zauważyć i wykorzystać.
Dr Filip Biały – absolwent politologii na Wydziale Nauk Politycznych i Dziennikarstwa UAM. Jego zainteresowania obejmują teorię polityczną oraz metodologię nauk społecznych i humanistycznych. Obecnie Visiting Fellow w Department of Government w London School of Economics and Political Science. Na Wydziale Matematyki i Informatyki studiuje podyplomowo kierunek Przetwarzanie danych – Big Data, a na Wydziale Filologii Polskiej i Klasycznej – literaturę powszechną.
E-mail: filip.bialy@amu.edu.pl
Fot. Filip Biały - Odsłonięty w 2019 roku na kampusie London School of Economics odwrócony globus symbolizuje, według obecnej dyrektorki uczelni, „dążenie do podejmowania największych globalnych wyzwań poprzez badania i kształcenie, co oznacza spoglądanie na świat z odmiennych i niecodziennych punktów widzenia”.