Fałsz jest czarno-biały, a prawda w odcieniach szarości? Polscy badacze pracują nad narzędziem, które ma nam pomóc w rozpoznawaniu, czy ktoś kłamie. Już teraz sztuczna inteligencja jest w tym lepsza niż ludzie…
Internetowy słownik synonimów języka polskiego podaje 128 wyrazów bliskoznacznych dla słowa „kłamać”. Żeby wymienić tylko kilkanaście: bajdurzyć, bajerować, blagować, bredzić, bujać, kantować, kitować, konfabulować, kręcić, łgać (jak najęty, jak pies, jak z nut), mamić, mataczyć, mydlić oczy, wciskać kit, wstawiać głodne kawałki, wykręcać kota ogonem, ubarwiać, zalewać, zwodzić…
Co za bogactwo języka! Najwyraźniej jesteśmy z kłamstwem za pan brat. Od reklamy, przez wyborcze obiecanki polityków, po prywatne kłamstwa oszukujących się nawzajem ludzi – pełno go wokół nas. Wskutek powszechności tego zjawiska w przyrodzie bardzo trudno nam rozpoznać, czy ktoś kłamie, czy mówi prawdę. Badania (np. Belli DePaulo i jej współpracowników) pokazują, że rozpoznajemy kłamstwo z 53-54-procentową skutecznością. To prawie tak, jakbyśmy decydowali, co jest kłamstwem, rzucając monetą.
Jesteśmy więc wobec kłamstwa dość bezradni.
Jest jednak szansa, że wkrótce się to zmieni. Małżeństwo z Polskiej Akademii Nauk – dr Justyna Sarzyńska-Wawer, psycholog z Instytutu Psychologii, i dr Aleksander Wawer, informatyk z Instytutu Podstaw Informatyki – pracują właśnie nad programem, który dzięki użyciu algorytmów sztucznej inteligencji ma nam pomóc w wykrywaniu kłamstw. Ich projekt „Metody poznawcze deep learning w wykrywaniu wiarygodnych kłamców” realizowany jest ze środków Narodowego Centrum Nauki.
Nauka budowana na kłamstwie
Skąd pomysł na badanie kłamstwa?
– Zawodowo już wcześniej zajmowałam się wykrywaniem kłamstw – mówi dr Justyna Sarzyńska-Wawer. – Do tej pory badałam neuronalne podłoże kłamstwa: obserwowałam za pomocą rezonansu magnetycznego, co się dzieje w mózgu, kiedy ktoś kłamie, a co, kiedy mówi prawdę. Żadnych spektakularnych różnic nie dostrzegłam. Kiedy ktoś z reguły prawdomówny decydował się powiedzieć nieprawdę – widać było reakcję, ale u osób, które kłamią częściej, nie było dosłownie żadnej różnicy. Najsilniejsze reakcje były widoczne, kiedy komuś udało się dobrze skłamać – uaktywniał się wtedy układ nagrody.
Sarzyńska-Wawer zauważa, że częściej kłamią ekstrawertycy, zwłaszcza ci inteligentni. I dodaje, że zdarzają się też kłamcy patologiczni, czemu sprzyjają trzy cechy osobowości, tzw. czarna triada: makiawelizm, psychopatia i podwyższony narcyzm. Takie przypadki doczekały się nawet swojej jednostki chorobowej.
– W pewnym momencie przeczytałam o algorytmach rozpoznających kłamstwa w języku angielskim – opowiada badaczka. – Zainteresowało mnie to; okazało się, że nie ma takiego rozwiązania dla języka polskiego.
Skontaktowała się więc przez znajomych z nieznanym jej wówczas informatykiem, specjalistą od przetwarzania języka naturalnego, który zajmował się podobnymi kwestiami.
– W ten sposób poznałam mojego męża. Wniosek o grant na nasz projekt pisaliśmy już wspólnie i wspólnie teraz nad nim pracujemy – mówi.
Kiedy ludzie kłamią, są bardziej jednoznaczni w swoich opiniach
Dr Aleksander Wawer z Instytutu Podstaw Informatyki PAN zajmował się między innymi analizą sentymentu i fact checkingiem – metodą weryfikacji fałszywych informacji w sieci.
– Badałem na przykład fałszywe opinie pojawiające się na różnych forach – opowiada. – Najczęściej opinie zachwalające produkty, pisane rzekomo przez użytkowników (opinion spam detection). Zgromadziłem dwa zbiory. Jeden to zbiór prawdziwych opinii pisanych przez realnych użytkowników; drugi – fałszywki napisane dla mnie na zamówienie. Algorytm osiągnął prawie 90 procent dokładności w odróżnianiu jednych od drugich
Ekstremalny fałsz
Prace nad projektem prowadzonym w Polskiej Akademii Nauk zaczęli w kwietniu 2018 roku, i nie był to prima aprilis.
– W tej chwili kończymy już zbierać dane – opowiada dr Sarzyńska-Wawer. – Przebadaliśmy dotąd ponad 300 osób, docelowo chcemy przebadać 400. Za nami są już pierwsze podejścia obliczeniowe, wstępna zabawa z danymi, próbne wyniki.
Na razie naukowcom udało się uzyskać 64 procent skuteczności w demaskowaniu kłamstwa – to już lepiej niż człowiek.
– A to dopiero próbka, prawdziwa praca obliczeniowa zacznie się, kiedy będziemy mieć już wszystkie dane – mówi z niekłamanym entuzjazmem.
Na czym polega badanie?
– Zapraszamy osoby dorosłe z różnym wykształceniem i w różnym wieku. Najpierw przechodzą testy na pamięć, uwagę, inteligencję. Wypełniają też ankietę dotyczącą 12 zaproponowanych przez nas tematów: od poważnych, takich jak aborcja czy eutanazja, po takie jak to, czy Ewa Chodakowska jest najlepszą polską trenerką, a Robert Lewandowski najlepszym piłkarzem. Sprawdzamy, na które mają najbardziej wyrobione zdanie, i każdemu wybieramy dwa. Potem prosimy badanych, żeby napisali raz opinię zgodną z ich poglądem, a raz niezgodną. Następnie, żeby to samo zrobili ustnie, choć ich wypowiedzi są potem transkrybowane – sztuczna inteligencja będzie analizować jedynie teksty pisane. Uzyskujemy więc cztery wypowiedzi: dwie prawdziwe i dwie fałszywe – to one staną się bazą danych dla algorytmu SI. Mamy nadzieję, że algorytm nauczy się rozpoznawać kłamstwo na podstawie gramatycznych i stylistycznych właściwości tekstu.
Są także ludzie, którzy mówią prawdę, ale z jakichś względów odbierani są przez innych jako niewiarygodni. Może dowiedzą się, jaki robią błąd?
Czy na poziomie samego tekstu da się wyodrębnić cechy kłamstwa? Jaka będzie różnica pomiędzy wypowiedziami mówionymi a pisanymi? Jak wpływać będą na wynik inteligencja, pamięć, wykształcenie badanych? A także – umiejętność kłamania?
– Już na tym etapie widać, że kiedy ludzie kłamią, są bardziej jednoznaczni w swoich opiniach – mówi dr Sarzyńska-Wawer. – Jak mówią, że coś jest dobre, wynajdują same argumenty za tym, że jest to dobre. Jak ma być złe, to jest bardzo złe. Fałsz jest bardziej ekstremalny, czarno-biały. Prawda jest bardziej wieloznaczna, ma więcej odcieni szarości. Ludzie, mówiąc prawdę, podają konkretne przykłady: „te perfumy co prawda ładnie pachną, ale szybko wyparowują”. Rzeczywistość jest skomplikowana.
Ustalenia polskich badaczy zgadzają się z badaniami angielskimi, z których wynika, że wypowiedzi kłamliwe są mniej skomplikowane, a zdania – krótsze.
– Hipoteza jest taka, że kłamstwo jest dla naszego umysłu bardziej obciążające poznawczo, więc nie ma już tylu zasobów, żeby tworzyć skomplikowane konstrukcje. Więcej jest też w tekście kłamliwym wyrażeń nacechowanych negatywnie, a czasowniki mają charakter abstrakcyjny. Rzadziej pojawiają się zaimki pierwszoosobowe. Przekonamy się wkrótce, czy w języku polskim wyjdzie coś podobnego – zapowiada dr Sarzyńska-Wawer.
Trenowanie algorytmów SI zacznie się na początku przyszłego roku.
– Będziemy rozwijać moduł stylometryczny, który będzie analizował, mapował język na wiele sposobów – opowiada dr Aleksander Wawer. – Na przykład: czy tekst ma wydźwięk pozytywny, czy negatywny; czy jest abstrakcyjny, czy konkretny, aktywny czy pasywny, prosty czy złożony, ile występuje w nim zaimków osobowych… Na podstawie tych kategorii klasyfikator uczenia maszynowego będzie się uczył, a potem oceniał, czy to kłamstwo, czy prawda. Wypróbujemy także narzędzia deeplearningowe – głębokie sieci neuronowe pretrenowane już wcześniej na jakimś zadaniu modelowania językowego, które przez nas zostaną dotrenowane do odróżniania kłamstwa od prawdy.
Płaskoziemcy nie przejdą?
Warto pamiętać, że w badaniu liczy się intencja mówienia prawdy lub fałszu, a nie obiektywna prawdziwość lub fałszywość wypowiadanych tez.
– A jeśli ktoś z przekonaniem wypowie tezę: „Ziemia jest płaska”? – pytam parę naukowców.
– Korzystamy dodatkowo z fact checkingu, więc takie zdanie zostałoby zaklasyfikowane jako fałszywe. Niemniej w naszych badaniach skupiamy się na dłuższych wypowiedziach i aby określić, czy są one prawdziwe, czy fałszywe, bierzemy pod uwagę wiele aspektów, nie tylko to, czy poszczególne tezy są obiektywnie prawdziwe – mówi dr Sarzyńska-Wawer.
– Kłamstwo bywa stopniowalne, względne, tak jak i prawda. Wiele osób lekko koloryzuje, nieco naciąga rzeczywistość. Czy to już kłamstwo, czy jeszcze nie?
– Rozróżnienie nie jest łatwe. Nie mówiąc już o tym, że w niemal każdej dłuższej wypowiedzi kłamca stara się przemycać jakieś prawdy i półprawdy, żeby być bardziej wiarygodny. To trudne. Ale i tak już teraz pewne jest, że algorytm będzie się mylił znacznie mniej niż my. Pytanie tylko – jak bardzo będzie od nas lepszy.
– Czy to nie będzie przydatne narzędzie dla tych, którzy chcą nauczyć się jeszcze lepiej kłamać?
– Raczej nie mam wrażenia, że wyszkolimy rzesze wspaniałych kłamców. Poza tym są także ludzie, którzy mówią prawdę, ale z jakichś względów odbierani są przez innych jako niewiarygodni. Może dowiedzą się, jaki robią błąd? Mamy nadzieję, że skończymy nasz projekt w pierwszym kwartale przyszłego roku i że wkrótce potem powstanie aplikacja, w której każdy będzie mógł sprawdzić interesujący go tekst.
Aplikacja ma być udostępniona w sieci za darmo. A wtedy każdy z nas będzie mógł wrzucić tam dowolną wypowiedź i przekonać się, na ile jej autor bajdurzył, bajerował, blagował, bredził, bujał… Czekamy z niecierpliwością. Nieprawdaż?