Tropi oszustwa i wyłudzenia, testuje tradycyjne modele, sprawdza twoją tożsamość, ale czy decyduje o twoim kredycie? O sztucznej inteligencji w sektorze finansowym opowiada nam dr Mariusz Cholewa, prezes Biura Informacji Kredytowej, w rozmowie z Tomaszem Jurczakiem

Tomasz Jurczak: Automatyzacja w procesie kredytowym – czyli co?

Mariusz Cholewa*: Dziś niemal wszystkie decyzje dotyczące udzielania kredytów na mniejsze kwoty są automatyczne. Algorytm analizuje nasz wniosek kredytowy i dostajemy decyzję pozytywną lub odmowną.

Instytucje nadzoru coraz częściej próbują wprowadzać w tej dziedzinie regulacje prawne. Dlaczego?

Bo stworzenie przepisów, które zapewniałyby kontrolę nad algorytmem, to wyzwanie. Proces automatycznego podejmowania decyzji powinien w razie potrzeby uwzględniać ingerencję człowieka. Ale z drugiej strony algorytm musi być transparentny i możliwy do zweryfikowania.

W przypadku algorytmów sztucznej inteligencji chyba nie zawsze się tak da.

Oczywiście, wszystko zależy od rodzaju modelu sztucznej inteligencji, który zastosujemy. Tymczasem Kowalski, choćby ze względu na RODO, ma prawo do informacji o tym, co wpłynęło na decyzję w jego sprawie. W przypadku tzw. statycznych modeli sztucznej inteligencji, raz nauczonych i wdrożonych do działania w postaci „zamrożonej”, wyjaśnianie takich decyzji jeszcze jest możliwe. Ale w odniesieniu do autonomicznych modeli SI – już nie. Jeśli model oparty na sztucznej inteligencji i uczeniu maszynowym sam się uczy i modyfikuje swoje parametry, to często nie wiadomo, na jakiej podstawie dał określony wynik.

Co z tym począć?

Właśnie z tego powodu na razie nie wykorzystuje się bezpośrednio autonomicznej SI przy kredytach. Natomiast modele tworzone na bazie sztucznej inteligencji czy uczenia maszynowego są wykorzystywane do prototypowania algorytmów produkcyjnych. Model SI może pokazać nową istotną zależność, która w tradycyjnych modelach oceny ryzyka kredytowego nie była wykorzystywana. Wtedy płynące stąd wnioski można wykorzystać w modelach budowanych w tradycyjny sposób. Z wytycznych Europejskiego Urzędu Nadzoru Bankowego i polskiej Komisji Nadzoru Finansowego wynika konieczność dobrego udokumentowania modelu, badania jego jakości i stabilności. O ile modele SI nie zawsze pozwalają na takie analizy, to modele tradycyjne, oparte na wnioskach płynących z użycia sztucznej inteligencji – już tak.

Inteligentna Platforma Antyfraudowa BIK do końca czerwca 2020 pomogła uchronić sektor bankowy przed wyłudzeniami na łączną kwotę 252 mln zł

Nie ma odwrotu od automatyzacji w kredytach?

Nie, automatyzacja to znak naszych czasów. Dziś, logując się do swojej bankowości elektronicznej, często widzimy spersonalizowaną ofertę, np. limit w karcie czy limit w koncie. Widząc historię rachunku klienta, bank jest w stanie uszyć ofertę na miarę, dzięki czemu wzrasta szansa na transakcję. Oczywiście zanim dojdzie do udzielenia takiego finansowania, bank ostatecznie sprawdza wiarygodność kredytową klienta. Wiele instytucji finansowych profiluje dziś klientów i dopasowuje oferty, ułatwiając w ten sposób podjęcie decyzji klientowi indywidualnemu, a jednocześnie szukając dodatkowych możliwości biznesowych.

Bank ocenia klientów, posiłkując się wiedzą o sytuacji kredytobiorcy, jego wiarygodności i kondycji kredytowej – a decyzję podejmuje, wykorzystując zaawansowane algorytmy.

Jaka jest jakość danych, które wykorzystujecie?

Część danych, które z największym prawdopodobieństwem pozwalają prognozować, czy ktoś będzie spłacał kredyt, czy nie, stanowi historia kredytowa. Dzięki BIK [patrz ramka] widzi ją każdy bank, a każdy Kowalski może w nią wejrzeć na swoim profilu na portalu www.bik.pl.

BIK widzi historię kredytową, ponieważ banki dwa razy w tygodniu dostarczają nam dane na temat wszystkich udzielonych kredytów: ich liczby i wartości dla danej osoby, tego, jakie kto spłaca raty i jaka jest jakość tych spłat. Jeżeli termin spłaty przypadał na wczoraj i klient się spóźnił, to spóźnienie będzie widoczne już następnego dnia. Podobnie jak historia rachunku, to są twarde dane, dosyć trudne do zmanipulowania przez potencjalnych oszustów.

Do tego dochodzą tak zwane dane płatnicze. Z reguły to informacje o płatnościach, np. czy na czas opłacono rachunek telefoniczny. To dane drugiej kategorii, jednak i tak dużo wnoszą do oceny ryzyka kredytowego. Trzecią kategorią mogą być dane alternatywne, np. z mediów społecznościowych, pozyskane z urządzeń, którymi klient się posługuje. Te dane mają najmniejszą siłę predykcyjną…

…więc wykorzystuje się je najrzadziej?

Tak. Instytucje finansowe zawsze wykorzystują dane twarde, należące do pierwszej z wymienionych kategorii. Druga grupa nie niesie ze sobą szczególnej wartości dodanej, chyba że klient nie ma historii kredytowej. Jeżeli klient dopiero zaczyna swoją aktywność na rynku kredytowym, jest taką białą kartą, to z perspektywy kredytodawcy jest anonimowy i nie dostarcza najbardziej wartościowych danych. Dlatego jeśli nie ma mnie w BIK, to wcale nie jest dobrze. Dobrze jest wtedy, gdy mam historię w BIK i zbudowany scoring.

Te słabsze dane mają jakąś wartość?

Mają, ale przy wykorzystaniu odpowiednich modeli. Dane z pierwszej i drugiej grupy całkiem nieźle korelują z ryzykiem kredytowym i innymi typami ryzyka gospodarczego. Potwierdzają to wyniki projektów realizowanych między bankami a ubezpieczycielami czy między bankami a firmami telekomunikacyjnymi. Efekt jest taki, że już dziś na podstawie danych bankowych możemy prognozować skłonność klienta do spłacania na przykład drogiego aparatu telefonicznego na abonament. Podobnie jest z ubezpieczeniami. W Polsce na razie są wykorzystywane prototypy podobnych modeli, niewielu ubezpieczycieli jeszcze z nich korzysta. Ale w USA taki credit-based insurance score wykorzystują już niemal wszyscy ubezpieczyciele.

Każdy klient musi być chroniony przed złymi skutkami automatycznych decyzji. Łatwo sobie bowiem wyobrazić poważne zagrożenie związane z algorytmami SI w finansach, które będą go stygmatyzowały

A co z danymi z Facebooka?

Dane z mediów społecznościowych mają małą odporność na zmiany trendów rynkowych i manipulacje. Do tego dochodzą kwestie etyczne i potrzeba transparentności. Proszę zajrzeć do BIK i zobaczyć w swoim raporcie, jakie mamy dane na pana temat, kto do tych danych zaglądał, kiedy i w jakim celu. Pełna przejrzystość. W przypadku modeli SI czy ML, budowanych w oparciu o dane z portali społecznościowych, nie możemy takiej przejrzystości zapewnić. Bo trudno ocenić, jakimi regułami algorytm oparty na autonomicznym uczeniu maszynowym będzie się posługiwał.

Czyli sztucznej inteligencji nie można bezpiecznie wykorzystywać?

Można. Często sami testujemy modele stosowane w BIK, korzystając z rozwiązań SI – by sprawdzić, czy jesteśmy w stanie zrobić algorytm lepszy od aktualnie stosowanych.

Jednak takie modele nie są trwałe i dość szybko się starzeją. Poza tym potrzebują dużych zbiorów danych, więc czas potrzebny na ich przebudowę jest dosyć długi. Gdy dodamy do tego potrzebę diagnozowania struktury takich modeli (transparentność!), wyjdzie nam, że ich wykorzystanie w praktyce jest sporym wyzwaniem.

Gdzie w tym wszystkim – w automatyzacji, w modelach sztucznej inteligencji i uczeniu maszynowym – jest miejsce Kowalskiego, który chce wziąć kredyt?

Unijne przepisy każą koncentrować się na konsumencie, poszczególnym człowieku. Każdy klient musi być chroniony przed złymi skutkami automatycznych decyzji. Łatwo sobie bowiem wyobrazić poważne zagrożenie związane z algorytmami SI w finansach, które będą go stygmatyzowały.

Na przykład?

Niektóre modele statystyczne opierają się na geolokalizacji. Jeżeli ktoś urodzi się w jakimś „niewłaściwym” według systemu analitycznego miejscu, w okolicy, gdzie kredyty nie są spłacane w terminie, to „zła” historia lokalizacji będzie tę osobę obciążać tak długo, jak długo nie zmieni ona miejsca zamieszkania. Do tego momentu ów klient będzie więcej płacił za ubezpieczenie, wpłacał wyższą kaucję za mieszkanie albo spłacał wyższe odsetki kredytu.

A stygmatyzacja ze względu na płeć?

W Polsce, ale też np. w USA, do tego typu modeli nie można używać kategorii płci, choć z danych BIK wynika, że kobiety lepiej spłacają kredyty niż mężczyźni. To zjawisko dość powszechne.

Sztuczna inteligencja ma przyszłość w kredytach?

Tak. Modele SI są już wykorzystywane w zautomatyzowanych procesach. Jednak muszą one być stosowane w przejrzysty sposób i bardzo dobrze udokumentowane, z zachowaniem standardów spełnianych przez modele tradycyjne.

Przy próbach stosowania SI do poważniejszego finansowania będą potrzebne twarde dane. Nawet najlepsze algorytmy nie wystarczą, gdy dane są kiepskiej jakości

Niektóre firmy fintechowe, próbując wejść na rynek kredytowy, dają klientom np. odroczone płatności. Często bazują na danych szczątkowych, niezwiązanych z profilem kredytowym klienta, i próbują na tej podstawie ocenić ryzyko kredytowe. Wtedy Kowalski, który potrzebuje pieniędzy, zazwyczaj udziela zgód na wykorzystanie wielu informacji na jego temat, pozbywając się swojej prywatności. W przypadku małych pożyczek, drobnych kwot na krótkie okresy, czasami takie słabsze modele na podstawie znikomych danych wystarczą, by ocenić, czy klient będzie w stanie spłacać kredyt. Jednak przy próbach stosowania SI do poważniejszego finansowania będą potrzebne również twarde dane. Nawet najlepsze algorytmy nie wystarczą, gdy dane są kiepskiej jakości.

BIK i SI: jakie macie pomysły na jej wykorzystanie?

Już dziś wykorzystujemy SI do testowania i „challengowania” istniejących już modeli, by sprawdzić ich skuteczność, poprawić ją.

Sztuczna inteligencja bardzo się też przyda w zwalczaniu oszustw i wyłudzeń. Oprócz tradycyjnej historii kredytowej mamy sporo rozwiązań, które pomagają instytucjom finansowym chronić się przed tzw. fraudami. Na przykład Platformę Antyfraudową BIK, narzędzie, które zabezpiecza systemowo procesy kredytowe klientów. Algorytmy platformy, powiązane z największą w Polsce bazą danych (liczy ponad 8,5 mln kompletnych wniosków kredytowych), wyszukują ryzykowne powiązania i generują raporty oraz ostrzeżenia dla jej użytkowników.

Do takich działań algorytmy SI i ML nadają się świetnie. Dzięki nim można skutecznie identyfikować niewykrywane wcześniej symptomy planowanych oszustw. Od końca 2017 r., kiedy to została uruchomiona Platforma Antyfraudowa BIK, do końca czerwca 2020 udało się uchronić sektor bankowy wyłudzeniami na łączną kwotę 252 milionów złotych.

Innym przykładem pożytecznego stosowania inteligentnych algorytmów w naszej branży jest pasywna biometria. Modele ML powodują, że system na bazie stylu korzystania z urządzenia cały czas uczy się użytkownika. W przypadku, kiedy odkryje pewną rozbieżność w typie logowania, bank zadzwoni do klienta i zapyta: „Czy to pan się loguje do systemu. Chcielibyśmy to sprawdzić”.

Czy BIK wie już wszystko o Polakach?

Sektor finansowy mamy już doskonale rozpracowany. Mamy wiedzę o ponad 147 mln rachunków należących do 25 mln klientów indywidualnych oraz 1,4 mln firm. To oznacza, że mamy dane o niemal każdym dorosłym Polaku i znacznej części przedsiębiorstw. Jednak wszystkiego jeszcze nie wiemy.


*dr Mariusz Cholewa, prezes BIK i ACCIS, zrzeszenia międzynarodowych biur informacji kredytowej.

Absolwent Wydziału Zarządzania Uniwersytetu Gdańskiego (UG). W 2005 r. uzyskał tytuł doktora nauk ekonomicznych w zakresie ekonomii. Ukończył też podyplomowe studia bankowości i finansów (specjalność bankowość inwestycyjna), organizowane przez Uniwersytet Guildhall w Londynie, Gdańską Akademię Bankową oraz UG.

W latach 1993-98 współpracował z Gdańską Akademią Bankową, m.in. jako członek zarządu, a jednocześnie brał udział w badaniach dotyczących restrukturyzacji finansowej przedsiębiorstw i banków, prowadzonych przez Instytut Badań nad Gospodarką Rynkową. W latach 1995-2003 wykładał na Wydziale Zarządzania UG. W latach 2007-10 był prezesem Zarządu Banku Rozwoju Cukrownictwa SA. Od 1998 r. do 2013 r. związany z Bankiem Handlowym w Warszawie SA (Citi Handlowy), gdzie zajmował stanowiska menedżerskie, a do kwietnia 2013 r. pełnił funkcję dyrektora Departamentu Strategii. Zasiadał w radach nadzorczych wielu spółek, m.in. z branży bankowej, inwestycyjnej, ubezpieczeniowej oraz leasingowej, w tym w spółkach giełdowych. W latach 2012-13 był członkiem rady nadzorczej Biura Informacji Kredytowej SA.

Od czerwca 2013 r. pełni funkcję prezesa zarządu BIK SA. Jest także przewodniczącym rady nadzorczej Biura Informacji Gospodarczej InfoMonitor SA. Od maja 2020 r. prezes ACCIS.

Biuro Informacji Kredytowej

BIK to największy w kraju zbiór danych o klientach indywidualnych i przedsiębiorcach, także w obszarze pożyczek pozabankowych. Posiada w swojej bazie informacje o 145 mln rachunków należących do 24,6 mln klientów indywidualnych oraz informacje o historii kredytowej łącznie 1,4 mln firm, rolników i innych podmiotów, w tym o 841 tys. mikroprzedsiębiorców.

Biuro Informacji Kredytowej zostało utworzone w 1997 r. przez banki i Związek Banków Polskich na podstawie art. 105 ust. 4 Ustawy z dnia 29 sierpnia 1997 r. Prawo Bankowe.

Źródło: BIK