Skoring społecznościowy (social scoring)

Przemysław Janicki, Senior Industry Consultant, SAS Institute

 

Historycznie uwarunkowane podejście do skoringu kredytowego przyjmuje jako ostateczną funkcję celu minimalizację odsetka klientów, którzy w okresie trwania relacji z bankiem staną się niewypłacalni. Bardziej kompleksowe podejście, wpisujące się w koncepcję skoringu zysku (profit scoring), stara się połączyć dwa podstawowe obszary aktywności banku: sprzedaż, postrzeganą przez pryzmat przychodów i zysków, oraz zarządzanie ryzykiem, które jest dla banku źródłem kosztów. Rozwojowi tej koncepcji sprzyja nie tylko coraz bardziej widoczne pogłębienie rynku (bogatsza oferta produktowa), ale i stały przyrost informacji o historii wzajemnych relacji.

Niejako naturalnie zaciera się przy tym granica pomiędzy skoringiem ryzyka a skoringiem marketingowym – oferta banku powinna być adresowana nie tylko do klientów wiarygodnych z punktu widzenia ryzyka kredytowego, ale także tych, którzy z wysokim prawdopodobieństwem ją przyjmą (response scoring) i zdecydują się utrzymać relację przynajmniej w okresie niezbędnym do wypracowania założonej marży zysku (attrition scoring). Tego typu podejście wymaga integracji będących w posiadaniu instytucji finansowej baz danych i wdrożenia efektywnych metod ich przetwarzania. Kompleksowe modelowanie zachowań klienta wydaje się koncepcją szczególnie atrakcyjną w powiązaniu z ideą Internetu jako ogólnodostępnej bazy danych (Web 3.0), w tym danych o zachowaniach klientów. Stosunkowo niski koszt pozyskania ww. danych w powiązaniu z malejącym krańcowym kosztem ich efektywnego przetwarzania prezentuje interesującą alternatywę dla tradycyjnych metod zarządzania relacjami z klientem w instytucji finansowej. O ile współcześnie banki postrzegają serwisy społecznościowe jako efektywny kanał służący bezpośredniej komunikacji z klientami (głównie z myślą o promocji i marketingu), o tyle w nieporównanie mniejszym stopniu (lub wcale) pozyskują z tych serwisów dane, które mogłyby służyć do wzmocnienia (augmentation) oceny kredytowej ich klientów. Internetowe sieci społecznościowe mogą być bowiem nie tylko narzędziem wspierającym weryfikację zachowań klienta z punktu widzenia jego wiarygodności kredytowej, ale również źródłem danych, których wykorzystanie mogłoby zwiększyć wiarygodność samej oceny (zgodnie z następującą zasadą: średnia ocen z najbliższego kręgu twoich znajomych może być dobrym estymatorem twojej wiarygodności). Wzmocnienie oceny należy więc rozumieć jako zwiększenie prawdopodobieństwa jej poprawności, dzięki wykorzystaniu dodatkowych danych. Biorąc zaś pod uwagę to, że ludzie wykazują naturalną potrzebę interakcji w kręgu osób o podobnym profilu i statusie (społecznym, zawodowym itp.), daje to dodatkową szansę na identyfikację szerszego zbioru potencjalnie najbardziej dochodowych klientów (także spoza bazy dotychczasowych klientów banku).


Ostatecznym celem wdrożenia skoringu społecznościowego (social scoring), czyli idei wykorzystania danych z internetowych serwisów społecznościowych, powinno być endogeniczne modelowanie zachowań klientów, rozumiane jako poszerzenie dotychczas stosowanej analizy behawioralnej (opartej głównie na danych finansowych i historii relacji z klientem) o wszelkie dostępne informacje o ich zwyczajach i zachowaniach (istotnych z biznesowego punktu widzenia), w tym o informacje pozyskane z danych pochodzących z internetowych serwisów społecznościowych. Szacuje się, że w ciągu kilku ostatnich lat ludzkość wyprodukowała więcej danych w postaci materialnej, niż w całym okresie je poprzedzającym (od zarania dziejów). Ok. 80% tych danych generowana jest każdego dnia przez użytkowników Internetu. W tym kontekście popularne stało się określenie digital exhaust, odnoszące się do olbrzymich ilości danych, jakie generują internauci. Ponieważ dane te są danymi nieustrukturyzowanymi, ich analiza wymaga zastosowania specjalnego podejścia opartego na metodach eksploracyjnej analizy danych, analizy tekstów czy rozpoznawania wzorców. Podejście to wpisuje się w koncepcję Big Data, tzn. zbioru danych spełniającego warunki 3V (wg Gartnera):

  • zbioru danych o bardzo dużych rozmiarach (volume)
  • wysokiej częstotliwości ich zmiany (velocity)
  • oraz dużej zmienności (variety)

i jako takie wymaga wdrożenia efektywnych systemów przetwarzania.
 

Informacja o autorze:


Przemysław Janicki

Pracuje na stanowisku Senior Consultant w SAS Institute. Posiada 10-letnie doświadczenie w obszarze zarządzania ryzykiem oraz wdrażania rozwiązań IT. Specjalizuje się w obszarze ryzyka kredytowego, rynkowego oraz ryzyka płynności (w aspekcie zarządczym i regulacyjnym), a także w zagadnieniach związanych z wyceną instrumentów i data miningiem. Od 2008 r. jest członkiem Professional Risk Managers’ International Association.