SAS: dane syntetyczne uwolnią innowacje

Warszawa, (06 sie 2024)

Rok 2024 należy do sztucznej inteligencji. Coraz więcej biznesów decyduje się na wykorzystanie potencjału AI, aby zwiększyć wydajność, zautomatyzować zadania operacyjne i pobudzić kreatywność. Potrzebne do tego będą jednak rzetelne i obiektywne dane, których firmom z branż takich jak medyczna czy finansowa brakuje. Rozwiązaniem są generowane przez AI dane syntetyczne, które odzwierciedlają prawdziwe informacje.

Syntetyczne, czyli jakie?

Dane syntetyczne to stosunkowo nowe rozwiązanie, polegające na generowaniu przez sztuczną inteligencję nowych informacji na podstawie posiadanego już zestawu danych rzeczywistych. Aby udowodnić ich wartość, firmy Syntho i SAS, we współpracy z Holenderską Koalicją Sztucznej Inteligencji (NL AIC) przeprowadziły eksperyment, w wyniku którego okazało się, że techniki anonimizacji danych rzeczywistych niszczą podstawowe wzorce, logikę biznesową i relacje. Wykorzystanie ich do analityki mogłoby skutkować niewiarygodnymi wynikami. Z kolei generowane za pomocą AI dane syntetyczne zachowują podstawowe wzorce, logikę biznesową, relacje i statystyki. To właśnie ta „moc” sprawia, że przeprowadzone na ich podstawie prognozy są bardziej wiarygodne i przejrzyste.

Istotną zaletą danych syntetycznych jest to, że pozwalają one organizacjom zbudować dużą bazę analityczną na zaledwie ułamku tego, co jest potrzebne do osiągnięcia zbliżonej wiedzy na bazie tradycyjnej pracy z konsumentem. Ponadto, są o wiele prostsze w obsłudze niż informacje pozyskiwane w tradycyjny sposób – chociażby ze względu na przepisy dotyczące prywatności (np. RODO). Do ich głównych korzyści należy również niski koszt tworzenia, co jest często bardziej opłacalne niż gromadzenie rzeczywistych informacji demograficznych, psychograficznych lub behawioralnych. Jak wskazuje Gartner Peer Community, organizacje, które już wykorzystują dane syntetyczne zauważyły 60 proc. poprawę dokładności szkolonych na nich modeli AI, 56 proc. wzrost wydajności i 30 proc. zmniejszenie stronniczości. Nic dziwnego, że z badań firmy Forrester wynika, że do 2030 roku spodziewany jest 36 proc. wzrost wydatków przedsiębiorstw na ich generowanie.

Kto na tym zyska?

Dane syntetyczne mają szansę odmienić praktycznie każdy biznes. Nie stwarzają one zagrożenia dla prywatności konsumentów, co daje analitykom wolną rękę w działaniu. Tworzą one zatem organizacjom z wielu branż możliwości eksperymentowania i wprowadzania innowacji.

Jak wskazuje SAS, lider w dziedzinie analityki i AI, korzyści z zastosowania danych syntetycznych będą szczególnie widoczne w opiece zdrowotnej, bankowości i ubezpieczeniach. Większa ilość danych zwiększy dokładność planów leczenia, a także ulepszy analizę obrazów medycznych czy edukację lekarzy. Ponadto dane syntetyczne przyspieszą odkrywanie kolejnych leków i terapii.

W świecie finansów natomiast, zdolność do generowania danych syntetycznych może okazać się przydatna w zakresie wykrywania oszustw, oceny zdolności kredytowej czy dostosowanych rekomendacji finansowych.

Ubezpieczyciele natomiast mogą wykorzystywać dane syntetyczne do tworzenia scenariuszy, a następnie proaktywnego identyfikowania ryzyka i przewidywania wyników. AI zasilona takimi danymi może informować o decyzjach dotyczących cen i zakresu ochrony, a także automatyzować przetwarzanie roszczeń, aby pomóc obniżyć koszty i zwiększyć zadowolenie klientów.

Potencjał danych syntetycznych w tej branży jest szczególnie obiecujący. Badania IDC przewidują, iż do 2027 roku 40 proc. algorytmów sztucznej inteligencji wykorzystywanych przez ubezpieczycieli w całym łańcuchu wartości ubezpieczającego będzie wykorzystywać dane syntetyczne, aby zagwarantować uczciwość w systemie i zgodność z przepisami.

Etyczność i zaufanie przede wszystkim

Kluczowym czynnikiem przemawiającym za koniecznością gromadzenia większej ilości danych syntetycznych jest dokładniejsza analiza prognostyczna. Musimy być jednak ostrożni. Model wyszkolony na tendencyjnych danych również będzie wykazywał stronniczość, np. zalecając różne opcje leczenia dla pacjentów w oparciu o rasę, płeć lub status społeczno-ekonomiczny. Ważne jest, abyśmy upewnili się, że modele danych syntetycznych są uczciwe i bezstronne.

Eksperci SAS twierdzą, że wykorzystując dane syntetyczne należy zachować szczególną ostrożność. Informacje te powinny być generowanie w oparciu o kluczowe wartości – etyczność, przejrzystość i odtwarzalność. Modele wyszkolone na złych wartościach mogą zaowocować nieprzewidywanymi konsekwencjami. Np. w przypadku danych medycznych może dojść do wykluczenia części pacjentów.

„Wraz z ciągłym postępem w generowaniu danych syntetycznych, organizacje muszą jednocześnie angażować się w kwestie etyczne. Droga naprzód będzie wymagać czujności w zapewnianiu uczciwości, a także zachowaniu bezstronności i prywatności, by dane syntetyczne mogły dokonać transformacji branż i zrobić to w sposób odpowiedzialny. Przy prawidłowym wykorzystaniu, technologia ta doprowadzi do pozytywnych zmian społecznych w 2024 roku” – podsumowuje Vrushali Sawant, specjalistka ds. danych, praktyki w zakresie etyki danych w SAS.

Informacja o SAS

SAS jest globalnym liderem w dziedzinie danych i AI. Dzięki oprogramowaniu i rozwiązaniom branżowym SAS, organizacje zamieniają dane w wiedzę niezbędną do podejmowania trafnych decyzji. SAS oferuje THE POWER TO KNOW®.

Editorial contacts:

SAS Poland
Katarzyna Kwiecień
Communications Manager
SAS Institute Sp. z o.o.
ul. Gdańska 27/31
01-633 Warszawa
+48 22 560 46 00