Wirtualny asystent w NEULA – wyniki prac B+R
Od momenty rozpoczęcia projektu B+R realizowanego przez JT Weston z wykorzystaniem funduszy unijnych minęły już ponad dwa lata. Nasz zespół badawczy, działający głównie w stolicy Dolnego Śląska, wykorzystał ten czas bardzo efektywnie, osiągając zakładane kamienie milowe.
Celem projektu było opracowanie modułu inteligentnego, wirtualnego asystenta, który umożliwi wykorzystanie nieustrukturyzowanych komunikatów (pisemnych i słownych) do obsługi procesów osadzonych w platformie NEULA. Prace zostały podzielone na 3 etapy:
- Rozpoznawanie komunikatów wprowadzanych różnymi kanałami
- Uzupełnianie formularzy w NEULA
- Uzupełnianie brakujących treści
Przedstawiamy podsumowanie głównych rezultatów tych prac.
Rozpoznawanie komunikatów wprowadzanych różnymi kanałami
Pierwszy rok projektu poświęcony był w większości na opracowanie mechanizmu wczytywania danych z różnych kanałów komunikacji i przetwarzanie ich w jednolity zapis. Celem było automatyczne przypisywanie danych do odpowiednich procesów.
Najpierw przeprowadzono analizę jakości dostępnych na rynku rozwiązań umożliwiających ekstrakcję tekstu ze zdjęć i plików PDF (tzn. OCR – Optical Character Recognition). Analiza pokazała, że stosowane algorytmy są bardzo dokładne podczas ekstrakcji danych z plików zawierających jedynie tekst. Ich dokładność jednak znacząco spada, jeśli tekst połączony jest z grafiką lub tabelami. Ponadto obecność pisma ręcznego (jak w przypadku podpisów, notatek) lub tekstu o niskiej jakości (jak pieczątki) dodatkowo pogarsza skuteczność OCR.
W celu poprawy jakości OCR nasz zespół zaprojektował algorytm wyodrębniania tabel z plików PDF. Zastosowano w nim mechanizm budowania grafu dokumentu. W węzłach grafu umieszczane są fragmenty treści zwracane przez algorytm OCR i łączone ze sobą zgodnie z wzajemnym położeniem oraz odległością. Osiągnięto skuteczność przypisania tekstu z pliku PDF na tekst pisany OCR na poziomie 90.91%.
Następnie przeprowadzono badania nad klasyfikacją tekstów, w celu przyporządkowania otrzymanych komunikatów (pisemnych lub głosowych) do odpowiednich procesów. Otrzymano dokładność opracowanego algorytmu na poziomie 92%.
Uzupełnianie formularzy w NEULA
Kolejny etap projektu poświęcony był opracowaniu mechanizmu wydobywania informacji i automatycznego uzupełniania formularzy procesów na platformie NEULA. Zespół B+R opracował algorytm ekstrakcji pól obowiązkowych z formularzy wykorzystywanych w procesach. Algorytm został rozszerzony o mechanizm wydobywania dodatkowych informacji o polach formularzy, takich jak typy każdego z pól, zakres dopuszczalnych wartości oraz opisy. Stworzony algorytm uzyskał dokładność 100% na wszystkich testowanych procesach.
Dalsze badania były skupione na stworzeniu mechanizmu wydobywania danych z różnych kanałów komunikacji. Opracowano sposób komunikacji Neuli z chatbotem, voicebotem, treściami zawartymi w plikach PDF oraz wiadomościach email. Złożoność oraz różnorodność sposobów komunikacji wymagała opracowania niezależnych rozwiązań dla każdego sposobu komunikacji. Otrzymano dokładność odczytu na poziomie 91% dla chatbota, 80% dla voicebota, 88% dla dokumentów PDF oraz 97% dla wiadomości email.
Uzupełnienie brakujących treści
W ramach ostatniego etapu badań realizowane były prace nad mechanizmem pozwalającym określić informacje konieczne do przebiegu procesu w NEULA, przeanalizować dostępne dane i poprosić użytkownika o uzupełnienie brakujących danych.
Wykorzystano 6 procesów zaimplementowanych na platformie NEULA. Dla każdego z procesów opracowano model predykcyjny oparty na algorytmach uczenia maszynowego oraz sztucznej inteligencji, pozwalający na przewidywanie wartości pól formularza. Ponadto zbudowano algorytm określania przebiegu procesu. Pozwala on na przewidywanie najbardziej prawdopodobnego przebiegu nawet bardzo skomplikowanych procesów.
Co dalej?
Obecnie realizowane są prace nad integracją wypracowanych rozwiązań z platformą NEULA. Po ich zakończeniu nowe rozwiązanie będzie gotowe do pierwszych wdrożeń u dotychczasowych oraz nowych użytkowników platformy NEULA. Są już pierwsi zainteresowani użyciem zbudowanej w JT Weston technologii, unikalnej w skali co najmniej europejskiej.
Projekt jest współfinansowany ze środków Unii Europejskiej w ramach Działania 1.1.1 Projekty B+R przedsiębiorstw, Poddziałanie 1.1.1. Badania przemysłowe i prace rozwojowe realizowane przez przedsiębiorstwa, tzw. Szybka Ścieżka, Programu Operacyjnego Inteligentny Rozwój na lata 2014-2020.