ИИ-Бот
для финтеха
Автоматическая система коммуникации с пользователями и аналитический модуль для финтеха
Подход к разработке
Для реализации решения по части ИИ было выбрано несколько подходов:
— Использование готовых генеративных решений (ChatGPT 3.5);
— Использование open-source LLM моделей (Llama 2.0, Mistral);
— Использование нейросетей-трансформеров (Bert, Roberta);
По итогам тестов и исходя из модели продукта, было принято решение остановить выбор на модели BERT, как готовую модель, которую можно дообучить и разместить на своих серверах с сопутствующей высокой скоростью ответа. Данная модель была обучена на классификацию интентов (Intent Classification) + выделение сущностей из фраз.
Поскольку данный подход основан на определении класса входящего в модель сообщения и не предоставляет возможность сгенерировать ответ, было принято решение усовершенствовать систему деревом диалогов.
Данное дерево имитирует процесс общения двух пользователей. В зависимости от ответа второго пользователя на вопрос или сообщение первого происходит выбор следующего сообщения для коммуникации.
В качестве основного канала коммуникации был выбран мессенджер «Телеграмм», поскольку на данный момент он имеет самый широкий функционал для разработки кастомных решений среди всех мессенджеров, а так же является одним из самых популярных.
Процесс обучения
Обучение модели происходило на 10 000+ диалогов операторов по взысканию долгов и должников. Диалоги были переведены в текстовый формат, разделены по ролям. Была проведена кластеризация фраз должников. На основании кластеризации были выбраны самые плотные облака классов.
На основании проанализированных диалогов, аналитиками так же были выделены самые частые сценарии, которые затем были соотнесены с классами, полученными при кластеризации. Итогом данной работы стал набор классов, под которые были разработаны сценарии общения.
Фразы, выбивающиеся из общих классов, были либо присвоены какому-то классу, либо отправлены в общий класс, который представлял из себя заглушку.
Сложный подход к реализации диктуется из требований к максимальной технической точности распознавания запросов пользователей (Быстро проговоренные фразы; «прожеванные» слова, орфографические ошибки, некорректное поведение), поскольку бот общается в финансово-юридической плоскости, где разного рода ошибки распознавания могут быть критичны.
Масштабирование платформы
На данном этапе разработанное решение дорабатывается под бизнес-запросы заказчика по следующим критериям:
1. Общая информационная база и клиентский анализ
Дополнительно возможна реализация сбора статистики и введения общей информационной базы, в т.ч. контроль поведенческих паттернов и сценариев взаимодействия с клиентами. Станет возможным проводить анализы срезов данных по клиентам, метрически отслеживать слабые и сильные стороны бизнеса в рамках данного БП не только в области ответственности бота, но и всей экономики бизнеса в целом.
В том числе, например, возможно увеличение конверсии за счет возможности прогнозирования и подтверждения клиентоориентированных гипотез на основе статистики.
2. Глубокое дообучение ИИ
Дообучение ИИ на основе гипотез с целью расширения функционала и области применения, например, возможно внедрить методологии продаж дополнительных продуктов и услуг через ИИ, а также увеличивать конверсию за счет понятных для ИИ алгоритмов взаимодействия с клиентами различных категорий.
3. Реализация голосового ИИ
Разработанное решение позволяет производить доработки ИИ вплоть до полного замещения сотрудников-людей автоматизированной системой коммуникации и по телефонной линии, что позволит полностью оцифровать весь бизнес-процесс и многократно увеличит его пропускную способность.