Аналитика и комментарии

03 декабря 2021

Дмитрий ДЫРМОВСКИЙ, группа компаний ЦРТ: «ИИ – драйвер развития финтеха»

Финтех – наиболее быстро развивающаяся индустрия с точки зрения внедрения новых технологий. То, что первыми пробуют банки сегодня, через несколько лет внедряют компании из других отраслей. Однако глобальные запросы меняются, и финансовая индустрия – один из сегментов, который реагирует на такие запросы быстрее всего. Удовлетворить такие запросы помогают технологии, машинное обучение, ИИ. Именно эти направления являются концептуальной основой деятельности группы компаний ЦРТ (входит в экосистему Сбера) – разработчика продуктов и решений на основе разговорного ИИ, машинного обучения и компьютерного зрения с 30-летней экспертизой.

Группа ЦРТ реализовала более 5000 ИИ-проектов по всему миру, в том числе – национального масштаба. Решения на основе интеллектуальных речевых технологий, биометрии, голосовых и текстовых роботов ЦРТ используют крупнейшие банки России, в финтехе решения ЦРТ работают уже более 10 лет. Фактически, компания стоит у истоков рынка речевой аналитики, голосовых роботов на основе ИИ, биометрии и антиспуфинга (защиты биометрии от взлома, попыток атак, – прим. ред.). ИИ-продукты и решения компании особо оценили в 2021 году: группа ЦРТ признана лидером в области разговорного ИИ и компьютерного зрения с самой большой долей рынка. 2021 год стал также годом технологических прорывов научного департамента – R&D-центра ЦРТ – и признания на международном уровне, что подтверждают победы сразу в трёх знаковых мировых рейтингах: разработка решений по защите биометрии от попыток взлома, улучшенная технология голосовой биометрии, речевая аналитика.

Дмитрий Дырмовский, генеральный директор группы компаний ЦРТ, дал большое интервью Национальному банковскому журналу, рассказав о последних технологических трендах финтеха и о том, какие решения ЦРТ предлагает российскому и глобальному рынку в этой связи.

NBJ: Дмитрий, в конце октября группа ЦРТ представила свои достижения на Gitex Technology Week – крупнейшей конференции и выставке, объединившей более 4000 представителей ИТ-бизнеса из 140 стран. Какие разработки вы показали на Gitex-2021, и какие решения вызвали наибольший интерес?

Д. ДЫРМОВСКИЙ: Мы представили разработки в области лицевой и голосовой биометрии, а также самые современные технологии для их защиты. Кроме того, была представлена платформа на основе искусственного интеллекта для создания текстовых и голосовых роботов, которая помогает автоматизировать обслуживание и улучшать коммуникации с пользователями: анализировать обратную связь, и, опираясь на неё, совершенствовать сервисы, улучшать клиентский опыт. Особый интерес на выставке вызвали наши ИИ-решения для финансовой индустрии. Российские банки, финтех – глобальный флагман цифровизации: российские технологические решения уникальны и традиционно пользуются повышенным интересом за рубежом.

NBJ: Текущий год подходит к концу, какие технологические решения в 2021 году были особо востребованы?

Д. ДЫРМОВСКИЙ: Среди технологических трендов в финтехе – расширение речевой аналитики на офисы продаж и обслуживания, технологическое совершенствование голосовых и текстовых виртуальных ассистентов. Главным трендом можно назвать омниканальность – эта тенденция зарождалась давно, но в 2021 году мы фиксируем особый спрос.

NBJ: Расскажите, пожалуйста, подробнее. Что такое омниканальность, чем обусловлен спрос на неё?

Д. ДЫРМОВСКИЙ: Омниканальность гарантирует качественный бесшовный клиентский опыт: независимо от того, в какой канал обратился клиент – сайт, мобильное приложение, мессенджер, колл-центр или точку продаж, – важно получить сервис одного уровня, иметь возможность «бесшовно» продолжить диалог даже при смене канала коммуникации, а бизнес при этом должен получать агрегированную информацию о том, что говорят клиенты, кто они, каковы их желания. Так, учитывая «голос клиента», бизнес сможет принимать сбалансированные управленческие решения, направлять клиентам таргетированные предложения, тем самым повышая продажи и улучшая пользовательский опыт. Преимущество такого решения очевидно, а поскольку банковский сегмент традиционно выделяет сustomer experience (СX) – клиентский опыт – как одну из ключевых ценностей, тренд формирует преимущественно финансовый сегмент, активно поддерживает телеком и ряд других отраслей, вплоть до нового формата государственных сервисов.

NBJ: Этот тренд глобальный или сформирован российским рынком? И существует ли технологический ответ на такой запрос?

Д. ДЫРМОВСКИЙ: Тренд, безусловно, глобальный. В соответствии с IDC Customer Experience Benchmark, 27 % компаний сказали, что улучшение технологий работы с клиентом и обработки клиентской информации – их приоритет в зоне развития СХ. В 2019 году 13,9 млрд долл. США было инвестировано в ИИ, ориентированное на CX, и 42,7 млрд долл. США – в большие данные и аналитику, ориентированные на CX. Ожидается, что оба показателя вырастут до 90 млрд долларов уже в 2022 году. Исследование SDL ещё в 2014 году показало, что 90 % покупателей хотят, чтобы их взаимодействие при покупке было сквозным через все каналы. С течением времени тенденция лишь усилилась. Исследование Omnisend, уже 2019 года, показало, что в омниканальных кампаниях уровень вовлечённости составил 18,96 %, а в одноканальных – всего 5,4 %. Средний потребитель больше не использует только 2 точки взаимодействия для каждой покупки, оно утроилось до 6 и увеличивается. Очевидно, что молодое поколение более склонно к многоканальности, однако – и это интересный факт – и старшие поколения ожидают многоканальной доступности: по данным Chief Marketing Officer (CMO) Council, порядка 78 % представителей поколения бумеров (65–75 лет) сообщили, что они недовольны, когда им приходится начинать общение с брендом вновь.

Технологический ответ на запрос омниканальности – разработка ИИ-платформы, которая объединила более семи самостоятельных продуктов и технологий: автоматизация голосового и текстового обслуживания, распознавание и синтез речи, голосовая и речевая биометрия, а также речевая аналитика. За счёт глубокой интеграции между продуктами платформа позволяет ускорить внедрение в существующую инфраструктуру компаний, в том числе банков, и сэкономить бюджет. За термином «интеграция» скрыто решение пресловутого стресса из-за разрозненных решений, которые не соотносятся друг с другом, конфликтуют. Именно поэтому интеграция для нас стала задачей номер один.

Платформа объединила функционал сразу трёх продуктовых блоков для общения, персонализации и аналитики.

NBJ: Что представляют собой эти блоки?

Д. ДЫРМОВСКИЙ: Блок «Общение» представлен продуктами и сервисами для построения взаимодействия с клиентом на естественном языке с помощью систем обработки входящих и исходящих обращений через телефонию, IVR, текстовых и голосовых роботов.

Блок «Персонализация» включает продукты и сервисы для удобной и безопасной идентификации клиентов и предотвращения мошенничества при дистанционном обслуживании, для проведения аутентификации клиентов, создания персонализированных предложений на базе голосовой и лицевой биометрии. И один из самых востребованных – блок «Аналитика» для анализа речевого взаимодействия «клиент-персонал» или «клиент-бот» при обращении в контакт-центр или фронт-офис.

Интеграция позволила создать комплексную платформу с возможностью обмена данными: то, что раньше было доступно в одном продуктовом блоке, стало доступным всей платформе. Это гарантирует более полный обмен данными и их обогащение, а модульная структура позволяет учесть все пожелания бизнеса, добавляя необходимые опции и исключая избыточные. Кроме того, интеграция позволяет обеспечить взаимодействие с системами: и передачу информации в контур заказчика, и её получение, что наши клиенты очень ценят.

NBJ: Насколько востребовано такое решение?

Д. ДЫРМОВСКИЙ: Всего на платформе реализовано более 90 проектов для крупного бизнеса, и большинство из них – в финансовом секторе. Решение модульное, есть возможность использовать только необходимый блок, а не всю платформу целиком. Крупный бизнес уже оценил сервис: группа ЦРТ реализовала более 30 проектов речевой аналитики, 15 из них – для ведущих банков России и СНГ. Также зрелость платформы позволяет использовать её, создавая, к примеру, голосовых или текстовых виртуальных ассистентов, силами собственного in-house департамента заказчика. Такое многообразие подходов очень ценят наши клиенты, но подавляющее большинство проектов предполагает внедрения уникального, кастомизированного решения силами наших экспертов.

NBJ: Мы разобрали тренд омниканальности. Возвращаясь к тенденциям речевой аналитики, скажите, пожалуйста, почему вы выделяете это решение в отдельный тренд, ведь оно не является новым?

Д. ДЫРМОВСКИЙ: Верно. Эффективность речевой аналитики в онлайн контактных центрах крупные банки уже оценили, поэтому мы выделяем как тренд не доказавшую свою эффективность речевую аналитику в колл-центрах – это уже, скорее, стандарт, а распространение речевой аналитики на офлайн-каналы, офисы продаж и обслуживания.

Сегодня невозможно предоставлять высококлассный клиентский сервис без обработки нескольких тысяч звонков, которые поступают в колл-центр ежедневно, с помощью современных технологических решений. Осознавая это, мы последние несколько лет фокусировались на анализе голоса клиента: наше решение помогает понять, зачем клиент обратился, почему возникла ситуация обращения в контактный центр, что можно сделать, чтобы снизить повторные обращения: например, сделать услуги и тарифы более прозрачными, а биллинг – более понятным. В этом и помогает разобраться речевая аналитика ЦРТ, в которой 50 параметров анализа – максимальное для российского рынка.

Принципиально новый тренд – распространение речевой аналитики на офлайн-каналы, офисы продаж и обслуживания, где шумно, масса посторонних звуков, – требует от разработчиков высокого качества распознавания речи.

NBJ: Современные решения позволяют это реализовать?

Д. ДЫРМОВСКИЙ: Да, с технологической точки зрения такое решение полностью готово, мы уже участвуем в ряде пилотов, где решение отлично себя показывает. Этого удалось достичь благодаря технологическому прорыву – качественной работе на «среднем микрофоне», что позволило нам дать старт новому процессу: оптимизировать клиентский опыт не только в удалённых каналах – колл-центрах, но и в офлайн-каналах, офисах продаж, удовлетворяя запрос не только банков и крупного enterprise. Запрос на такой инструмент был давно сформулирован крупным бизнесом. Его можно применять и в МФЦ, и госсервисах. Важную роль играет и технология распознавания речи. Наша технология на международном конкурсе CHiME, где мы соревновались с командами Китая, США, Чехии, была признана лучшей в мире, что обеспечивает высокое качество ИИ-решений.

NBJ: Но зачем речевая аналитика нужна в отделениях банков?

Д. ДЫРМОВСКИЙ: До сих пор клиенты банков, получив качественное удалённое обслуживание по телефону, могут столкнуться с негативным опытом непосредственно в отделениях продаж. Речевая аналитика во фронт-офисах позволит контролировать этот процесс точно так же, как и в контактных центрах: система будет записывать все диалоги, а последующая аналитика поможет выявить сильные и слабые места в коммуникациях отдельного сотрудника и в общей политике работы с клиентами, в том числе – в процессе продаж и кросс-продаж. К примеру, в одном из проектов по применению речевой аналитики в офисе Банка мы сверяли, что специалист предложил все услуги, которые ему подсказала система CRM по карточке клиента, и описал их преимущества, что положительно сказалось на росте продаж. Реализовать речевую аналитику во фронт-офисах можно с помощью различных стационарных микрофонов, планшетов, а также с помощью специальных устройств – «умных бейджей», который может носить каждый сотрудник.

NBJ: Такие решения уже существуют?

Д. ДЫРМОВСКИЙ: Да, например SmartBadge: разработка компании SberDevices, которая интегрируется с системой речевой аналитики ЦРТ. Речевая аналитика преобразует диалоги в текст, анализирует множеством алгоритмов, а развитая отчётность помогает оперативно выявлять проблемные зоны. Применение устройства позволяет повысить качество обслуживания, обучать сотрудников, разрешать спорные ситуации, анализировать запросы клиентов, повышать продажи, лояльность клиентов. Совсем недавно продукт победил в премии CES Innovation Awards 2022 в номинации «Носимые устройства». Конкурс прошёл в преддверии одного из самых влиятельных технологических событий в мире – Consumer Electronics Show (CES) 2022, которое состоится в январе в Лас-Вегасе. О старте продаж мы объявим дополнительно.

NBJ: Что нового стоит ожидать клиентам банков в части голосовых ассистентов? Будет ли расти их количество, меняться функциональность?

Д. ДЫРМОВСКИЙ: Голосовые и текстовые боты, виртуальные ассистенты вместо выполнения одной функции смогут целиком брать на себя бизнес-процесс. Уже сейчас это особенно востребовано в продажах. Например, виртуальный ассистент сможет принять звонок от клиента банка, задать ключевые вопросы, в режиме реального времени передать результаты разговора в CRM, где уже CRM-робот сможет вычислить и проставить вероятности для ключевых слов и фраз, которые могут подтолкнуть клиента к совершению целевого действия. В итоге, также в реальном времени, на основе анализа, робот сможет подсказать менеджеру, что именно ему нужно сказать клиенту на следующем этапе воронки продаж, это кейс «суфлёра». Когда мы говорим о роботах в бизнес-процессах, то имеем в виду не примитивных ботов, способных выполнять только одну функцию, которые всех раздражают и только отталкивают. Мы говорим о многофункциональных, по-настоящему интеллектуальных роботах, в основе которых – самые современные технологии. «Интеллект» такого диалогового ассистента при этом можно непрерывно совершенствовать, опираясь на данные речевой аналитики, что позволяет сверхбыстро получать реальный фидбек аудитории и реагировать на него.

NBJ: Расскажите детальнее, в чём разница…

Д. ДЫРМОВСКИЙ: Уже сейчас прогрессивные разработчики уходят от детерминированных алгоритмов к нейронным сетям. Голосовые роботы на основе нейросетевых моделей более самостоятельны, обучаются быстрее, могут выполнять больше функций, чем предшественники. Это позволит и обогащать роботов большим числом разнообразных тематик – клиенты банков смогут получить более естественное общение с интеллектуальным помощником, чем сейчас. Постепенно такие роботы будут превращаться – и уже превращаются – в персональных помощников для клиента. На основе имеющейся информации о клиенте они смогут помогать ему принимать финансовые решения, а банки, в свою очередь, при помощи роботов расширяют спектр услуг и смогут предоставлять индивидуальную поддержку каждому клиенту.

NBJ: Традиционный, самый популярный запрос в финтехе – онбординг, перевод идентификации клиента полностью в онлайн, чтобы привлекать клиента в банк без необходимости его присутствия в отделении. И наиболее острый вопрос здесь – «как идентифицировать клиента в первый раз». Какие технологии помогают в этом?

Д. ДЫРМОВСКИЙ: Здесь необходимы комплексные решения – бимодальная (двухфакторная) – голосовая и лицевая биометрия, а также антиспуфинг – защита от взлома. На рынке есть много решений, но банкам удобнее получать такие услуги от одного вендора, который мог бы закрыть под ключ вопросы безопасности с помощью современных инструментов, поэтому мы делаем ставку на комплексный подход.

NBJ: Любая технология с ростом популярности привлекает злоумышленников. А для банков вопрос безопасности – самый чувствительный. Что сейчас предпринимают разработчики для защиты решений?

Д. ДЫРМОВСКИЙ: Сегодня, чтобы пройти голосовую биометрию, мошенники могут воспроизвести запись голоса человека или пойти технологически более сложным путем – подделать нужный голос с помощью технологии Deepfake. Для детектирования таких действий применяется технология Antispoofing – защита от взлома. В 2021 году группа ЦРТ достигла серьёзных успехов в области защиты биометрии, что было отмечено международными экспертами.

Существуют разные типы атак, на борьбе с которыми фокусируются глобальные разработчики. Во-первых, детектирование атак на основе повторного воспроизведения (replay). При атаке такого типа мошенник каким-либо способом получает запись голоса пользователя, а затем воспроизводит эту запись при попытке взлома.

Во-вторых, детектирование атак на основе синтеза или преобразования голоса. При такой атаке мошенники могут использовать произвольные образцы речи пользователя (например, из доступных в Интернете аудиофайлов), и с помощью системы клонирования или преобразования голоса получить синтезированную речь для взлома биометрической системы.

Также устойчивость алгоритмов к внешним шумам, таким как улица, транспорт, кафе и т.д., корректное выделение голоса говорящего и определение подделок.

Если в банке в качестве защиты установлена только голосовая биометрия, а оператор обрабатывает звонок невнимательно, отклоняясь от скрипта, и не обращает внимания на нетипичные реплики «клиента», то система может быть подвергнута атаке. Но если будет подключен антиспуфинг – система быстро обнаружит попытку мошенничества и подаст соответствующий сигнал. Обнаружить обман системе помогают нейронные сети: они определяют различные особенности звука. У любого источника записи есть свои параметры, свой кодек сжатия и пр., а у обычного, живого разговора этого нет. Поэтому то, что не может «уловить» человек, легко выявит нейронная сеть: артефакты синтеза, при попытке взлома системы с помощью синтезированной речи, будут видны на уровне звуковой волны. Но и здесь роль оператора важна: нелогичность диалога человеку оценить легче. В случае подозрений он может задать дополнительные вопросы: спросить про одну-две последние операции или дни обращений клиента в банк.

Чтобы успешно противостоять попыткам атак, важно дополнять лицевую или голосовую биометрию технологиями антиспуфинга, одна из них – liveness detection (проверка – живой ли пользователь, или, к примеру, маска или фото). В контакт-центре, роботе – диалоговом ассистенте или в «умных» колонках нам доступен только голосовой канал, но, например, в мобильных или web-приложениях мы можем усилить решение, дополнить его лицевой биомерией с liveness-защитой. Комбинация двух факторов может значительно расширить горизонт применения решения: например, в тёмных помещениях может быть доступна верификация по голосу, а в шумных – по лицу.

Уже есть масса кейсов, когда решения на основе искусственного интеллекта оптимизируют клиентское обслуживание в финтехе, а также помогают заботиться о безопасности. Опыт цифровизации российских банков – передовой, и мы видим интерес к таким решениям и на глобальном уровне. 30-летний опыт, собственный R&D-департамент, а также доступ к ресурсам и компетенциям Сбера, в экосистему которого входит группа ЦРТ, позволяет нам постоянно совершенствовать свой технологический уровень, предоставляя клиентам и партнёрам лучшие ИИ-продукты и на российском, и на глобальном рынках.

Беседовала: Оксана Дяченко

Материал также опубликован в печатной версии Национального Банковского журнала (№11, ноябрь 2021)

Поделиться:
 

Возврат к списку