Аналитика и комментарии

17 июля 2017

cовременный скоринг: использование big data и machine learning

Алгоритмы построения ключевых скоринговых моделей, используемых банками, опираются на классические методы статистического анализа и остаются неизменными на протяжении уже долгого времени. Однако в последние годы идет активное развитие дополнительных источников данных, которые используются при построении скоринговых систем. Появляются новые подходы к обработке информации, например, комплекс технологий big data. Кроме того, происходит совершенствование специализированного аналитического программного обеспечения, которое позволяет использовать дополнительные инструменты анализа данных и моделирования, а также более быстро и эффективно обрабатывать огромные массивы данных. В настоящее время банки все больше начинают применять сложные производные модели прогнозирования, построенные на базе анализа данных big data и machine learning.

Скоринг использует новые источники данных

Любая скоринговая система состоит из двух основных компонентов. Непосредственно системы управления принятием кредитного решения – «кредитного конвейера», и аналитической системы для построения скоринговых моделей – «аналитической скоринговой системы». Первый класс систем позволяет применять скоринговые модели для анализа заемщиков, второй класс – разрабатывать скоринговые модели и проводить оценку эффективности внедренных скоринговых моделей. 

За последние несколько лет изменения коснулись в основном первого класса систем, или кредитного конвейера, рассказывает директор департамента риск-менеджмента Росгосстрах Банка Александр Чернов. Основное отличие заключается в том, что ранее их настраивали исключительно специалисты по информационным технологиям. Современные системы устроены таким образом, что позволяют вносить изменения в процессы принятия решений без непосредственного участия айтишников. Также упростился процесс интеграции с различными сервисами, предоставляемыми внешними компаниями, например, бюро кредитных историй, либо с внешними базами данных, например, с данными CRM-систем.

Второй класс, аналитические скоринговые системы, изменился меньше, но и там были реализованы новые методы анализа данных, прежде всего связанные с big data и неструктурированными данными, отмечает Александр Чернов.

Можно с уверенностью констатировать, что в настоящее время в нашей стране накоплены значительные объемы информации по поведению клиентов – физических лиц. Во-первых, это данные из бюро кредитных историй, которые в России появились почти десять лет назад. Во-вторых, информация о поведенческих механизмах и процессах, которая позволяет отслеживать действия конкретного клиента в зависимости от его прошлых взаимоотношений с финансово-кредитной организацией. Следует учитывать и растущий массив сведений, которые плохо структурированы, но при этом публично доступны. Это данные из социальных сетей, информация о поведении клиента в сети Интернет (например, на какие сайты он чаще всего заходит) и т.д.

«На сегодняшний день массив информации гораздо больше того объема, который позволяли обработать алгоритмы XX века. Поэтому сейчас активно развиваются алгоритмы машинного обучения, которые позволяют создать сам процесс построения статистических алгоритмов», – объясняет заместитель председателя правления ОТП Банка Сергей Капустин.

Современные системы скоринга строятся как системы статистических моделей, использующих максимально возможный набор доступной информации о потенциальном клиенте, отмечает старший вице-президент, директор департамента анализа рисков ВТБ 24 Андрей Гулецкий. Их отличие от моделей пятилетней давности в основном заключается в использовании новых источников данных типа big data, а также алгоритмов их анализа и построения соответствующих моделей. По мнению эксперта ВТБ 24, ключевые риск-модели, используемые банками, все же опираются на классические методы статистического анализа. Однако все больше начинают применяться сложные производные модели прогнозирования, построенные на базе анализа данных big data и machine learning.

Начальник управления розничных кредитных рисков банка ВТБ Алексей Новиков также подчеркивает, что в последние годы идет активное развитие дополнительных источников данных, которые используются при построении скоринговых моделей. «Появляются новые подходы к обработке информации, например, комплекс технологий big data. Кроме того, происходит совершенствование специализированного аналитического ПО, которое позволяет использовать дополнительные инструменты анализа информации и моделирования, а также более быстро и оптимально обрабатывать большие объемы данных».

Директор департамента розничного кредитования МОСКОВСКОГО КРЕДИТНОГО БАНКА Александр Шорников считает, что алгоритмы построения скоринговых моделей неизменны и сформированы математиками много лет назад. Однако развитие вычислительных мощностей оборудования, систем хранения и СУБД способствовало тому, что современные программные продукты разработки скоринговых моделей позволяют вести бизнес быстрее и эффективнее. А иногда проводить все этапы – разработку, внедрение и переобучение – полностью в автоматическом режиме. Также в настоящее время многократно расширилось информационное поле исходных данных. Речь идет о системах big data, которые можно использовать при построении скоринговых моделей. «Сейчас разработчик больше думает не о том, где достать данные, а о том, как оптимизировать стоимость использования скоринговой системы», – подчеркивает эксперт МКБ.

Необходима детализация клиентских сегментов

Следует отметить, что в современных системах оценки заемщика достаточно много данных, которые позволяют рассчитать вероятность мошенничества. По словам Сергея Капустина (ОТП Банк), в случае, если клиент хорошо известен банку, и от него приходит совершенно не типичный запрос (в том числе из другого региона или с другой контактной информацией, которая может показаться банку подозрительной), задача современной системы оценки рисков и современной системы принятия решений заключается даже не в том, чтобы выдать кредит или отказать в нем клиенту, а в том, чтобы назначить дополнительный этап проверки или дополнительные этапы верификации запроса. И сегодня, в отличие от предыдущих лет, происходит серьезная сегментация клиентов при построении скоринг-моделей, подчеркивает эксперт ОТП Банка. 

«Отдельно строится скоринг для новых клиентов, делается скоринговая карта клиентов, у которых есть сложные нюансы. Либо просрочка в ходе прошлых кредитов, либо какая-то иная негативная практика взаимодействия с банком», – поясняет Сергей Капустин. Так, при оценке рисков ОТП Банк делает глубокую сегментацию. Суть заключается в том, что выделяются сотни различных сегментов клиентов, решения по кредитованию которых принимаются в зависимости от их классификации и нахождения в той или иной группе. В каждой из этих групп осуществляется детальный мониторинг поведения, тщательная проработка статистики именно этой специфики клиентской аудитории для того, чтобы прогнозная модель совпала с фактическими результатами по данному сегменту.

Несмотря на то, что большая детализация клиентских сегментов приводит к увеличению расходов банка на построение таких статистических моделей, все затраты быстро окупаются. Потому что происходит более качественное и более точное принятие решений, учитывающее потребительские особенности всех сегментов. В итоге это позволяет банку успешно работать на более конкурентном рынке с сокращающейся доходностью и усиливающейся конкуренцией. То есть на рынке, где априори выиграет тот, кто соберет у себя под «крылом» хороших клиентов, отмечает Сергей Капустин.

Критерии оценки скоринга

Набор параметров оценки систем скоринга достаточно стандартизирован и на протяжении долгого времени остается практически неизменным. Скоринговые модели характеризуются разделяющей (дифференцирующей) способностью, стабильностью результатов применения модели во времени, интерпретируемостью входящих в нее составляющих. Наряду с этим они должны обладать хорошей предиктивной (предсказательной) способностью, так как на их базе строится, в том числе, и количественная оценка риска.

«Так как понятие «производительность» стало менее финансово емким (современные системы хранения данных сравнительно недороги. – Прим. ред.), основным фактором при выборе подобных систем стала возможность работать с большими объемами информации (user-friendly системы) без трудоемкого программирования – считает Александр Чернов (Росгосстрах Банк). – Также важными критериями являются время внедрения подобных систем и возможность их гибкой настройки под нужды конкретного банка за минимальное время с минимальными последующими затратами».

Информация для скоринга

Основной информацией для скоринговых систем всегда были данные о социально-демографическом профиле заемщика (возраст, пол, семейное положение, регион и т.д.), получаемых доходах и расходах, о кредитной истории. Однако современные технологии позволили расширить круг анализируемых данных, и банки стали использовать информацию об активности клиентов в социальных сетях, платежном поведении (какие покупки и где совершает – по данным платежных карт), а также геокодирование и геолокацию (для анализа удаленности места проживания и места работы клиента от офисов банка, особенностей территории проживания и т.д.) Все эти сведения помогают банку более точно сегментировать клиентскую базу и предлагать целевые кредитные продукты и удобные каналы продаж в соответствии с предпочтениями каждого клиентского сегмента. Также совокупность этих данных помогает определять уровень риска для различных клиентских сегментов, отмечает Александр Чернов (Росгосстрах Банк).

Для построения моделей используется максимум внутренней информации, которой обладает банк. Социальный портрет, история взаимоотношений с клиентом (обращения), история платежей и пользования продуктами и услугами и т.д., а также внешние данные, которые банк может получить, имея согласие со стороны клиента для целей верификации благонадежности (бюро кредитных историй, телеком-операторы, платежные системы, поставщики big data), рассказывает Александр Шорников (МКБ). «В каждом конкретном случае набор параметров в модели уникален и составляет коммерческую тайну компании, – подчеркивает эксперт. – Иногда внутренние скоринговые модели банка дополняются независимыми скоринговыми системами внешней разработки, образуя так называемые комбинированные модели».

Банки стараются использовать всю доступную на этапе оценки информацию (внутреннюю из систем банка или внешнюю, например, БКИ и другие сервисы), а также привлекают новые источники данных при условии экономической целесообразности их использования, соглашается с коллегами Андрей Гулецкий (ВТБ 24). «Увеличение объемов объективной информации о клиенте позволяет умножить дискриминирующую силу модели, что в свою очередь позволяет банку принять более правильное решение о выдаче кредита», – подчеркивает специалист ВТБ 24.

С коллегами согласен и Алексей Новиков (банк ВТБ). «Статистическими методами оценивается возможность предсказывать целевую переменную – характеристику, значение которой вы хотите спрогнозировать в будущих периодах», – говорит эксперт. В результате наиболее предиктивные факторы формируют итоговую скоринговую модель.

Конечно же, современные системы скоринга позволяют инкорпорировать весь набор информации, которая выделена как наиболее значимая и наиболее коррелирующая с целевым параметром, например, с событием кредитного дефолта, отмечает Сергей Капустин (ОТП Банк). «Поэтому при построении скоринг-карт перед разработчиками стоят задачи: как и где найти релевантные данные, как их обработать, как выделить «шум», и как, соответственно, его отсеять, как выделить и откорректировать элементы нестабильности этой информации во времени, – объясняет эксперт ОТП Банка. – Например, в течение одного периода информация определенного блока может быть доступна, а после провайдер этой информации может приостановить ее предоставление. И в этом случае организация, использовавшая информацию, должна быть уверена в том, что без нее процесс скоринга будет осуществлен корректно».

Полная автоматизация принятия решения: «за» и «против»

В настоящее время финальное решение о выдаче кредита часто принимает специальный менеджер. Распространено мнение, что в скором времени решение о выдаче кредита будет полностью автоматизировано.

С точки зрения состоятельности и эффективности принятия кредитного решения есть аргументы «за» и «против» полной автоматизации этого процесса. Полностью формализованный подход позволяет автоматизировать применение политик и делает процесс принятия кредитного решения менее зависимым от субъективных факторов. Однако подобный подход является менее гибким, он не позволяет учесть всего многообразия ситуаций, случающихся в реальной жизни, считает Андрей Гулецкий (ВТБ 24). Стремление к увеличению уровня автоматизации при принятии кредитного решения давно является основным трендом. Но объективно никогда не удастся полностью отказаться от использования риск-менеджеров для принятия кредитных решений в ряде случаев. «Более того, есть сегменты кредитования или продукты, в которых все-таки полностью положиться на автоматическое решение не представляется возможным. Системы скоринга и другие инструменты лишь призваны облегчить сотруднику принятие финального решения, но они не смогут полноценно заменить его работу», – уверен эксперт ВТБ 24.

По мнению Алексея Новикова (Банк ВТБ), в правильно организованной системе принятия кредитных решений вся аналитическая информация по клиенту, в том числе результаты «ручных» проверок и процедур, аккумулируется на системном уровне, и решение принимается автоматизированно. Это позволяет снизить как влияние человеческого фактора, так и возможности для мошенничества. Уже сейчас существенная доля кредитных решений принимается без участия человека. С развитием дополнительных источников данных и по мере дальнейшей автоматизации процессов она будет увеличиваться. «Тем не менее, по некоторым клиентским сегментам для полноценного анализа требуется проведение «ручных» мероприятий, которые не могут быть авто­матизированы. В обозримом будущем полное их исчезновение вряд ли произойдет», – высказывает свою точку зрения Алексей Новиков (банк ВТБ).

«Вероятно, времена, когда компьютеры смогут полностью заменить человека, впереди, – солидарен с коллегами Александр Чернов (Росгосстрах Банк). – И в настоящее время процессы принятия решений автоматизированы, но в ряде случаев участие специальных менеджеров обосновано. Всегда существует так называемая «серая зона», когда по ряду факторов принять правильное решение может только опытный специалист. Участие человека необходимо и в процессах антифрода, когда требуется на основании ряда выявленных факторов принять решение о добросовестности или недобросовестности действий конкретного клиента».

Существуют некоторые сегменты кредитования, в которых время принятия решения важнее размера принимаемого риска, в этом случае полная автоматизация процесса является верным решением, считает Александр Шорников (МКБ). Однако комбинированный подход к принятию решений – специальный менеджер и искусственный интеллект – позволяет достигать лучших результатов, повышать прозрачность и защищенность процесса, уверен эксперт МКБ.

Спектр применения скоринга

Термин «скоринг» пришел в банковскую деятельность из медицинской сферы, поскольку механизмы скоринга, или, более точно, методы математической регрессии, применялись изначально для предсказания вероятности тех или иных заболеваний. В нынешнее время механизмы скоринга могут применяться практически в любых направлениях банковской деятельности, где требуется оценить вероятность отклика клиента на то или иное предложение банка либо оценить доходность/убыточность того или иного клиента для банка, рассказывает Александр Чернов (Росгосстрах Банк). Например, стоит ли звонить и предлагать клиенту определенного профиля новый банковский продукт или он с высокой степенью вероятности не заинтересуется предложением банка.

Скоринговые системы имеют доволь­­но широкий спектр применения: в страховых компаниях, среди мобильных операторов, в маркетинговых платформах.

В банковской сфере скоринг ис­поль­зуется не только для принятия кредитных решений, но и в процессах сбора просроченной задолженности, для управления лимитами по кредитным картам, при прогнозировании отклика клиентов на продуктовые предложения, отмечает Алексей Новиков (банк ВТБ).

Андрей Гулецкий (ВТБ 24) говорит, что, помимо принятия кредитных решений, скоринговые системы применяются для управления другими процессами в ходе жизненного цикла кредита или взаимоотношений с клиентом. Например, когда речь идет о предложении клиенту дополнительных продуктов или выработке для него специальных условий обслуживания привлеченных средств, а также при работе с просроченной задолженностью и т.д.

Александр Шорников (МКБ) считает, что в банковской отрасли сфера применения скоринговых систем практически безгранична. Эксперт среди наиболее востребованных и эффективно решаемых с помощью скоринга задач отмечает следующие. Во-первых, это классификация клиентов по риску при принятии кредитного решения и на этапе сопровождения портфеля (оценка вероятности дефолта или взыскания). Во-вторых, формирование маркетинговых активностей и продуктовых предложений на основе скоринговых моделей отклика и ценообразования. В-третьих, формирование модели выбора оптимального канала взаимодействия с клиентом и оптимизации расходов и модели оценки кредитного риска для резервирования портфеля.

«Мы используем модели всех перечисленных выше вариантов, – рассказывает Александр Шорников. – Для проверки заемщиков модели используются в комбинациях с риск-правилами. Также после этапа скоринга активно привлекается андеррайтинг, если уровень риска клиента повышенный или требуется перепроверить какие-либо факторы, выявленные системой принятия решений».

«В части кредитного конвейера наш банк частично использует собственные наработки, учитывающие специфику клиентского сегмента, – отмечает Александр Чернов (Росгосстрах Банк). – В части аналитической скоринговой системы используется как продукция известных брендов, так и программы со свободно распространяемыми лицензиями».

Банк ВТБ 24 использует большое разнообразие скоринговых систем и моделей как в целях оценки кредитоспособности заемщиков, так и для принятия иных решений и управления процессами. Качество заемщиков проверяется в соответствии с утвержденной кредитной политикой с использованием всей доступной информации на момент принятия решения и с использованием развитых скоринговых систем, проходящих регулярный мониторинг и валидацию (независимый контроль качества) согласно принятому регламенту. «В проблемных зонах к проверке клиентов также привлекаются специализированные службы,  которые позволяют оценить заемщиков ввиду более гибкого подхода или более комплексного анализа информации с использованием проверочных звонков, собеседований и выездов», – объясняет Андрей Гулецкий.

Обычно банки не афишируют, какую скоринговую модель они применяют и как проверяют качество заемщиков. Причина проста – эти данные иллюстрируют рыночные преимущества одних банков перед другими. Как в части скорости принятия решений, так и в возможности быстрого применения новых методик и моделей.   

Поделиться:
 

Возврат к списку