Аналитика и комментарии

24 января 2017

Хранилище данных – абсолютная необходимость

Корпоративное хранилище данных (КХД) позволяет оперативно получать доступ к огромному массиву финансовой и аналитической информации по клиентам и истории их взаимоотношений с банком. Также КХД обеспечивает подготовку управленческой отчетности. О том, как проект по реинжинирингу КХД реализуется в Росбанке, NBJ рассказала директор департамента развития и поддержки корпоративного хранилища данных Росбанка Светлана БОВА.

NBJ: Светлана Николаевна, какая часть ИТ-бюджета идет на проекты, связанные с КХД? 

С. БОВА: Проект реинжиниринга корпоративного хранилища данных входит в топ-5 портфеля проектов Росбанка в первую очередь как стратегический проект банка, направленный на создание консистентного единого источника «чистых» данных для получения качественной управленческой и регуляторной отчетности. Также КХД используется для предоставления бизнес-подразделениям корректных данных для принятия управленческих решений, управления взаимоотношениями с клиентами, управления рисками, ликвидностью и т.д. 

Корпоративное хранилище данных должно обеспечить развитие бизнеса банка, особенно с учетом текущей экономической ситуации, требующей принятия быстрых и основанных на актуальной и качественной информации решений. Поэтому проект, безусловно, занимает весомое место в ИТ-бюджете, так как, помимо построения новых бизнес-процессов реализации отчетности и изменения архитектурных принципов построения ­бизнес-функциональности КХД, включает в себя масштабные инфраструктурные изменения. Речь идет о построении полноценных сред разработки, тестирования, сертификации и наращивании промышленной среды, о создании ландшафта для бэк-копирования данных и об организации disaster recovery площадки. 

NBJ: Какие решения были выбраны для создания платформы КХД? 

С. БОВА: Мы используем линейку продуктов IBM: в качестве СУБД IBM DB2, инструмент для загрузки и трансформации данных (ETL) IBM DataStage, IBM BDW (BankingDataWarehouse), индустриальная модель данных ядра – детального слоя хранилища, а для предоставления отчетности конечным пользователям – стандартный BI-инструментарий. 

NBJ: Не могли бы вы подробно описать процесс обработки данных, поступающих в КХД?

С. БОВА: На ежедневной основе происходит загрузка данных из банковских систем в слой ODS (Operational DataStore), имеющий физические структуры таблиц, максимально приближенные к физической модели хранения данных систем-источников. Этот этап происходит в ночное время после процедуры закрытия операционного дня. Затем, на следующем шаге ETL-процессов, происходит выделение инкрементальных изменений, трансформация данных и загрузка в модель ядра хранилища данных. Банк выбрал промышленную модель IBM BDW для организации детального слоя хранения данных, специализированную для банковской деятельности и хорошо зарекомендовавшую себя в мировой практике построения хранилищ данных. Также на данном этапе производится проверка данных на консистентность, ссылочную целостность, корректность форматов заполнения данных с тем, чтобы в ядро КХД обеспечить загрузку только «чистых» данных.  

Ядро КХД является единственным источником для построения слоя бизнес-ориентированных витрин данных. Витрины данных предназначены для вычисления и предподготовки данных для целей составления отчетности и предоставления выгрузок данных во внешние системы. Витрины данных, как правило, организованы по схеме «звезда», необходимой для эффективного применения инструментария Business Intelligence.

Конечный пользователь имеет доступ к данным и предрассчитанным отчетам через BI-инструмент, позволяющий не только использовать готовые отчеты, но и создавать свои произвольные ad-hoc-отчеты из набора данных.  

Важно отметить, что на каждом шаге загрузки и обработки данных осуществляются не только технические проверки, но и автоматизированные бизнес-проверки качества данных. 

NBJ: Вы упомянули о качестве данных. Действительно, в последнее время много говорят о возрастающем объеме данных и ускорении темпов их прироста. Как в такой ситуации эффективно осуществлять управление данными?

С. БОВА: Абсолютно верно: чем больше информации, тем сложнее определить ее ценность, проверить качество, чтобы выбрать в этом потоке только достоверную информацию, на основании которой можно смело принимать решения. 

Хранилище данных, являясь центром сосредоточения информации из большинства информационных систем банка, с одной стороны, и системой отчетности, с другой стороны, уделяет вопросам систематизации и качества данных повышенное внимание. Так, в рамках проекта по реинжинирингу корпоративного хранилища данных мы внедрили IBM DataGlossary – решение для унифицированного ведения бизнес-классификатора данных банка. Здесь содержатся перечень и подробное описание бизнес-сущностей, атрибутов и показателей. Также мы фиксируем для каждой атомарной единицы данных ее владельца. Владельцем выступает бизнес-подразделение банка, ответственное за методологию расчета показателя, за определение критериев качества данных и за актуальность описания сути каждого бизнес-термина. 

Это оказалось достаточно сложной задачей – определить «хозяина» данных. Приведу простой пример: контактный телефон клиента – казалось бы, простой атрибут анкеты клиента. Кто в банке может являться владельцем этой информации? Тот, кто первично заводит данные во фронтовую информационную систему? Или тот, кто занимается оформлением выдачи продукта клиенту? Работник операционной вертикали? Или клиентский менеджер?  Кто отвечает за полноту данных, за качество их заведения в информационные системы? Кто определяет критерии необходимой глубины хранения? Все эти вопросы возникают при определении понятия «владелец» каждого атрибута бизнес-модели данных банка (при том что таких атрибутов на текущий момент более двух тысяч). 
И это только 40% проделанной работы по унификации и систематизации данных бизнес-глоссария. 

NBJ: Каков объем КХД в Росбанке и допускается ли его ­масштабирование?

С. БОВА:  Общий объем базы данных КХД составляет порядка 40 терабайт. Ежеквартальный прирост данных в результате операционной деятельности варьируется от 5 до 7 терабайт. С учетом такой динамики роста, естественно, в проекте КХД была разработана и внедрена архитектура инфраструктуры, предполагающая возможности горизонтального масштабирования. При этом речь идет как о масштабировании производственных мощностей, так и о наращении объемов системы хранения. 

NBJ: Сотрудники каких подразделений обращаются к аналитической отчетности КХД наиболее часто, в каких сферах ее применение может быть наиболее эффективным и почему?

С. БОВА: Наибольшее количество пользователей отчетности, построенной на базе КХД, – это сотрудники финансового департамента, департамента рисков, операционной вертикали и розничного бизнеса. Большая часть функциональности, реализованной в хранилище на текущий момент, используется для целей управленческой отчетности, отчетности по стандартам IFRS, отчетности для группы Societe Generale. 

Тем не менее КХД не ограничивается только лишь функцией расчета и предоставления отчетности – хранилище готовит и является поставщиком данных для систем оценки рисков по заемщикам при выдаче кредитов, для целей collection, для повышения эффективности работы контакт-центра и других бизнес-критичных приложений. 

В текущих условиях рынка очень важно иметь возможность быстро получать и анализировать максимальный объем данных по клиентам, истории их взаимодействия с банком, уровню качества клиентского портфеля. 

Также сейчас регуляторные органы (ЦБ РФ, ФССП, ФНС и др.) делают акцент на все большей детализации в требованиях предоставления отчетных данных банка. Подобные задачи в многофилиальном банке, имеющем большое количество информационных фронт-офисных и бэк-офисных учетных систем, под силу решать, только имея централизованное корпоративное хранилище данных. 

NBJ: Какие новые проекты сейчас внедряются в Росбанке? Не могли бы вы рассказать о проектах по внедрению CRM-системы?

С. БОВА:  Любой новый проект по внедрению информационной системы изначально зарождается из бизнес-инициатив. Именно бизнес диктует новые направления для развития, устанавливает новые планки показателей роста, повышения эффективности банка. На основании заданного бизнесом направления подразделение ИТ уже вырабатывает оптимальное технологическое решение для достижения поставленной стратегической цели. 

Одним из таких стратегических проектов банка является построение нового комплекса систем обслуживания клиентов, начиная от системы взаимоотно­шений с клиентами, модернизации контакт­­-центра, фронт-офисной системы, ­системы автоматизации проведения марке­тинговых кампаний и заканчивая системой принятия решений по выдаче продуктов. Внедрение данного комплекса систем позволит повысить уровень обслуживания розничных клиентов, увеличить скорость принятия решений и скорость оформления выдачи клиенту продуктов банка.  

Поделиться:
 

Возврат к списку