نقش «بیگ دیتا» در تحول دیجیتال بانک ملی
بانک ملی یکی از بزرگترین بانکهای دولتی ایرانی است. بر اساس اطلاعات سایت بانک ملی، در حال حاضر این بانک با بیش از 2657 شعبه فعال در داخل کشور، 14 شعبه فعال و 4 سابسیدری در خارج کشورو 178 باجه و 36 هزار کارمند فعال مشغول به کار است.
همچنین اطلاعات سایت بانک ملی نشان می دهد تعداد مشتریان بانک ملی ایران از 78 میلیون نفر عبور کرده و تعداد حسابها چندین برابر این تعداد است.اما این حجم از مشتریان و حساب را چگونه میتوان مدیریت و از دیتای آن بهرهبرداری کرد؟ از طریق فناوری های بیگ دیتا؛
ما در عصربانک برای آشنایی بیشتر با اقدامات و خدمات بانک ملی در حوزه بیگ دیتا با احمد حاجی تراب، مدیر بیگ دیتا و خدمات داده شرکت دادهورزی سداد به عنوان هلدینگ فناوری اطلاعات این بانک گفتوگویی انجام دادیم.
«احمد حاجیتراب» دارای مدرک کارشناسی مهندسی نرمافزار از دانشگاه خواجه نصیر طوسی و کارشناسی ارشد مهندسیIT از دانشگاه صنعتی امیرکبیر است و در حالحاضر مشغول به تحصیل در مقطع دکتری هوش مصنوعی دانشگاه تهران نیز میباشد. وی از سال 1396 در حوزه بیگ دیتا در شرکت سداد مشغول به فعالیت است.
«بیگ دیتا» در ایران فاصله زیادی با کشورهای پیشرو دارد
حاجیتراب در ابتدای گفتگو به نوپابودن «بیگ دیتا» در کشور اشاره کرد و گفت: بیگ دیتا در ایران از نظر سطح تخصص و پروژهها بسیار عقبتر از سطح جهانی است که یکی از موانع مهم، تامین زیرساختها و نگرش مدیریت ها و رویکرد ها است.
وی افزود: بیگ دیتا فقط برای شرکتهای بزرگ که سیستمهای معمولی پاسخگوی خدمات آنها نیست کاربرد دارد و باید از نظر حجم دیتا، پردازش دیتا و… این ضرورت احساس شود.
مدیر بیگ دیتا دادهورزی سداد اظهار داشت: از سال 96 در حوزه بیگ دیتا بررسی سامانههای بانکی و پروژههای قابلارائه در سداد بهمنظور ارزیابی خدمات و ارزش افزوده بانک ملی در دستور کار قرار گرفت.
وی خاطرنشان کرد: اولین پروژه سداد و بانک ملی، پروژه دریاچه داده یا همان DATA LAKE بود که از لحاظ مدیریت دادهها و دستهبندی و پردازش دادهها با مدلهای سنتی تفاوت بسیاری دارد.
حاجیتراب ادامه داد: در سیستمهای قبلی، دیتا باید حتما در جداول «دیتابیس» ذخیره شود اما در دیتا لیک نوع دیتا و ساختار آن مهم نیست و میتوان در سطوح مختلف فایل و… فعالیت داشت و در واقع نیازی به بارگذاری دیتا نیست.
شکل خطی پلتفرم «دیتا لیک» مهمترین قابلیت آن است
مدیر بیگ دیتا دادهورزی «سداد» به قابلیتهای این حوزه پرداخت و گفت: یکی از قابلیتهای مهم دیتا لیک پس از پیادهسازی آن، پلتفرم است که مدیریت رشد دیتا بهتر از مدلهای سنتی و در اصطلاح بهشکل خطی خواهدبود و از کل سیستم بهشکل یکپارچه استفاده میشود.
وی افزود: در شکل خطی، تعداد نودها میتواند تا چند هزار باشد و با کمبود نودها امکان پردازش و افزودن منبع وجود دارد که گرچه هر نود، سیستم عامل خود را دارد اما در مجموع یک سیستم هستند و افزایش مقیاس در دیتا لیک کاملا در برابر افزایش دیتا انعطافپذیر است.
حاجیتراب اظهار داشت: در دیتا لیک پروفایل دیتا میتواند پیادهسازی شود، دیتاها ماهیت داشتهباشد، دسترسی به دیتاها میتواند متمرکز شود، از افزونی دادهها جلوگیری شود و مدیریت دیتا متمرکز میشود.
وی ادامه داد: پس از دیتا لیک، در پروژههای بعد سرویسهای پردازشی موردتوجه شرکت سداد قرار گرفت. قابلیت اکوسیستم بیگ دیتا اینگونه است که پس از راهاندازی، بهصورت توسعه پذیر سرویس ذخیره سازی و پردازش بلادرنگ داده در اختیار کاربر قرار میگیرد که 5 اصل دارد.
مدیر بیگ دیتا دادهورزی سداد گفت: اصول پیاده سازی بیگ دیتا در برگیرنده پنج ویژگی حجم (Volume)، نرخ تولید بالا (Velocity)، تنوعپذیری (Variety)، ارزش افزوده (Value) و صحت (Veracity) در داده ها است و برای پیاده سازی پروژههای بزرگ با نیازمندی ها و تکنولوژی های متنوع در اکو سیستم بیگ دیتا نیاز به ترکیب حدود 30 سرویس ذخیره سازی و پردازشی مختلف می باشد و پیچیدگی این اکو سیستم زمانی است که این سرویس ها باید بصورت یکپارچه و مجتمع شده(integrated) بصورت همزمان و موازی در راستای پروژه های متفاوت مورد استفاده قرار گیرد.
جایگاه بانکداری دیجیتال بانک ملی بدون خدمات «سداد» در سطح فعلی نبود
حاجیتراب به نقش «سداد» در توسعه بانکداری دیجیتال بانک ملی اشاره کرد و گفت: اولین پروژه «سداد» برای بانک ملی مربوط به پروژههای تحلیل دادههای مشتریان در سامانه بام بود که پروژههای این سامانه شامل پردازش و تحلیل رفتار مالی مشتریان، خوشهبندی مشتریان، تسهیلات مبتنی بر تحلیل رفتار مالی مشتریان بانک، تشخیص سناریوهای پیچیده پولشویی، کشف تغییرات در نمودار تراکنش و اعلام هشدار، تخمین سودآوری در بانکداری خرد، استخراج الگوهای پرتکرار رفتار مشتریان را در برمیگیرد.
وی افزود: این پروژهها در سامانه بام پیادهسازی شده و بسیاری از آنها هماکنون اجرا میشود که بهعنوان مثال، روزانه برای خوشهبندی، رفتار چندین ماهه مشتری براساس الگوریتمهای مختلف روی دیتای بانک از جمله «بام» پردازش میشود و در نتیجه خروجی این تحلیل رتبهبندی ، تسهیلات و برچسبهای مختلف به کاربران اعطا یا سلب میشود.
مدیر بیگ دیتا دادهورزی «سداد» اظهار داشت: دستیابی به خوشهبندی مشتریان مستلزم این است که دیتا طی بازه زمانی مشخص روزانه بهروزرسانی شود و پردازش و تحلیل چندین ماهه این دادهها از سیستمهای غیر از اکوسیستم بیگ دیتا ممکن است تا چندین روز به طول بیانجامد و در این اکوسیستم تحلیل داده خیلی سریعتر و دقیقتر برای بانک ارائه میشود.
وی ادامه داد: حدود 12 پروژه مختلف در بستر بیگ دیتا وجود دارد که یکی از پروژهها مربوط به بام است و خود بام تعداد زیادی ریزپروژه دارد.
حاجیتراب حجم گسترده و نرخ رشد داده ها را در بیگ دیتا مهم دانست و گفت: گرچه آمار دیتاهای روزانه جزء موارد محرمانه است اما بهعنوان مثال برای شناخت حجم بالا و گسترده بیگ دیتا باید گفت که یک فایل از دیتا خام روزانه حدود 60 گیگ است و اینکه بصورت روزانه داده های چندین ماه را پردازش و تحلیل نمود نیازمند پیاده سازی اکوسیستم بیگ دیتا و تخصص کافی به آن است.
همچنین در خصوص پایداری و در دسترس پذیری و کیفیت سرویس دهی بیگ دیتا در سداد می توان به آپ تایم 1374 روزه اکو سیستم بیگ دیتا یعنی تقریبا حدود سه سال و اندی اشاره نمود و این نشانه موفقیت خدمات است.
وی تاکید کرد: در حال حاضر در صورت عدم استفاده از بیگ دیتا، بانک ها قادر به ارائه سرویس های تحلیلی نیستند زیرا حجم و سرعت رشد دیتا بهحدی زیاد است که نمیتوان با سیستمهای سنتی پردازش انجام داد و یکی از نقاط قوت سداد و به تبع آن بانک ملی این است که در زمان مناسبی این کار انجام شد و مدیران بخصوص جناب آقای مختاریان، معاون فناوری اطلاعات بانک ملی همراهی و حمایت مطلوبی در این زمینه داشتند.
شناسایی سناریوهای پولشویی مبتنی بر گراف دستاورد آتی شرکت «سداد» برای بانک ملی است
حاجیتراب خاطرنشان کرد: بیگ دیتا و خدمات داده در شرکت داده ورزی سداد در حالحاضر به ثبات مطلوب دست یافته و پروژههای آتی تا حدی زیادی در زمینه هوش مصنوعی خواهدبود.
وی ادامه داد: تشخیص و شناسایی سناریوهای پیچیده پولشویی مبتنی بر اَبَر گراف دستاورد آتی شرکت سداد است که برای بانک ملی محقق میشود و در این قابلیت، با پیمایش در ابر گرافهای مشتریان و تراکنشهای بانکی و تکنیک های هوش مصنوعی شناسایی سناریوهای پیچیده پولشویی میسر می گردد.
مدیر بیگ دیتا دادهورزی «سداد» اظهار داشت: بیگ دیتا همانند پازل بسیار بزرگی است که نیاز به بستر مناسب پیادهسازی و نگهداری سرویس و دستیابی و بهرهگیری از تخصصهای مختلف در زمینه operation و develop دارد و تجمیع این موارد ضروری خواهدبود و راهاندازی بیگ دیتا و فعالیت در حوزه علوم داده تنها با اطلاعات در خصوص هوش مصنوعی، و یا یک زبان برنامه نویسی مثل پایتون امکان پذیر نیست و این موارد تنها بخشی از پازل خواهند بود و نیاز به شناخت و بسترسازی همه ابعاد است که خوشبختانه در شرکت سداد این پیشرفت تا بخش قابلتوجهی ارتقا یافتهاست.