تغییر جهان با تحلیل بزرگ دادهها
عصر بانک؛بزرگداده (big Data) عبارتی است که مدتهاست درباره آن میشنویم، اما هنوز ابهاماتی در رابطه با ماهیت این بزرگدادهها وجود دارند. در حقیقت، بزرگدادهها نیروی محرکه اصلی در ظهور تکنولوژیهای جدید از جمله هوش مصنوعی، علم دیتا و اینترنت اشیا (IoT) در عصر دگرگونی دیجیتالی هستند. با درنظر گرفتن این تعاریف، ما نیز تصمیم به انتشار تعریفی جامع و ابتدایی از ماهیت بزرگدادهها در سال 2017 گرفتیم. همانند گذشته، این آموزش نیز بهصورت کاملا جامع و با قصد توصیف مفاهیم اصولی بدون توجه به دانش قبلی خوانندگان درباره بزرگدادهها تهیه و تنظیم شده است. همه چیز با آغاز عصر دادهها و تحول عظیم در حجم دادههای تولیدی آغاز شد. این گسترش حجم دادهها به علت توسعه کامپیوترها، اینترنت و تکنولوژی که قادر است اطلاعات را از دنیای واقعی و فیزیکی دریافت و آنها را به دادههای دیجیتال تبدیل کند، بهوجود آمد.
امروزه، هر بار که آنلاین میشویم، هربار که گوشیهای هوشمند مجهز به GPS را با خودمان حمل میکنیم، هربار که از طریق رسانههای اجتماعی و اپلیکیشنهای چت با دوستانمان ارتباط برقرار میکنیم و حتی زمانی که خرید میکنیم، در اصل دیتای جدید تولید میکنیم. بهتر است بگوییم هر عملی که شامل انجام فعالیتهای دیجیتالی شود، ردپای دیجیتالی کاربر را در آنجا بر جای خواهد گذاشت. موضوع مهمتر مقدار دادههای تولید شده از سوی ماشینها است که با سرعت بسیار زیاد در حال افزایش است. زمانی که تجهیزات هوشمند منازل با یکدیگر یا با سرور مرکزی منزل ارتباط برقرار میکنند، دادهها تولید و به اشتراک گذاشته میشود. در سراسر دنیا، هر روز تعداد بیشتری از ماشینآلات صنعتی کارخانهها به سنسورهایی که دادهها را مخابره میکنند، مجهز میشوند. به زودی نیز خودروهای بدون راننده به خیابانها میآیند و به سرعت نقشه چهاربعدی فضای اطراف خودرو را به سرورهای مرکزی انتقال خواهند داد.
وظیفه بزرگدادهها چیست؟
اطلاعات روزافزون بهدست آمده از سنسورها، تصاویر، متن، اطلاعات صوتی و ویدئویی، همگی تشکیلدهنده بزرگدادههایی هستند که امروزه میتوانیم از آنها به روشهایی که چند سال پیش غیرممکن بود، استفاده کنیم. در حال حاضر، پروژههای مرتبط با تحلیل بزرگدادهها در بخشهای زیر در حال کمکرسانی هستند.
درمان بیماریها و جلوگیری از سرطان: داروهای داده محور (Data-Driven) شامل تحلیل حجم گستردهای از سوابق دارویی برای یافتن الگوهای با قابلیت کمک به دانشمندان برای شناسایی بیماریها در مراحل ابتدایی و تولید داروهای جدید میشود.
غذارسانی به گرسنگان: به لطف دادهها، کشاورزی در حال متحول شدن است و به زودی با استفاده از بزرگدادهها میتوان تولید محصولات را به حداکثر و حجم آلایندههای ورودی به محیط زیست را به حداقل رساند و استفاده از ماشینها و ابزارآلات را بهینهسازی کرد.
جستوجوی سیارههای دوردست: ناسا با آنالیز میلیونها داده از آنها برای مدلسازی تمامی امکانات ممکن برای فرود مریخنوردهای خود روی این سیاره و برنامهریزی جهت انجام ماموریتهای آینده استفاده میکند.
پیشبینی و مقابله با بلایای طبیعی و انسانی: با تحلیل دادههای به دست آمده از سنسورها میتوان محل احتمالی زمینلرزههای بعدی را پیشبینی و با آنالیز الگوهای رفتاری انسانها میتوان به سرنخهایی که قادر است به سازمانها برای نجات جان افراد و کمکرسانی بیشتر به بازماندگان کمک کنند، دست پیدا کرد. همچنین با بهکارگیری تکنولوژی تحلیل بزرگدادهها میتوان برای حفاظت از جان مهاجران در مناطق جنگی سراسر دنیا استفاده کرد.
جلوگیری از وقوع جرم: نیروهای پلیس بر اساس استراتژیهای برگرفته شده از دادههای قبلی و مجموعه دادههای عمومی، قادر خواهند بود نیروهای خود را موثرتر وارد عملیات کرده و در مواقع ضروری با بازدارندگی بیشتری در مقابل مجرمان وارد عمل شوند. همچنین به لطف وجود بزرگدادهها، امکان خرید آنلاین، انتخاب بهترین وسیله و مکان برای سفر، انتخاب بهترین زمان برای رزرو بلیت هواپیما و تصمیمگیری برای انتخاب فیلم مناسب برای تماشا در سینما و در کل زندگی به شکل ساده و راحتتر امکانپذیر شده است. قاعده اصلی بزرگدادهها به این شکل است که هرچه بیشتر درمورد یک مساله یا یک موقعیت اطلاعات بهدست بیاورید، بینش درونی شما نسبت به آن بیشتر و پیشبینیهای شما درباره اتفاقات بعدی با اطمینان بیشتری حاصل میشود.
با مقایسه دادهها، روابطی که در گذشته غیرقابل تشخیص بود کمکم آشکار میشوند و در ادامه، این روابط درک و آگاهی ما از تصمیمات آینده را برایمان امکان پذیر خواهند کرد. عموما، این نتایج از طریق مدلسازی بر اساس دادههای جمعآوری شده، انجام مراحل شبیهسازی، محاسبه مقدار دادهها در هر مرحله و بررسی تاثیر آنها روی نتایج کسب شده، بهدست میآیند. امروزه این مراحل بهصورت اتوماتیک و از طریق تکنولوژیهای تحلیلی پیشرفته انجام میگیرد که قادرند شبیهسازی را میلیونهابار بهصورت مکرر انجام دهند و تمامی متغیرها را تا زمانی که به یک الگوی قابلفهم دست پیدا کنند، جابهجا کنند و از این طریق مساله مورد نظر را در مدت کوتاهی حل کنند.
هرروز، دادهها به شکل سازماندهی نشده وارد زندگیمان میشوند. منظور از سازماندهی نشده این است که نمیتوان آنها را به راحتی در جدولهای دستهبندی شده قرار داد. بخش اعظم این دادهها به شکل تصاویر و ویدئوهایی هستند که از تصاویر بهدست آمده از ماهوارهها گرفته تا عکسهای آپلود شده در فیسبوک و توییتر را تشکیل میدهند. ایمیلها، پیامهای متنی اپیلیکیشنهای پیامرسان و مکالمات تلفنی ضبط شده نیز بخش دیگر این دادهها را تشکیل میدهند. برای درک تمامی این دادهها، پروژههای تحلیلی بزرگدادهها با استفاده از بهروزترین تکنولوژیهای تحلیل اطلاعات از جمله هوش مصنوعی و یادگیری ماشینی انجام میشوند. با آموزش کامپیوترها به منظور درک این دادهها از طریق تشخیص تصاویر و پردازش به زبان طبیعی، کامپیوترها میتوانند الگوها را با سرعت و اطمینان بیشتری نسبت به انسانها تشخیص دهند.
روند پیشگرفته شده در چند سال اخیر موجب پیشرفتهای چشمگیری در این زمینه و ارائه ابزارهای تحلیل بزرگدادهها بهعنوان پلتفرمی برای خدمترسانی شده است. سازمانها و شرکتها فضای سرور، سیستمهای نرمافزاری و پردازشگرها را از ارائهدهندگان سرویسهای کلود اجاره میکنند. تمامی مراحل تحلیل دادهها از طریق سیستمهای شرکت ارائهدهنده این سرویسها انجام میشود و مشتریان تنها هزینه انجام آن را پرداخت میکنند. این نوع همکاریها، تحلیل و تبدیل بزرگدادهها را برای تمامی سازمانها ممکن ساخته و از صرف هزینههای هنگفت برای خرید سختافزار، نرمافزار و استخدام کارکنان تخصصی جدید جلوگیری میکند.
نگرانیها درباره بزرگدادهها
امروزه، بزرگدادهها بینش و فرصتهای بیسابقهای را در اختیارمان قرار میدهند اما در این میان سوالات و نگرانیهایی وجود دارند که باید به آنها اشاره کرد.
حریم خصوصی دادهها: بزرگدادههایی که امروزه تولید میکنیم حاوی حجم زیادی از اطلاعات زندگی شخصی افراد که باید در حریم خصوصی محافظت شوند، هستند. در حال حاضر هم اطلاعات خصوصی افراد را فاش میکنیم و هم از فضای راحتی که برنامهها و سرویسهای مرتبط با بزرگدادهها فراهم کردهاند استفاده میکنیم. حقیقتا چه کسی اجازه دسترسی به این اطلاعات را دارد؟
امنیت دادهها: حتی اگر با بهکارگیری اطلاعاتمان برای مقاصد بهخصوص مشکلی نداشته باشیم، آیا حفظ این اطلاعات توسط افراد تضمین میشود؟ آیا قوانین و مقررات مرتبط با حفظ اطلاعات خصوصی برای این مقیاس از دادهها نیز کاربرد دارند؟
تبعیض اطلاعاتی: زمانی که همهچیز مشخص شد، آیا تبعیض قائل شدن برای برخی افراد بر اساس اطلاعاتی که از زندگی شخصی آنها به دست آوردهایم قابل قبول خواهد بود؟ در حال حاضر، بانکها بر اساس ردهبندی اعتبار افراد، تصمیم میگیرند که به چه افرادی وام اعطا کنند و سازمانهای بیمه نیز شدیدا به دادهها اتکا کردهاند. باید انتظار داشته باشیم که اطلاعات با جزئیات گستردهتری ارزیابی و تحلیل شوند و از اینکه در اختیار داشتن اطلاعات فردی موجب سختتر شدن معیشت افرادی که از منابع و دسترسی به اطلاعات محدودتری برخوردارند نمیشود، اطمینان حاصل کنیم.
مواجهه با چنین چالشهایی، بخشی از مشکلات بزرگدادهها محسوب میشوند. بدون شک اختلافات گستردهای بین دانشمندان و متفکران دانشگاهها وجود دارد و افرادی که قصد استفاده از بزرگدادهها را دارند، باید از مخاطرات و ایرادات این کار از سوی این افراد باخبر شوند. در غیر این صورت، کسبوکارها با صدمات جدی روبهرو شده و در ادامه بحرانهای مالی و جریمههای سنگین را به همراه خواهد داشت. اوایل که افراد درباره بزرگدادهها صحبت میکردند، بسیاری آن را تکنولوژی زودگذری میدانستند که قرار است تنها برای مدتی کوتاه مورد توجه قرار بگیرد و زمانی که تکنولوژی جدیدتری ظهور کند، بزرگدادهها نیز فراموش میشوند. اما تا به امروز چنین اتفاقی نیفتاده است و در حقیقت، با ظهور تکنولوژیهای جدید، میبینیم که نیروی محرکه اصلی تمامی آنها بزرگدادهها هستند. در آینده نزدیک، مقدار دادههای در اختیار ما گسترش پیدا میکنند و تکنولوژیهای تحلیل دادهها نیز پیشرفتهتر میشوند. پس اگر بزرگدادهها امروزه قادر به انجام چنین کارهای بزرگی هستند، تصور کنید در آینده قادر به انجام چه کارهای بزرگتری خواهند بود.
/دنیای اقتصاد