كل ما تحتاج معرفته عن البيانات الضخمة Big Data

مفهوم – البيانات الضخمة Big Data ربما من إسمها تتضح طبيعة هذه البيانات، فهي مجموعة بيانات تستعصي لضخامتها أو تعقيدها على التخزين أو المعالجة بإحدى الأدوات أو التطبيقات المعتادة لإدارة البيانات.

ويعتبر مصطلح البيانات الضخمة Big Data أحد أهم المصطلحات التقنية التي ظهرت بشكل كبير في الآونة الأخيرة، ليس هذا وحسب بل حاليًا تعتبر أحد أهم مجالات العمل في السوق العالمية.

سنتعرف على البيانات الضخمة، وما هو الهدف منها، بالإضافة إلى فوائد البيانات الضخمة التي تجعلها بهذه الأهمية.

كل ما تحتاج معرفته عن البيانات الضخمة Big Data

البيانات الضخمة هي جزءٌ من البيانات الكلية؛ وبالتالي يجب علينا أن نُعرّف أولًا ما هي البيانات؟

البيانات هي المادة الخام للمعلومات. وهي عبارة عن سلسلة من الحقائق التي يتم جمعها بعدة طرق مثل الملاحظة والبحث، هذه الحقائق تكون بشكل كبير غير مترابطة “غير مهيكلة” ولا يمكن من خلال صورتها الأولية الاستدلال على معلومة مؤكدة قبل إجراء مجموعة من العمليات التحليلية على تلك البيانات.

كلما تطورت المعرفة البشرية وازدادت أعداد البشر زاد حجم البيانات التي يتم إنتاجها بشكل يومي، وهناك نسبة متعارف عليها أن حجم البيانات التي يتم معالجتها يمثل 10% فقط من إجمالي البيانات التي يتم إنتاجها، وهذا يرجع إلى عدم كفاءة التقنيات التحليلة مقارنة بمقدار البيانات المتاحة، لذلك كانت هناك حاجة إلى ظهور علم البيانات الضخمة.

تعريف البيانات الضخمة Big Data

البيانات الضخمة: مجموعة البيانات التي يفوق حجمها قدرة أي نظم قواعد بيانات على إجراء العمليات المعتادة عليها من تسجيل ونقل وتحليل وتخزين بحيث يمكن تحويلها إلى معلومات يمكن الاستفادة منها.

وبالتالي؛ أدت ضخامة هذه البيانات وتدفقها اللامنقطع إلى ظهور علم كامل يستخدم أدوات فريدة لم تكن موجودة من قبل حتى يصبح بالإمكان الاستفادة من هذه البيانات. فالحواسيب العادية التي نمتلكها يمكن أن تقوم بهيكلة ومعالجة البيانات الخاصة بنا والتي تعتبر ضخمة بالنسبة إلينا، مثلًا إذا كنت تمتلك هارد ديسك سعته 1 أو 2 تيرابايت فقد تعتقد أنك تمتلك حجم كبير من البيانات، لكن ماذا إذا قمنا بقمارنة بياناتك بجزءٍ بسيط من البيانات التي ينتجها موقعٌ واحدٌ فقط من وهو موقع Facebook والذي يضاف إليه أكثر من 300 مليون صورة يوميًا!

حجم البيانات الضخمة Big Data

دعونا نلقي نظرة أولًا على بعض الإحصائيات التي أوردها موقع Forbes حول البيانات التي ينتجها البشر والتي يمكن وصفها بالضخمة، وبعد ذلك سوف نتعرف على أهمية هذه البيانات وكيف يتم الاستفادة منها:

يرسل البشر 16 مليون رسالة نصية بشكل يومي
يتم عمل 5 مليار علمية بحث على الإنترنت كل يوم
يرسل البشر 156 مليون بريد إلكتروني بشكل يومي
يقدر عدد الصور التي التقطها البشر بأكثر من 5 ترليون صورة
هناك 95 مليون صورة وفيديو يتم رفعهم إلى موقع إنستجرام يوميًا
في عام 2020م سيكون حجم البيانات المولدة 44 زيتابايت “44 ترليون جيجابايت”
بحلول عام 2020م؛ سينتج كل شخص 1.7 ميجابايت من البيانات في الثانية الواحدة
حجم البيانات التي تُولّد يوميًا 2.5 2.5 كوينتيليون بايت “1 كوينتيليون = 1+18 صفر”

– حسنًا؛ شاهدنا نبذة بسيطة من كمية البيانات المولّدة بشكل يومي، فهل يمكن أن يتم معالجة هذه البيانات بتقنيات التحليل والإحصاء المستخدمة للتعامل مع بيانات شركة مقاولات صغيرة أو شركة تسويق أو غيرها؟ بالطبع لا.

اقرأ ايضًا:

خصائص البيانات الضخمة Big Data Characteristics

– هناك مجموعة من الخصائص التي تُميز هذا النوع من البيانات والتي تجعل وصفه بالضخم في محله، كما أن هذه الخصائص تميزها عن غيرها من البيانات، وتجعل من طرق التعامل مع هذه البيانات من حيث الجمع والمعالجة والتخزين تختلف بشكل كبير عن غيرها.. إليكم أهم هذه الخصائص.

الضخامة Volume

– السمة الأولى بالتأكيد لهذا النوع من البيانات هو الضخامة أو كبر الحجم بحيث يتم قياس هذه البيانات عبر أكبر وحدات تخزين البيانات، والتي رأينا بعضًا منا في الفقرة السابقة. ويعبر عنها بحجم البيانات التي يتم توليدها وتخزينها، حيث يعتبر هذا المقياس الرئيسي في ما إذا كان يمكن اعتبار هذه البيانات ضخمة أم لا.

السرعة Velocity

– أيضًا السرعة التي يتم توليد البيانات بها تعتبر من الخصائص التي يتم الاحتكام إليها لاعتبار أو عدم اعتبار مجموعة بيانات على أنها بيانات ضخمة، فيجب أن تتسم البيانات بمعدل سرعة وتغير عاليين حتى يمكن تصنيفها ضمن هذا النوع. وتشير خاصية السرعة أيضًا إلى ضرورة سرعة معالجة هذا البيانات وإلا سوف تفقد قيمتها.

التنوع Variety

– خاصية التنوع تشير إلى تعدد أنواع البيانات التي يتم جمعها، حيث تمثل أهم أنواع هذه البيانات النصوص، الصور، المواد الصوتية، مقاطع الفيديو. وقد يتم دمج هذه البيانات معًا لاستخلاص دلالات أكثر شمولية والعثور على أي معلومات مفقودة.

الجودة Veracity

– هذه الخاصية تشير إلى مدى جودة البيانات التي تم جمعها وقيمتها. بالنسبة للجودة فهي تعبر عن مدى الدقة في جمع البيانات والتي تؤثر بشكل كبير على جودة عمليات التحليل ودقة الاستنتاج النهائي. أما القيمة فهي تمثل القيمة المادية التي يمكن الحصول عليها من وراء هذه البيانات، فمثلًا البيانات المولدة عن رحلات الطيران لا تساوي في القيمة البيانات التي تجمعها المتاجر على الإنترنت مثل وولمارت وأمازون عن عملائها، فهذه البيانات الأخيرة تقدر بمليارات الدولارت.

لا شك أن مجال البيانات الضخمة يعتبر من أهم المجالات في الوقت الحاضر وفي المستقبل بالتأكيد، وحاليًا يشهد هذا المجال عجزًا كبيرًا في عدد أخصائي البيانات Data Specialists، فهي من الوظائف المتوفرة بشكل كبير وبرواتب ضخمة.

أهداف البيانات الضخمة Big Data Benefits

أهداف البيانات الضخمة قد تتركز في الغالب على الاستخدام التجاري، فالشركات الكبرى على سبيل المثال والتي تمتلك مجموعة ضخمة من الموارد، عليها أن تقوم بتحليل بيانات السوق الذي تنافس فيه من أجل معرفة كيفية توظيف هذه الموارد توظيفًا صحيحًا يحقق لها أعلى عائد على الاستثمار، بالإضافة إلى إمكانيات اكتشاف الفرص المستقبلية التي قد تنقل الشركة إلى مصافّ الشركات في فترة وجيزة.

ولهذا كانت وظيفة محلل البيانات واحدة من أهم وظائف المستقبل والتي ستكون مطلوبة بشدة.

تساعد ايضًا هذه البيانات على فهم السلوك البشري والتوقع بردود فعله تجاه حدث معين، كذلك إمكانية قياس مستوى الرضا عن خدمة معينة من قِبل العملاء. لكن أبرز فائدة (من وجهة نظري) قد توفرها هذه البيانات هو إمكانية اكتشاف “الأنماط الخفية” أي سلوك مشترك بين مجموعة من البشر دون أن يكون لديهم وعي بذلك أو تكون هناك معلومة متوفرة حول وجودة مثل هذه الأنماط، وبالتالي يمكن الاعتماد على ذلك في توجيه هذه الفئة إلى القيام بسلوك معين.

اقرأ ايضًا:

استخدام البيانات الضخمة Big Data Use Cases

من الفوائد التي ذكرناها يمكننا إيجاد مئات الاستخدامات التي تعتمد على هذه البيانات، أغلب هذه الاستخدامات كما ذكرنا ترتكز على غرض تجاري من خلال تحليل سلوك العملاء، ولهذا تقوم كبرى الشركات العالمية بالاستثمار من أجل الحصول على أبحاث في البيانات الضخمة متعلقة مجالها، لكن ذلك لا يعني عدم وجود استخدامات غير تجارية. سنتعرف على نماذج من هذه الاستخدامات لنرى مدى التأثير التي تمتلكه هذه البيانات.

التجارة الإلكترونية E-Commerce

– المتاجر الكبرى على الإنترنت على تحليل البيانات التي يتم جمعها من عملائهم من حيث طبيعة التصفح وسلوك الشراء مرتبطًا بالجنس والسن والجنسية وما إلى ذلك، تحليل هذه البيانات يجعل هذه المتاجر تفهم بدرجة أكبر سلوك وتوجه العميل، وبالتالي بعد تطبيق بعض التحسينات بناءً يكون رد العميل بالشراء بشكل أكبر وبالتالي ربح أكبر للمتاجر، وهناك مثال معروف على ذلك وهو ما قامت به سلسلة متاجر Walmart بعدما قامت بتحليل لسلوك عملائها ونجحت في زيادة مبيعاتها بنسبة 15%.

الخدمات الإعلانية Advertising Services

بالتأكيد قد تكون قد تعرضت من قبل لأحد المواقف حين تبحث عن شيء في جوجل أو تضغط رابط لمنتج معين تفكر في شراءه ثم تجد إعلان على فيسبوك لنفس المنتج! أو حتى حين تتصفح أحد المواقع العادية التي تستخدم إعلانات جوجل وتجد أن إعلان لنفس المنتج الذي كنت تبحث عنه ظهر لك! هذا أيضًا من تطبيقات البيانات الضخمة، حيث تقوم المواقع بتتبع سلوكك على الإنترنت ومعرفة ما تبحث عنه وتعرض لك ما ترغب في مشاهدته.

الانتخابات Elections

ذكرنا أن هذا المجال يُستخدم في تحليل السلوك البشري. أبرز الاستخدامات المعروفة لهذا الأمر يتمثل في الحملات الانتخابية، حيث يتم جمع البيانات التي يشاركها الناخبين مثل التغريدات والمنشورات ومقاطع الفيديو وغيرها من أجل فهم طبيعة توجههم وكيف يمكن للشخص المرشح أن يُخاطب أبرز الأمور التي يهتمون بها والتي تجعله مرشحهم المفضل. يعتبر باراك أوباما من أبرز الأمثلة على ذلك؛ حيث نجح في الفوز بفترة رئاسة ثانية من خلال الاعتماد على Big Data كما أورد تقرير جريدة الواشنطن بوست.

المجال الطبي Medical Field

نختم معكم بهذا المثال حول أهمية تحليل البيانات الضخمة ومدى مساهمتها في تقدم مستوى الخدمات الطبية. فمع انتشار الأجهزة الإلكترونية التي تستخدم في جمع المعلومات عن الحالة الصحية للبشر مثل أساور المعصم والساعات الذكية وغيرها؛ أصبح بإمكان المراكز البحثية من دراسة النشاط البدني للإنسان وربطه بجموعة من الأمراض التي قد تصيب الإنسان بناءً على سلوكيات وأنشطة خاطئة يقوم بها، وهذا نراه في الدراسات التي تنشر حول بعض السلوكيات وأضرارها مثل الدراسة الحديثة التي تم نشرها حول وجود ارتباط بين شرب المشروبات الساخنة جدًا وبين الإصابة بسرطان المريء.

شاركها

اترك تعليقاً