كل ما تريد معرفته عن علم البيانات Data Science

مفهوم – علم البيانات Data Science هو العلم الذي يتعامل مع كافة أشكال البيانات بداية من جمعها وتنسيقها وحتى تحليلها واستعراضها واستخراج المؤشرات الهامة منها، فهو العلم الذي يجمع بين مجالات علوم الحاسوب المختلفة، وعلم الإحصاء، بجانب عدد آخر من العلوم الحديثة الهامة.

علم البيانات هو الأساس الذي تقوم عليه العديد من التخصصات الشهيرة اليوم، مثل تعلم الآلة Machine learning، والتعلم العميق Deep Learning، بالإضافة إلى البيانات الضخمة Big Data، ولذا يعد من أكثر التخصصات المطلوبة في سوق العمل في القرن الحادي والعشرين.

وبالرغم من أن علم البيانات شيء يحتاجه ويمارسه البشر منذ قديم الزمان، إلا أن المصطلح “Data Science” لم يكتسب كل هذا الزخم إلا في العقود الأخيرة خاصة بعد اقتحام الإنترنت كل مجالات حياتنا، وما نتج عنه من كم ضخم من البيانات يقُدر بأضعاف أضعاف ما أنتجته البشرية طيلة وجودها.

يختص علم البيانات بعدد من العمليات الضرورية، والتي من الممكن اختصارها بأنها طرح سؤال ومن ثم الإجابة عليه، ولكن بشكل أكثر تعقيدًا حيث قد يكون هدف السؤال هو التنبؤ بظاهرة معينة، أو تصنيف بعض المعطيات، أو تحديد نمط ما في البيانات، أو توليد توصيات قبل القيام بخطوة مهمة، أو حتى لأغراض الحفاظ والتحكم بالجودة.

والأمثلة على هذه كثيرة للغاية مثل: توقع عدد مشترين سيارات هيونداي في شهر أبريل 2021، أو معرفة ما يطلبه المشترين من أمازون من الثلاجات، أو قياس سرعة بعض الخوارزميات الخاصة بتوقع الطقس، وغيرها من التطبيقات الكثيرة التي تشمل كل شيء تقريبًا في حياتنا.

يتم ذلك من خلال عدة مراحل تُعرف برحلة عالم البيانات.

رحلة علم البيانات Data Science

1. فهم المشكلة وسؤال الأسئلة الصحيحة

في البداية يقوم عالم البيانات بدراسة وفهم المشكلة ليقوم بطرح عدد من الأسئلة المحورية حول هذه المشكلة، والتي تؤثر تأثيرات كبرى عليها وتتحكم في الظاهرة محل الدراسة.

2. جمع البيانات المرتبطة بهذا السؤال

في الخطوة التالية يقوم عالم البيانات بجمع كافة البيانات الممكنة للإجابة على هذا السؤال من المصادر المختلفة، مثل قواعد البيانات، سيرفرات الإنترنت، استبيانات أو استطلاعات رأي يجريها وغيرها من المصادر.

3. تجهيز البيانات وتحليلها

لتأتي بعد ذلك أصعب مرحلة في الأمر وهي مرحلة تجهيز وإعداد البيانات، حيث يقوم عالم البيانات بتنظيف البيانات وإزالة أو تصحيح أي بيانات قد تؤثر بالسلب على صحة نتائجه، ومن ثم يجمع البيانات المتبقية وينظمها في شكل عملي يمكن استخدامه في إجابة سؤاله.

كما يقوم عالم البيانات بفهم ما بيده وتحديد المفاتيح الرئيسية للبيانات، والمتغيرات الأهم التي ستكون مفتاح الإجابة على سؤاله، ليختار أفضل نموذج لتحليل البيانات.

4. تحليل البيانات واستخدام النتائج للإجابة على سؤاله

وها قد شارف عالم البيانات على الانتهاء من بحثه المضني، وسوف يجد أخيرًا الإجابة على أسئلته، ولكن تبقى عليه أن يحلل البيانات، ويقرأ النتائج لكي يسرد منها قصته، ويجاوب على السؤال الذي طرحه في البداية بنجاح.

اقرأ ايضًا:

علم البيانات Data Science

فكر فقط في كمية الأسئلة التي سيجيبها لنا علم البيانات، وتخيل ما الذي بإمكاننا فعله بكل تلك الأجوبة؟ حسنًا، لا تتعب نفسك كثيرًا في التفكير، فقط انظر حولك وتأمل كيف تصير الحياة أكثر بساطة ورفاهية بدءًا من اقتراحات نتفليكس الرائعة، وحتى تطور النظام الطبي في العالم، والحد من أخطار انتشار جائحة الكوفيد-19.

فعلم البيانات لا يختص فقط بالأمور الترفيهية والصناعية، بل هو عامل فعال من عوامل التقدم الطبي حول العالم، وهذا من خلال تطبيق سحره على البيانات الحيوية أو الطبية فيما يعرف بالمعلوماتية الحيوية أو الطبية.

فلولا معرفة البشرية بعلم البيانات لم نكن لنصبح قادرين على احتواء فيروس كورونا، ولا قادرين على الحد من أعداد مرضى السرطان في العالم.

ولكن عزيزي القارئ لا تعتقد أن علم البيانات مُستخدم في هذه المجالات فقط، بل هو مستخدم في كافة المجالات تقريبًا، فأي مجال أو صناعة مهما كانت تحتاج أو تستخدم البيانات بداية بالعلوم الإنسانية، وحتى صناعة الصواريخ مرورًا بكل شيء بإمكانك أو بإمكاني أن أتصوره أو أجهل حتى وجوده.

وظيفة عالم البيانات

بحسب الكثير من الإحصائيات فإن متخصصين علم البيانات هم أكثر الناس المطلوبين في العالم، ليس للعدالة بالطبع، ولكن لسوق العمل، فقد ظل تخصص علم البيانات هو التخصص الأكثر طلبًا على مر الأعوام السابقة حيث إن الطلب أكثر بكثير من العرض.

ولذا فإن رواتب علماء البيانات مرتفعة للغاية، حيث يبلغ متوسط راتب متخصصين علم البيانات في الولايات المتحدة يبلغ 113 ألف دولار سنويًا بحسب موقع Glassdoor الغني عن التعريف.

وإذا تحدثنا بالأرقام فإنه في العام 2020 كان هناك عجز في الولايات الأمريكية المتحدة فقط بحوالي 250,000 متخصص في علم البيانات، بينما يزداد سوق العمل بمعدلات جنونية وصلت إلى 39% في العام 2019، وارتفاع الراتب 14% في 2020 بسبب الحاجة إلى المزيد من متخصصين علم البيانات.

وإذا لم يكفيك هذا فإن المؤشرات تقول بأنه سيكون هناك عجز بالملايين في العقود القليلة القادمة.

قد تستعجب من هذه الأرقام والزيادات الجنونية في الراتب والطلب، بينما يعاني العالم من مشاكل اقتصادية كبيرة، ولك كل الحق في ذلك، ولكن علم البيانات وسائر التخصصات التكنولوجية الحديثة نسبيًا هي التي تقوم بتسيير العالم الآن والتحكم فيه وتغييره، ولذا مهما حدث فسنظل نحتاج إلى مهاراتهم وقدراتهم الخارقة مع التكنولوجيا.

أما في عالمنا العربي فهناك طلب أيضًا على المتخصصين في علوم البيانات، ولكنه ليس شديدًا مثل الولايات المتحدة ودول العالم المتقدم.

ولكن يتوقع الخبراء أنه في الأعوام القادمة سوف يزيد عدد الوظائف المعروضة، ولكن يمكنك في أي وقت أن تعمل من خلال منصات العمل الحر على مشاريع تتعلق بعلم البيانات وتعلم الآلة.

حيث يبلغ متوسط سعر الساعة لمتخصصين علم البيانات على منصة Upwork في العام 2019 حوالي 36 إلى 200 دولار في الساعة الواحدة حسب درجة المهارة والخبرة.

أهمبة علم البيانات Data Science

نشرت مجلة هارفارد بزنس ريفيو في أكتوبر 2012 مقالة بعنوان “عالم البيانات: الوظيفة الأكثر إثارة في القرن الواحد والعشرين” لتسجل بداية الثورة الصناعية الرابعة التي تُعرف عالميًا باسم “ثورة البيانات”.

والتي يقودها المبرمجين وعلماء البيانات ومطوري الذكاء الاصطناعي الذين يقومون بتغيير عالمنا بسرعة جنونية من خلال جعلنا نولد كم هائل من البيانات ليحللوها ويدرسوها جيدًا.

لعلك لا تتخيل كم البيانات التي ننتجها لن أقول لك في اليوم، بل في الدقيقة الواحدة:

يتم ارسال 41,666,667 رسالة من خلال تطبيق واتساب.
ينشر 147,000 صورة على فيسبوك.
يتم مشاهدة 404,444 ساعة من الأفلام والمسلسلات على منصة نتفليكس.
يتم شحن 6,659 طرد من خلال أمازون.

وغيرها من البيانات التي لا يستطيع العقل البشري حتى أن يتصورها أو يتخيل حجمها.

وتُستخدم هذه البيانات لفهم سلوكنا ودراستنا وتوقع أفعالنا بعد ذلك من قبل شركات التكنولوجيا الكبرى، هذا غير أنها تساعد الشركات أيضًا على اتخاذ القرارات والتنبؤ بالمستقبل وتقليل المخاطر، وفي بعض الأحيان يتم استخدامها كمصدر للأموال من خلال بيعها.

شاركها

اترك تعليقاً