ما هي البيانات الضخمة Big Data ، ولماذا تعتبر مهمة ؟

ما هي البيانات الضخمة

ما هي البيانات الضخمة Big Data ، ولماذا تعتبر مهمة ؟ 





قد يكون مصطلح "البيانات الضخمة" موجودا منذ بعض الوقت الآن ، ولكن لا يزال هناك الكثير من الالتباس حول ما يعنيه في الواقع. في الحقيقة ، يتطور المفهوم باستمرار ويتم إعادة النظر فيه ، حيث يظل القوة الدافعة وراء العديد من موجات التحول الرقمي المستمرة ، بما في ذلك الذكاء الاصطناعي وعلوم البيانات وإنترنت الأشياء. ولكن ما هي البيانات الضخمة بالضبط وكيف تغير عالمنا؟


ما هي البيانات؟

الكميات أو الأحرف أو الرموز التي يتم تنفيذ العمليات عليها بواسطة الكمبيوتر ، والتي يمكن تخزينها ونقلها في شكل إشارات كهربائية وتسجيلها على وسائط تسجيل مغناطيسية أو بصرية أو ميكانيكية.


ما هي البيانات الضخمة؟

البيانات الضخمة هي مجموعة من البيانات الضخمة في الحجم ، لكنها تنمو بشكل كبير بمرور الوقت. إنها بيانات ذات حجم وتعقيد كبير جدًا بحيث لا يمكن لأي من أدوات إدارة البيانات التقليدية تخزينها أو معالجتها بكفاءة. البيانات الضخمة هي أيضًا بيانات ولكن بحجم ضخم.


أمثلة على البيانات الضخمة:

فيما يلي مثال عن البيانات الضخمة-

وسائل التواصل الاجتماعي:

  • تظهر الإحصائية أن 500 + تيرابايت من البيانات الجديدة يتم استيعابها في قواعد بيانات موقع التواصل الاجتماعي Facebook ، كل يوم. يتم إنشاء هذه البيانات بشكل أساسي من حيث تحميل الصور والفيديو ، وتبادل الرسائل ، ووضع التعليقات وما إلى ذلك. يمكن لمحرك نفاث واحد أن يولد 10 + تيرابايت من البيانات في 30 دقيقة من زمن الرحلة. مع وجود آلاف الرحلات الجوية يوميا ، يصل توليد البيانات إلى العديد من البيتابايت.

  • لدى WhatsApp أكثر من مليار مستخدم ، ويتم تبادل أكثر من 42 مليار رسالة وحوالي 1.6 مليار صورة يوميا.
  • يتعامل Facebook مع أكثر من 50 مليار صورة من مستخدميها.
  • تتعامل Google مع حوالي 100 مليار عملية بحث شهريا.


أهمية البيانات الضخمة؟

لا تدور أهمية البيانات الضخمة حول مقدار البيانات لديك ، ولكن ما الذي تفعله بها. يمكنك أخذ البيانات من أي مصدر وتحليلها للعثور على إجابات تمكن 1) خفض التكلفة ، 2) تخفيض الوقت ، 3) تطوير المنتجات الجديدة والعروض المحسّنة ، و 4) اتخاذ القرار الذكي. عندما تجمع بين البيانات الضخمة والتحليلات عالية القدرة ، يمكنك إنجاز المهام المتعلقة بالعمل مثل:

  • تحديد الأسباب الجذرية للفشل والمشكلات والعيوب في الوقت الفعلي تقريبا.
  • إنشاء قسائم في نقطة البيع بناء على عادات الشراء لدى العميل.
  • إعادة حساب محافظ المخاطر بالكامل في دقائق.
  • كشف السلوك الاحتيالي قبل أن يؤثر على مؤسستك.


البيانات الضخمة هي مزيج من البيانات المنظمة وشبه المنظمة وغير المهيكلة التي تم جمعها من قبل المؤسسات والتي يمكن استخراجها للحصول على المعلومات واستخدامها في مشاريع التعلم الآلي والنمذجة التنبؤية وتطبيقات التحليلات المتقدمة الأخرى.

أصبحت الأنظمة التي تعالج وتخزن البيانات الضخمة مكونا شائعا لهياكل إدارة البيانات في المؤسسات ، جنبًا إلى جنب مع الأدوات التي تدعم استخدامات تحليلات البيانات الضخمة. غالبًا ما تتميز البيانات الضخمة بالآتي:
  • الحجم الكبير للبيانات في العديد من البيئات.
  • مجموعة متنوعة من أنواع البيانات المخزنة بشكل متكرر في أنظمة البيانات الضخمة.
  • السرعة التي يتم بها إنشاء الكثير من البيانات وجمعها ومعالجتها.
تم تحديد هذه الخصائص لأول مرة في عام 2001 من قبل دوج لاني ، ثم محلل في شركة استشارات Meta Group Inc. قامت شركة Gartner بنشرها بعد أن استحوذت على Meta Group في عام 2005. وفي الآونة الأخيرة ، تمت إضافة العديد من Vs الأخرى إلى أوصاف مختلفة للبيانات الضخمة ، بما في ذلك الدقة والقيمة والتنوع.

على الرغم من أن البيانات الضخمة لا تعادل أي حجم محدد من البيانات ، إلا أن عمليات نشر البيانات الضخمة غالبا ما تتضمن تيرابايت وبيتابايت وحتى إكسابايت من البيانات التي تم إنشاؤها وجمعها بمرور الوقت.
تعليقات



حجم الخط
+
16
-
تباعد السطور
+
2
-