رسالة ماجستير في قسم الحاسوب تدرس كشف الاشاعة على تويتر

التاريخ :11/11/2020 09:25:47
كلية العلوم للبنات
كتـب بواسطـة  مسؤول موقع كلية علوم البنات عدد المشاهدات 167

      
  رسالة ماجستير في قسم الحاسوب تدرس كشف الاشاعة على تويتر
جرت في كلية العلوم للبنات / قسم الحاسوب مناقشة رسالة ماجستير للطالب حسام محمد جابر الموسومة (تحسين نظام كشف الإشاعة على تويتر بناءً على استخراج الميزات) وقال الباحث ازداد معدل مستخدمي أنظمة المدونات الصغيرة مثل Twitter في السنوات الأخيرة الى ملايين المستخدمين النشطين ، حيث أصبح نظام المدونات الصغيرة وسيلة جديدة لنشر الشائعات التي تلعب دورًا حاسمًا في إدارة الكوارث عن طريق نشر معلومات الحالات الطارئة. يمكن للأدوات تحديد المعلومات الزائفة وبالتالي تجنب انتشار هذه المعلومات. نتيجة لذلك ، ازداد الاهتمام بأساليب الكشف الفعالة بسرعة كبيرة في السنوات الأخيرة ، بالاضافة الى ان العديد من الدراسات كشفت بيانات وسائل التواصل الاجتماعي لفهم الشبكات واستخراج معلومات مهمة من اجل تطوير خطة لتخفيف التأثير قبل الكوارث وبعدها.

                


وبين الطالب ان هذا العمل هو محاولة لمواجهة هذا التحدي من خلال تقديم نهج للكشف عن الشائعات ، والذي يتعلم من مجموعة بيانات تويتر. تم إجراء المعالجة المسبقة للبيانات وهي خطوة اساسية في تحويل البيانات الخام إلى تنسيق يمكن فهمه و كذلك هي تقنية مهمة لمعالجة أداء الخوارزميات ، بالاضافة الى امكانية زيادة الحالات المصنفة بشكل صحيح. يعرض النظام المقترح عددًا من الميزات الجديدة التي تم استخراجها من مجموعات بيانات الاحداث في Twitter بناءً على سلوك المستخدم وميزات الانتشار والميزات الزمنية التي تمثل السياق الاجتماعي للتغريدة لتقليل التباين في الميزات. تظهر التجارب أن بعض الميزات الجديدة وهي (انتشار الإشاعات ، متوسط سرعة الإشاعة ، أسم اليوم ، أسم الشهر ، يوم العمل) اثبتت فعالية في عملية التصنيف. كما أن العمل تضمن اعتماد مصنف المجموعة Ensemble كنهج أكثر ملاءمة ولتحقيق أداء أفضل مقارنة بالمصنفات الفردية الاساسية. علاوة على ذلك ، تعالج الطريقة المقترحة عدم توازن مجموعات بيانات الاحداث لتقليل تأثيرها على خوارزميات الكشف وذلك باستخدام اختيار العيناتsamples selection   بالإضافة إلى استخدام تقنيات ترتيب اهمية الميزاتfeatures ranking  التي تم تحليلها لتحديد مدى فعالية استخدام هذه التقنيات في تحقيق الأداء العالي لخوارزميات التعلم وذلك لتحسين الدقة التنبؤية للمصنف.
واوضح أظهرت النتائج التجريبية في مجموعة بيانات PHEME أن الميزات الجديدة جعلت عملية التصنيف أكثر فعالية ودقة مقارنة بالعديد من الأعمال ذات الصلة للكشف عن الشائعات التي تستخدم نفس البيانات ، حيث تم تحقيق دقة 78.54? كمعدل للأحداث المستخدمة. كما حققت نتائج التصنيفات المقترحة المستخدمة في الميزات المرتبة والعينات المختارة أداءً تنافسيًا وزيادة كبيرة ، حيث كانت مقاييس الدقة لبيانات الأحداث الخمسة (92.7536% ، 100% ، 87.5912% ، 86.7521% , 86.2069%) على التوالي.
عباس الجبوري / اعلام الكلية