مناقشة ماجستير حول تحسين جمل الاستعلام بناءً على التغذية الراجعة ذات الصلة والتشابه الدلالي

التاريخ :20/11/2020 21:41:20
كلية تكنولوجيا المعلومات
كتـب بواسطـة  مسؤول موقع كلية تكنولوجيا المعلومات عدد المشاهدات 237

                                ناقشت طالبة الماجستير (هديل موفق عواد) بأشراف الدكتورة(د. وفاء محمد سعيد ) برسالتها الموسومة
  Enhancing query sentences based on relevance feedback and semantic similarity
وكانت حول كيفية استرجاع المعلومات هو مجال يساعد المستخدم على استرداد البيانات المطلوبة ضمن نطاق واسع من الوثائق المختلفة. هناك العديد من التحديات في مجال استرجاع المعلومات التي تجعل من الصعب تحديد المعلومات المطلوبة بسبب الغموض اللغوي للمرادفات، مما يعني أن الكلمات المختلفة لها نفس المعنى. التحدي الآخر هو تعدد الأشكال الذي يستخدم نفس الكلمة لوصف معاني مختلفة. بالإضافة إلى ذلك، استفسارات المستخدم قصيرة بشكل عام. تهدف هذه الأطروحة إلى تعزيز فعالية الاسترجاع من خلال توسيع الاستعلام عن طريق إدراج جمل في استعلام المستخدم.
 لقد تغلبت المقاييس الدلالية على نقاط الضعف في طرق مطابقة المصطلحات المعجمية البسيطة. تسمح الخطوات الدلالية بأخذ سياق الكلمات في الاعتبار من خلال التحليل النحوي. من ناحية أخرى، يعتمد التحليل المحلي على المستندات التي تم استردادها في الأصل، وإذا لم تكن المستندات المستردة في الأصل مرتبطة ارتباطًا وثيقًا بالاستعلام الأولي، فستتأثر دقة الاسترجاع بشكل كبير. لذلك، استخدمت الطريقة المقترحة نهجًا جديدًا لتوسيع الاستعلام من خلال دمج التشابه الدلالي مع تحليل السياق المحلي.
 الطريقة المقترحة تتكون من عدة مراحل. المرحلة الأولى هي المعالجة المسبقة للبيانات. تتضمن المرحلة الثانية مصطلح ترجيح المستندات ثم استخدام تشابه جيب التمام للحصول على أعلى مستندات مرتبة N. بعد ذلك، تم استخدام (PRF) الذي افترض أن المستندات المسترجعة ذات صلة. كانت المرحلة الثالثة هي إجراء توسيع الاستعلام المستند إلى الجملة باستخدام التشابه الدلالي وجيب التمام من خلال اختيار الجملة داخل المستندات القريبة من جملة الاستعلام. أخيرًا، تم تقييم النتائج بواسطة متوسط معدل الدقة لخط الأساس ونتيجة الاستدعاء الثاني لكلا الطريقتين. لوحظ أن أفضل نتيجة تم تحقيقها بالطريقة الجديدة كانت 0.5، بينما حقق خط الأساس 0.447، ونتائج مستوى جيب التمام كانت 0.469