مجهول

تغييرات

من ويكي أضِف
تم إضافة 6٬779 بايت ،  قبل 10 سنوات
لا يوجد ملخص تحرير
سطر 32: سطر 32:     
http://r-shief.org/openegypt-in-memory-of-ali-shaath/
 
http://r-shief.org/openegypt-in-memory-of-ali-shaath/
 +
 +
 +
==معلومات مهمة يمكن مزجها==
 +
 +
أدوات تحليل النصوص العربية
 +
أرشيف
 +
نبذة
 +
مع نمو المحتوى الرقمي على الإنترنت, يظهر جليا الاحتياج لوجود أدواة لتحليل هذا المحتوى بشكل مميكن قادر على تحليل
 +
محتوى بهذا الحجم. هناك العديد من الأدوات المتعلقة بتحليل النصوص قيد البحث والتطوير، خصوصا للمحتوى من اللغة
 +
الانجليزية والعديد من اللغات الأخرى.
 +
تعمل ارشيف من سنوات على جمع وحفظ المحتوى العربي من الشبكة. وتهدف إلى بناء محرك تحليل للنصوص العربية بشكل
 +
ذكي لتحقيق اقصى فائدة معلوماتية منه.
 +
هذا المشروع يشمل البحث والتطوير المتعلق ببناء هذا المحرك
 +
مجالات تحليل النصوص
 +
هناك العديد من الطرق المختلفة لتحليل النصوص لأغراض مخلتفة. من المجالات المعنية في هذا المشروع:
 +
Tagging توصيف النص بإشارات مرجعية ●
 +
تحليل النص واستخراج الكلمات اللي يمكنها ان توصف النص وتستخدم كإشارة مرجعية له
 +
Named Entity Recognition استخراج الكيانات ●
 +
ويعتبر ايضا من أنواع توصيف النص. مع الفرق عن النوع السابق أن هذا النوع يعتمد على معرفة مسبقة بالكيانات
 +
والتي تكون متاحة في شكل معجم
 +
Semantic Analysis التحليل الدلالي ●
 +
ويعني باستخدام قواعد اللغة لفهم العلاقات المختلفة بين الكيانات المعنية في النص.
 +
Sentiment Analysis تحليل المشاعر ●
 +
ويركز هذا النوع على محاولة استنباط موقف ومشاعر الكاتب للنص قيد التحليل. وله تطبيقات كثيرة في فهم اراء
 +
ومشاعر الجمهور
 +
أداة أرشيف لاستخراج الكيانات العربية
 +
حصلت أرشيف على دعم أنتم من مؤسسة أضف في 2013 لتطوير أداة استخراج الكيانات للنصوص العربية. وجعلها متاحة في
 +
صورة واجهة برمجية تمكن الأخرين من استخدامها بصور متعددة تعتمد على تطبيقاتهم.
 +
http://rshief.
 +
org/textanalysis/
 +
arabicentityextractionapidocumentation
 +
وتم اطلاق النموذج الأولي من الأداء والواجهة البرمجية على موقع أرشيف. كما تم تطوير واجهة برمجية تسمح بتجربة الأداة
 +
http://rshief.
 +
org/textanalysis/
 +
entityextractiondemo
 +
بشكل مباشر للتعرف على جودة التحليل
 +
حتى يمكن للمستخدمين التعرف على الأداة وملاحظة التقدم والتحسن في جودة التحليل في اثناء انشغالنا بالتطوير
 +
http://ar.wikipedia.org أداة استخراج الكيانات المتاحة حاليا مبنية على قاعدة بيانات ألنسخة العربية من الموسوعة الحرة
 +
هدفنا هو تطوير أداة تستطيع بشكل دوري ان تحدث من القاعدة المعرفية التي تستخدمها عن طريق تحميل وتحليل النسخ المحدثة
 +
دوريا من قاعدة بيانات الموسوعة الحرة
 +
البحث المتعلق بأدوات معالجة النصوص
 +
كانت الخطوة الأولى التي اتخذناها لبناء المحرك هي بحث ما تم تطويره في كل من الأوساط الأكاديمية والصناعية. معظم ما تم
 +
الوصول إليه يخدم النصوص الانجليزية. ومع ذلك فقد بذلت جهود عديدة لتوفير حلول ذات جودة عالية لمعالجة النصوص
 +
العربية. من هذه الجهود:
 +
Stanford CoreNLP مشروع معالجة اللغة العربية كجزء من مكتبة ستانفورد لمعالجة اللغات الطبيعية ●
 +
يركز هذا المشروع على خاصية ترجمة النصوص من لغة لأخرى، كما يأخذ في الاعتبار احصائيات بناء النص
 +
وتوصيف النصوص
 +
Arabic WordNet AWN ●
 +
يتبع هذا المشروع الاسلوب المتبع في نظيره للغة الانجليزية واستطاع ان يحدد العديد من المفردات ومرادفاتها في
 +
اللغات الأخرى
 +
GATE كما تمت محاولات لبناء أدوات تحليل للنصوص العربية بناء على اطار ●
 +
General Architecture for Text Engineering
 +
كما قام طه زروقي وأخرون بتطوير عدد من الادوات لمعالجة النصوص العربية لأزالة علامات الجر والكلمات الغير ●
 +
ذي دلالة الى جانب تشكيل النصوص
 +
وقام محمد عطية من جامعة جورج واشنطن ببناء قائمة من الوسومات مستخرجة من الموسوعة الحرة ويمكن ●
 +
استخدامها لبناء المعجم المستخدم في بناء أداء لاستخراج الكيانات. وقام بنشر كيفية قيامه ببناه هذه القائمة
 +
محرك أرشيف لتحليل النصوص العربية
 +
تهدف أرشيف الى بناء محرك تحليل النصوص العربية على مجموعة من الأجزاء
 +
أداة استخراج الكيانات. والتي ستمكن من توصيف النصوص بصورة ادق من التوصيف العام ●
 +
قام فريق أرشيف ببناء النموذج الأولي وجعله متاحة عن طريق واجهة برمجية وواجهة مستخدم لتسهل على المتابعين
 +
تجربته بحريه
 +
التحليل الدلالي للنص. عن طريق تحليل استخدام قواعد اللغة وعناصر بناء الجملة حتى يتسنى تحديد العلاقات بين ●
 +
الكيانات المعنية في النص.
 +
تحليل المشاعر. وهو الخطوة الاخيرة في المحرك ويهدف الى معرفة رأي الجمهور في موضوع معين عن طريق ●
 +
تحليل النصوص المنشوية من هذا الجمهور على الشبكة والوصول الى استنباطات بصورة عملية
 +
يبقى هدف أرشيف بناء محرك شامل حتى يفتح المجال لبناء أنظمية ذكية عالية الجودة تختص بتحليل وفهم المحتوى العربي.
    
[[تصنيف:أضف أنتم]]
 
[[تصنيف:أضف أنتم]]
staff
3٬841

تعديل