| سطر 32: |
سطر 32: |
| | | | |
| | http://r-shief.org/openegypt-in-memory-of-ali-shaath/ | | http://r-shief.org/openegypt-in-memory-of-ali-shaath/ |
| | + | |
| | + | |
| | + | ==معلومات مهمة يمكن مزجها== |
| | + | |
| | + | أدوات تحليل النصوص العربية |
| | + | أرشيف |
| | + | نبذة |
| | + | مع نمو المحتوى الرقمي على الإنترنت, يظهر جليا الاحتياج لوجود أدواة لتحليل هذا المحتوى بشكل مميكن قادر على تحليل |
| | + | محتوى بهذا الحجم. هناك العديد من الأدوات المتعلقة بتحليل النصوص قيد البحث والتطوير، خصوصا للمحتوى من اللغة |
| | + | الانجليزية والعديد من اللغات الأخرى. |
| | + | تعمل ارشيف من سنوات على جمع وحفظ المحتوى العربي من الشبكة. وتهدف إلى بناء محرك تحليل للنصوص العربية بشكل |
| | + | ذكي لتحقيق اقصى فائدة معلوماتية منه. |
| | + | هذا المشروع يشمل البحث والتطوير المتعلق ببناء هذا المحرك |
| | + | مجالات تحليل النصوص |
| | + | هناك العديد من الطرق المختلفة لتحليل النصوص لأغراض مخلتفة. من المجالات المعنية في هذا المشروع: |
| | + | Tagging توصيف النص بإشارات مرجعية ● |
| | + | تحليل النص واستخراج الكلمات اللي يمكنها ان توصف النص وتستخدم كإشارة مرجعية له |
| | + | Named Entity Recognition استخراج الكيانات ● |
| | + | ويعتبر ايضا من أنواع توصيف النص. مع الفرق عن النوع السابق أن هذا النوع يعتمد على معرفة مسبقة بالكيانات |
| | + | والتي تكون متاحة في شكل معجم |
| | + | Semantic Analysis التحليل الدلالي ● |
| | + | ويعني باستخدام قواعد اللغة لفهم العلاقات المختلفة بين الكيانات المعنية في النص. |
| | + | Sentiment Analysis تحليل المشاعر ● |
| | + | ويركز هذا النوع على محاولة استنباط موقف ومشاعر الكاتب للنص قيد التحليل. وله تطبيقات كثيرة في فهم اراء |
| | + | ومشاعر الجمهور |
| | + | أداة أرشيف لاستخراج الكيانات العربية |
| | + | حصلت أرشيف على دعم أنتم من مؤسسة أضف في 2013 لتطوير أداة استخراج الكيانات للنصوص العربية. وجعلها متاحة في |
| | + | صورة واجهة برمجية تمكن الأخرين من استخدامها بصور متعددة تعتمد على تطبيقاتهم. |
| | + | http://rshief. |
| | + | org/textanalysis/ |
| | + | arabicentityextractionapidocumentation |
| | + | وتم اطلاق النموذج الأولي من الأداء والواجهة البرمجية على موقع أرشيف. كما تم تطوير واجهة برمجية تسمح بتجربة الأداة |
| | + | http://rshief. |
| | + | org/textanalysis/ |
| | + | entityextractiondemo |
| | + | بشكل مباشر للتعرف على جودة التحليل |
| | + | حتى يمكن للمستخدمين التعرف على الأداة وملاحظة التقدم والتحسن في جودة التحليل في اثناء انشغالنا بالتطوير |
| | + | http://ar.wikipedia.org أداة استخراج الكيانات المتاحة حاليا مبنية على قاعدة بيانات ألنسخة العربية من الموسوعة الحرة |
| | + | هدفنا هو تطوير أداة تستطيع بشكل دوري ان تحدث من القاعدة المعرفية التي تستخدمها عن طريق تحميل وتحليل النسخ المحدثة |
| | + | دوريا من قاعدة بيانات الموسوعة الحرة |
| | + | البحث المتعلق بأدوات معالجة النصوص |
| | + | كانت الخطوة الأولى التي اتخذناها لبناء المحرك هي بحث ما تم تطويره في كل من الأوساط الأكاديمية والصناعية. معظم ما تم |
| | + | الوصول إليه يخدم النصوص الانجليزية. ومع ذلك فقد بذلت جهود عديدة لتوفير حلول ذات جودة عالية لمعالجة النصوص |
| | + | العربية. من هذه الجهود: |
| | + | Stanford CoreNLP مشروع معالجة اللغة العربية كجزء من مكتبة ستانفورد لمعالجة اللغات الطبيعية ● |
| | + | يركز هذا المشروع على خاصية ترجمة النصوص من لغة لأخرى، كما يأخذ في الاعتبار احصائيات بناء النص |
| | + | وتوصيف النصوص |
| | + | Arabic WordNet AWN ● |
| | + | يتبع هذا المشروع الاسلوب المتبع في نظيره للغة الانجليزية واستطاع ان يحدد العديد من المفردات ومرادفاتها في |
| | + | اللغات الأخرى |
| | + | GATE كما تمت محاولات لبناء أدوات تحليل للنصوص العربية بناء على اطار ● |
| | + | General Architecture for Text Engineering |
| | + | كما قام طه زروقي وأخرون بتطوير عدد من الادوات لمعالجة النصوص العربية لأزالة علامات الجر والكلمات الغير ● |
| | + | ذي دلالة الى جانب تشكيل النصوص |
| | + | وقام محمد عطية من جامعة جورج واشنطن ببناء قائمة من الوسومات مستخرجة من الموسوعة الحرة ويمكن ● |
| | + | استخدامها لبناء المعجم المستخدم في بناء أداء لاستخراج الكيانات. وقام بنشر كيفية قيامه ببناه هذه القائمة |
| | + | محرك أرشيف لتحليل النصوص العربية |
| | + | تهدف أرشيف الى بناء محرك تحليل النصوص العربية على مجموعة من الأجزاء |
| | + | أداة استخراج الكيانات. والتي ستمكن من توصيف النصوص بصورة ادق من التوصيف العام ● |
| | + | قام فريق أرشيف ببناء النموذج الأولي وجعله متاحة عن طريق واجهة برمجية وواجهة مستخدم لتسهل على المتابعين |
| | + | تجربته بحريه |
| | + | التحليل الدلالي للنص. عن طريق تحليل استخدام قواعد اللغة وعناصر بناء الجملة حتى يتسنى تحديد العلاقات بين ● |
| | + | الكيانات المعنية في النص. |
| | + | تحليل المشاعر. وهو الخطوة الاخيرة في المحرك ويهدف الى معرفة رأي الجمهور في موضوع معين عن طريق ● |
| | + | تحليل النصوص المنشوية من هذا الجمهور على الشبكة والوصول الى استنباطات بصورة عملية |
| | + | يبقى هدف أرشيف بناء محرك شامل حتى يفتح المجال لبناء أنظمية ذكية عالية الجودة تختص بتحليل وفهم المحتوى العربي. |
| | | | |
| | [[تصنيف:أضف أنتم]] | | [[تصنيف:أضف أنتم]] |