سطر 32: |
سطر 32: |
| | | |
| http://r-shief.org/openegypt-in-memory-of-ali-shaath/ | | http://r-shief.org/openegypt-in-memory-of-ali-shaath/ |
| + | |
| + | |
| + | ==معلومات مهمة يمكن مزجها== |
| + | |
| + | أدوات تحليل النصوص العربية |
| + | أرشيف |
| + | نبذة |
| + | مع نمو المحتوى الرقمي على الإنترنت, يظهر جليا الاحتياج لوجود أدواة لتحليل هذا المحتوى بشكل مميكن قادر على تحليل |
| + | محتوى بهذا الحجم. هناك العديد من الأدوات المتعلقة بتحليل النصوص قيد البحث والتطوير، خصوصا للمحتوى من اللغة |
| + | الانجليزية والعديد من اللغات الأخرى. |
| + | تعمل ارشيف من سنوات على جمع وحفظ المحتوى العربي من الشبكة. وتهدف إلى بناء محرك تحليل للنصوص العربية بشكل |
| + | ذكي لتحقيق اقصى فائدة معلوماتية منه. |
| + | هذا المشروع يشمل البحث والتطوير المتعلق ببناء هذا المحرك |
| + | مجالات تحليل النصوص |
| + | هناك العديد من الطرق المختلفة لتحليل النصوص لأغراض مخلتفة. من المجالات المعنية في هذا المشروع: |
| + | Tagging توصيف النص بإشارات مرجعية ● |
| + | تحليل النص واستخراج الكلمات اللي يمكنها ان توصف النص وتستخدم كإشارة مرجعية له |
| + | Named Entity Recognition استخراج الكيانات ● |
| + | ويعتبر ايضا من أنواع توصيف النص. مع الفرق عن النوع السابق أن هذا النوع يعتمد على معرفة مسبقة بالكيانات |
| + | والتي تكون متاحة في شكل معجم |
| + | Semantic Analysis التحليل الدلالي ● |
| + | ويعني باستخدام قواعد اللغة لفهم العلاقات المختلفة بين الكيانات المعنية في النص. |
| + | Sentiment Analysis تحليل المشاعر ● |
| + | ويركز هذا النوع على محاولة استنباط موقف ومشاعر الكاتب للنص قيد التحليل. وله تطبيقات كثيرة في فهم اراء |
| + | ومشاعر الجمهور |
| + | أداة أرشيف لاستخراج الكيانات العربية |
| + | حصلت أرشيف على دعم أنتم من مؤسسة أضف في 2013 لتطوير أداة استخراج الكيانات للنصوص العربية. وجعلها متاحة في |
| + | صورة واجهة برمجية تمكن الأخرين من استخدامها بصور متعددة تعتمد على تطبيقاتهم. |
| + | http://rshief. |
| + | org/textanalysis/ |
| + | arabicentityextractionapidocumentation |
| + | وتم اطلاق النموذج الأولي من الأداء والواجهة البرمجية على موقع أرشيف. كما تم تطوير واجهة برمجية تسمح بتجربة الأداة |
| + | http://rshief. |
| + | org/textanalysis/ |
| + | entityextractiondemo |
| + | بشكل مباشر للتعرف على جودة التحليل |
| + | حتى يمكن للمستخدمين التعرف على الأداة وملاحظة التقدم والتحسن في جودة التحليل في اثناء انشغالنا بالتطوير |
| + | http://ar.wikipedia.org أداة استخراج الكيانات المتاحة حاليا مبنية على قاعدة بيانات ألنسخة العربية من الموسوعة الحرة |
| + | هدفنا هو تطوير أداة تستطيع بشكل دوري ان تحدث من القاعدة المعرفية التي تستخدمها عن طريق تحميل وتحليل النسخ المحدثة |
| + | دوريا من قاعدة بيانات الموسوعة الحرة |
| + | البحث المتعلق بأدوات معالجة النصوص |
| + | كانت الخطوة الأولى التي اتخذناها لبناء المحرك هي بحث ما تم تطويره في كل من الأوساط الأكاديمية والصناعية. معظم ما تم |
| + | الوصول إليه يخدم النصوص الانجليزية. ومع ذلك فقد بذلت جهود عديدة لتوفير حلول ذات جودة عالية لمعالجة النصوص |
| + | العربية. من هذه الجهود: |
| + | Stanford CoreNLP مشروع معالجة اللغة العربية كجزء من مكتبة ستانفورد لمعالجة اللغات الطبيعية ● |
| + | يركز هذا المشروع على خاصية ترجمة النصوص من لغة لأخرى، كما يأخذ في الاعتبار احصائيات بناء النص |
| + | وتوصيف النصوص |
| + | Arabic WordNet AWN ● |
| + | يتبع هذا المشروع الاسلوب المتبع في نظيره للغة الانجليزية واستطاع ان يحدد العديد من المفردات ومرادفاتها في |
| + | اللغات الأخرى |
| + | GATE كما تمت محاولات لبناء أدوات تحليل للنصوص العربية بناء على اطار ● |
| + | General Architecture for Text Engineering |
| + | كما قام طه زروقي وأخرون بتطوير عدد من الادوات لمعالجة النصوص العربية لأزالة علامات الجر والكلمات الغير ● |
| + | ذي دلالة الى جانب تشكيل النصوص |
| + | وقام محمد عطية من جامعة جورج واشنطن ببناء قائمة من الوسومات مستخرجة من الموسوعة الحرة ويمكن ● |
| + | استخدامها لبناء المعجم المستخدم في بناء أداء لاستخراج الكيانات. وقام بنشر كيفية قيامه ببناه هذه القائمة |
| + | محرك أرشيف لتحليل النصوص العربية |
| + | تهدف أرشيف الى بناء محرك تحليل النصوص العربية على مجموعة من الأجزاء |
| + | أداة استخراج الكيانات. والتي ستمكن من توصيف النصوص بصورة ادق من التوصيف العام ● |
| + | قام فريق أرشيف ببناء النموذج الأولي وجعله متاحة عن طريق واجهة برمجية وواجهة مستخدم لتسهل على المتابعين |
| + | تجربته بحريه |
| + | التحليل الدلالي للنص. عن طريق تحليل استخدام قواعد اللغة وعناصر بناء الجملة حتى يتسنى تحديد العلاقات بين ● |
| + | الكيانات المعنية في النص. |
| + | تحليل المشاعر. وهو الخطوة الاخيرة في المحرك ويهدف الى معرفة رأي الجمهور في موضوع معين عن طريق ● |
| + | تحليل النصوص المنشوية من هذا الجمهور على الشبكة والوصول الى استنباطات بصورة عملية |
| + | يبقى هدف أرشيف بناء محرك شامل حتى يفتح المجال لبناء أنظمية ذكية عالية الجودة تختص بتحليل وفهم المحتوى العربي. |
| | | |
| [[تصنيف:أضف أنتم]] | | [[تصنيف:أضف أنتم]] |