مشروع إنشاء نظام أرشيف للوثائق

من ويكي أضِف
مراجعة 21:19، 27 مايو 2016 بواسطة Uwe (نقاش | مساهمات) (إضافة ملخص على شكل pull quote)
(فرق) → مراجعة أقدم | المراجعة الحالية (فرق) | مراجعة أحدث ← (فرق)
اذهب إلى التنقل اذهب إلى البحث

الفلسفة

تركّز أغلب نظم إدارة الأرشيفات الرقمية الموجودة على الوثيقة - أو بالأحرى نسختها المُرقمنة - ككيان محوري تدور حوله و عليه الصيرورات المختلفة من وصف و بحث و استكشاف، ربما تأثرا بالأرشيفات المادية التي تحفظ و تدير مجموعات الوثائق كآثار (artefacts) قبل أي شيء، و في مثل هذا النموج تكمن حصافة النظام في توفير مداخل متنوعة مدروسة إلى الوثائق، مثل بياناتها الأساسية من تاريخ و مُنشئ، و تصنيفات مضمونها - إن وُجدت، و علاقات بين الوثائق، و تكون مهمة الباحث|المستكشف هي الوصول إلى الوثيقة ابتداءً و دراسة مضمونها لاحقا لاستنباط معرفة ما منه، ربّما بربطه بمعلومات أخرى من سياق الوثيقة و ما يجاورها من وثائق، و كذلك معلومات مصادرها خارج نظام الأرشيف نفسه. فكأنما نموذج الاستعمال المُتصوَّر هو وجود معرفة مسبقة لدى الباحث عن الوثيقة أو عثوره عليها بطريق الاستكشاف الرشيد في محيط وثائق أخرى مضمونها معلوم له و ذو علاقة بموضوع بحثه.

ما نسعى إلى بنائه نظام أرشيف يركّز على مضمون الوثيقة كمدخل أساسي إليها، و هو ما قد يبدو بديهيا في وجود نظم حاسوبية قادرة على معالجة كموم كبرى من البيانات النصية و الوصفية. في تصوّرنا هذا فإن البحث و الاستكشاف يبدآن لا من وصف الوثيقة و لا بياناتها الأساسية، بل من مضمونها، أي موضوع اهتمام الباحث، و من هناك يظهر التمثيل الرقمي للوثيقة ككيان أثري مادي لها خصائص و بيانات أساسية و موجودة في سياق من الوثائق المجاورة أو هي جزء من كُلٍّ ما. نجد نموذجا مشابها في النتائج التي أضحت محرّكات البحث الكبرى قادرة على تحقيقها بفضل مزيج قوة المعالجة الكبيرة و جهود الرقمنة الواسعة و تقنيات التعرّف على المحارف و التحليل السياقي (في اللغة الإنكليزية أساسا حيث تتركز تلك النتائج)، و مثال على ذلك غوغل.

مثال على نموذج الاستعمال:

المجموعة موضوع المثال مجموعة الصحف الصادرة في بلدان عربية طوال القرن العشرين.

الفرضية أن مجموعة أعداد الصحف الموجودة مستنساخاتها الرقمية في النظام موصوفة بياناتها الأساسية من تواريخ و أرقام الأعداد إلخ، كما أنّه قد تمّ التعرّف على مناطق المحتوى في صفحات الصّحف و تأطيرها، و إدخال مُتون النّصوص في صيغة نصيّة، و كذلك أوصاف الصور الفوتوغرافية و الرسوم التوضيحية، و تعريف طبيعة محتوى كلّ مساحة نظاميا من حيث كونها عنوانا أو مقالة أو إعلانا.

ينطلق الباحث من رغبة في معرفة ما نُشر في الصحف عن موضوع معيّن و ليكن كذا.


مطلوب صورة توضّح صفحة صحيفة مبيّن عليها تأطيرا مساحات المحتوى


نسعى كذلك إلى بناء أرشيف:

دلالي
مفتوح
فدرالي