دليل تنظيم الأرشيف

من ويكي أضِف
مراجعة 12:50، 24 سبتمبر 2016 بواسطة Uwe (نقاش | مساهمات) (صياغة)
(فرق) → مراجعة أقدم | المراجعة الحالية (فرق) | مراجعة أحدث ← (فرق)

هذا الدليل كتب لسياق إستخدامه مع نظام بندورة لأراشيف الفيديو، ولكنه يسعى ليكون عامّا وقابل للتعميم

يسعى هذا المستند لوصف آليات لخلق اراشيف منظمة للميديا، لتعيش في نظم ملفات تراتبية تقليدية بالإضافة إلى أنظمة إدارة أراشيف لأشكال الميديا المختلفة، ساعيا لإبقاء الأفق مفتوحا قدر الممكن لجعل البيانات مفهومة وقابلة للإستخدام في بيئات التقنية المتغيرة، عبر الإعتماد أساسا على المفاهيم الثابتة في التقنية ولإبقاء البيانات بصيغ تسمح بالإستخدام المتبادل بين نظم الملفات وبين الأنظمة المختلفة للإدارة والفهرسة.

تنويه

إن نظم الملفات تراتبية في العادة، مما يعني أنها تجبرنا على تنظيم تراتبي وهيكلي للمعلومات أو التصنيفات التي تحملها المسارات وأسماء الملفات. هذه "الخاصيّة" تمنعنا بشكل كبير من تخزين البيانات بمناظير متعددة وعلاقات متداخلة ومتشابكة. يتجنب هذا المستند الإلتفاف على هذه النقائص بحلول في نظم الملفات أو ليّ إمكانياتها للخروج بحلول سحرية، وبدلا من ذلك يركز على الإستخدام الواضح لها: التخزين المنظم، السهل وغير المبهم للملفات، ومناسبته لإسترجاعها لاحقا بذات السهولة، سواء يدويا، أو عبر برمجية حوسبيا.

تنظيم الأراشيف

آخذين بعين الإعتبار خواص نظم الملفات التراتبية، فإن أي جهة منظمة لأراشيفها تحتاج أن تأخذ بعين الإعتبار محدودية قدرة نظم الملفات والمسارات على عكس المعارف المتنوعة المرتبطة بالمواد في تلك الاراشيف أو الفهم المحيط بتلك الأراشيف، وبالتالي، فإن [[خلاصته::الإستخدام الأمثل لنظم الملفات هو أن تعكس المسارات معلومات وتصنيفات، لا بيانات قد تحمل أوجه خلاف أو رأي، واستخدام القدر الكافي من تلك "المعلومات" بحيث ينشأ مسار فريد لكل مادة]] بحيث يكون تخزين أو البحث عن و\أو استرجاع هذه المادة ممكنا عبر الإجابة عن مجموعة محدودة من الأسئلة المعرّفة مسبقا.

تُجمع الملفات المنظمة في مسارات تعكس "معلومات" مثل تاريخ انتاجها أو منتج المادة أو مكان إنتاجها أو مصدرها أو سياق آخر يعكس تفردها، ويعتبر الجزء من المسار السابق لأي من هذه المعلومات غير مهم لبنية تنظيم الملفات في الأرشيف بإستثناء تمكينه لنا من الوصول إليها، ويمكن أن يتغير دون أن تفقد المسارات المعنى الذي تمنحه للمادة المؤرشفة؛ نسمي ذلك الجزء (الأول) من المسار "مسار المجلد"، بحيث يكون المجلد هو نقطة البداية للمسار المُحمّل بالمعلومات حول المادة التي يشير إليها.

مثال:

  /home/user/Faviorite Videos/2013/08/Jenin/XX live peformance
 I_______مسار المجلد________I________مسار المادة _____________I

وحدات التخزين

الحجوم ونسق التهيئة

من الحصافة أن إعتماد مساحات محددة للمجلدات، مثل 1TB، و2TB، وهي مساحات يمكن أيجاد وحدات تخزين من الأقراص الصلبة من مضاعفاتها بسهولة، وبالتالي يمكن تقسيم قرص صلب إلى مساحات تناسب المجلدات التي ستحويها! وذلك يعود علينا بمجموعة من الفوائد، لعل أهمها توحيد مساحات وحدات النسخ الاحتياطي وتسهيل تقدير المساحات الأنسب لشراء مساحات تخزين جديدة.

إن نسق تهيئة وحدات التخزين (الأقراص الصلبة مثالا) يؤثر على قدرتنا على القراءة والكتابة على تلك الوحدات تحت نظم الملفات المختلفة، وبما أن نظم التشغيل الشائعة تعتمد نظم ملفات مختلفة فإنه لا يوجد إجابة مثالية عن سؤال :"ما هو أفضل نسق تهيئة\نظام ملفات للإستخدام"، بل الإجابة تعتمد بشكل كبير على نظم التشغيل التي ستقرأ وتكتب على تلك الوحدات. فمثلا، تستطيع كل نظم التشغيل قراءة نظام ملفات بنسق تهيئة NTFS، ولكن بسبب كونه مملوكا ومحتكرا لشركة مايكروسوفت وتصميه غير متاح للعموم، فإن دعم الكتابة عليه في أنظمة ماكينتوش ولينكس مليئة بالمحاذير، بينما لا يستطيع ويندوز بسهولة قراءة نظم ملفات hfsplus وext4 المستخدمة في ماكنتوش ولينكس. وهناك مشاكل معروفة لدى استخدام نظام ملفات hfsplus بمساحات تفوق ال2TB على أنظمة لينكس.

من المنصوح به أيضا أن لا تملأ المساحات تماما بالمواد، بل ترك هامش من الفراغ (لا يحتاج لأن يزيد عن 5% في أي حال من الأحوال) لتجنب مشاكل مستقبلية تتعلق بنقل المحتوى إلى أنساق تهيئة مختلفة أو تعميتها مثلا مما قد يحتاج إلى هامش مساحة لتخزين بيانات أو فهارس داخلية عن الملفات، التعمية وغيرها. كما أن إختلاف الجهات المصنّعة للأقراص الصلبة في إستخدامهم لوحدات القياس (1000 مقابل 1024) يؤدي لعدم التطابق في المساحة بين أقراص صلبة برغم إشارة الجهات المصنعة إلى أنها من ذات المساحة.

ترتيب الملفات والمسارات ليتعامل معها بندورة

  1. يبحث عميل بندورة عن الملفات داخل المجلدات بشكل محدد مسبقا، ولذلك يجب أن تكون الملفات مرتبة مسبقا!
  2. بشكل مبدئي، يتوقع بندورة أن يكون ترتيب الملفات في المجلدات بحيث يكون طول المسار إليها من نقطة بدء المجلد، دليلين إثنين.
    • مثال :
      • /users/kindo/movies/ المسار الذي سيبدأ بندورة باستكشاف الملفات منه، وهو مسار المجلد.
      • /Piano/ المستوى الأول
      • /Piano Dog/ المستوى الثاني
      • المسار الكامل لملفات الفيلم هي:
        • /users/kindo/movies/Piano/Piano Dog/Part1.mp4
        • /users/kindo/movies/Piano/Piano Dog/Part2.mp4
  3. نحتاج إلى تسمية للمجلد، ويفضل أن يعكس بشكل أو بآخر محتوى وتنظيم الأرشيف، فيمكن ان نختار اسم مثل "Personal_Movies" أو إسم يعكس تنظيم زمني مثل "2011_disk_1" حيث قد يحتوي على أدلة في المستوى الأول اخر مثل "Activities" كما قد يحتوي كل دليل من المستوى الأول على أدلة اخرى مرتبطة بالمكان والزمن ... إلخ.

كيفية اختيار اسم لمجموعة الفيديوات (المجلد)؟ وماذا يمكنني أخذه في الحسبان فيما يتعلق بالمجلدات

اختيار الاسم يعتمد على الكيفية المرغوب بها الإشارة إلى مجموعات الفيديو في الأرشيف بأسماء ذات معنى.

مثلا، قد ترغب في تسمية مجموعات الفيديو بحسب محتواها، مثل "events_2013"، أو "saeed_old_collection" أو أي اسم يساعد على تمييز هذه المجموعة من الفيديوات التي ستكون معا في مجلد واحد.

يستعمل عميل بندورة وخادم بندورة إسم المجلد للإتفاق على انهما يتحدثان عن ذات مجموعة الفيديوهات، وبالتالي فإن كونه إسما فريدا ضروري، فإستخدام ذات الإسم لمجلدين مختلفين في المحتوى يجعل النظام يعتقد أن الملفات قد تغيرت، وأن ما كان في المجلد الأول قد مسح ويستبدله بما في الثاني. وبالرغم من ان تسمية المجلدات هو متطلب لبندورة، إلا أنه يعكس أيضا الممارسة العاقلة بتسمية وحدات تخزين الأصول (أي ملفات الفيديو) باسماء تسهل عمليات التخزين والاسترجاع والنسخ الإحتياطي. ومع تنوع المحتوى وتوزعه على فترات زمنية لأسباب تتعلق بلحظة وصول ذلك المحتوى للأرشيف، فإنه وفي معظم الأحيان من الحصافة تسمية المجلدات بإسم يميز الجهة المؤرشفة ورقم تسلسلي متصاعد، بحيث يسهل الإشارة إليها، والأشارة إلى نسخها الاحتياطية والإنتباه لغياب أحدها وتسلسل وصول محتواها للأرشيف... إلخ.

من الممارسات الحميدة كذلك؛ جعل المجلدات بأحجام تتناسب مع حجم نمو الأراشيف، بحيث نستطيع أن ننشئ منها نسخا إحتياطية بسهولة وسلاسة وقدر اقل من الهدر، كماأن تعاظم أحجام الأقراص الصلبة يسهل مهمة إختيار أحجام كبيرة نسبيا، ويعد الحجم 2 TB رقما سحريا حيث أن الأقراص الصلبة الحديثة تتوفر بمضاعفات لهذا الحجم (بالإضافة إلى 1 TB بطبيعة الحال).


  1. بشكل مبدئي، يستخدم بندورة إسم الدليل في المستوى الثاني كعنوان للفيلم ويعتبر كل الملفات بداخل هذا الدليل فيلما واحدا ويعرضه بشكل متصل مع الحفاظ بداخل النظام على كل ملف على حدة.

'تنبيهات:'

  • يفضل استخدام اسماء المجلدات والملفات بالأحرف والأرقام اللاتينية فقط ولا تستخدم احرفا عربية او أي علامة مثل ( : = + * الخ) العلامة الوحيدة الممكن استخدامها لفصل الكلمات هي _ underscore لا تستخدم المسافة (space) في أسماء الملفات ومساراتها
  • عدد ملفات الفيديو في المستوى الثاني محدودة - بسبب أنهم يكونون Item واحد، وبسبب بقة في متصفحات الويب عموما، فإن هناك حد اقصى لعدد الفيديوهات التي يمكن إرسالها معا ( حسب مطوري النظام لايزيد عن 6 ملفات )
  1. رتب ملفاتك استعدادا لنقل المعلومات الى بندورة وحاول ان تضع في اسم الدليل الثاني معظم المعلومات الضمنية عن الفيلمmetadata) ليساعدك بعد الرفع في ادخال البيانات الى قاعدة البيانات داخل بندورة.