عن صيغة PDF

من ويكي أضِف
مراجعة 10:08، 11 يناير 2018 بواسطة أحمد (نقاش | مساهمات) (تفاصيل)
اذهب إلى التنقل اذهب إلى البحث

تفيد صيغة الملفات PDF في إنتاج وثائق ذات هيئة معيّنة لا تتغير باختلاف البرمجيات المستخدمة في عرضها أو العتاد أو نظم التشغيل، و كصيغة للطباعة.

و برغم شيوع استخدامها لهذه الأغراض كصيغة فرضت نفسها عمليا لسنوات قبل أن تفتحها شركة أدوبي لتتحول إلى مواصفة قياسية[1] فإن لصيغة PDF عيوبا عدة:

بالغة التعقيد
تحمل عبئا موروثا من التقلبات و التغيرات في تصميمها و التضخّم في الوظائف نادرة الاستخدام. تقريبا لا توجد تطبيقات برمجية للمواصفة كلّها في تطبيقات الإنتاج أو العرض.
عربيتها معطوبة
إذا كان استخرج النصوص من وثائق PDF صعبا عموما في اللغات المكتوبة بالحرف اللاتيني، فإنه يكاد يكون مستحيلا من الوثائق العربية بسبب الترميز غير القياسي للمحارف العربية و أن النصوص أحيانا لا تُرمّز كمحارف بل كرسوم، خصوصا في الوثائق المنتجة ببرمجيات قديمة. مما يعني عمليا أن استخراج النصوص منها يتطلب إعادة إدخالها يدويا. فأي رقمية و أي حوسبة!
يصعب البحث فيها
للأسباب السابقة، يستحيل البحث النصّي في وثائق PDF العربية. لذلك مثلا لا تظهر أبدا نتائج من محتويات وثائق PDF عربية في محركات البحث في الوِب.
غير قابلة للتحرير
إلا في حدود ضيقة باستخدام برمجيات غير شائعة. أحيانا تُرى هذه الخصيصة كميزة، عند رغبة المؤلف في إنتاج وثيقة نهائية للمطالعة فقط و الحول دون تغيير محتواها عمدا أو سهوا. لكن ينبغي التمييز بين كون هذا حاصلا كنتيجة ثانوية لتعقيد الصيغة و كونه مقصودا. فالواقع أن الصعوبة البالغة لتحرير وثائق PDF ليست حماية فعالة لها من التعديل\التزييف لمن يعتزم ذلك و لديه الدراية التقنية اللازمة. فالوسيلة الوحيدة الفعالة لحماية وثيقة رقمية من التزييف هي توقيعها رقميا. غير ذلك قد يصعب لكنه لا يمنع.
هي نهاية المطاف
هذه نتيجة ثانوية للخصيصة السابقة. إذ يصعب استخراج محتوى الوثيقة من مكونات مختلفة؛ أي النصوص و الصور و الرسوم، أو تحويلها لصيغة أخرى أو إعادة استخدامها، و هو عادة ما يكون معيقا للاستخدامات المرغوبة.

فيما عدا حالات النشر المكتبي و التصميم الطباعي، فإن كل ما سبق معيق للاستخدامات المطلوبة و في أغلب الحالات يعاكس الغرض الأصلي لناشر الوثيقة، و هو انتشار محتواها و بقاؤه متداولا لأطول مدة ممكنة.

حلول أفضل

توجد عدة مقاربات للتغلب على أوجه القصور المختلفة السابقة الذكر، و هي غير متعارضة مع النشر في صيغة PDF، إذ يمكن تطبيقها جنبا إلى جنب، لتقديم محتوى الوثائق المرغوب انتشارها و إعادة استخدامها في صيغ مفتوحة:

  • نشر نصوص التقارير و الكتب الرقمية على الوب بتنسيق HTML
  • في ملفات نصية بسيطة (الشهيرة بصيغة TXT)، خاصة عندما لا يكون التنسيق الغني مطلبا لا غنى عنه للوثيقة
  • في صيغة قياسية مثل ODF التي تنتجها تطبيقات LibreOffice و غيره
  • أو حتى في صيغ معالجات كلمات شائعة تجارية، و هو أسوأ الحلول
  • توجد صيغ حديثة قياسية للكتب الرقمية، مثل ePub، تصلح لأغراض النشر على الإنترنت، مدعومة في قارئات لكل منصات التشغيل.

من الجدير بالذكر أن برمجيات LibreOffice يمكنها إنتاج وثائق PDF تتضمن في داخلها الوثائق الأصلية في صيغة ODF مما يعني عمليا إمكان تحرير محتواها باستخدام نفس البرمجية التي أنتجتها أو برمجيات متوافقة معها. و كون ليبرأوفس برمجية حرة متاحة على نظم التشغيل الشائعة الثلاثة يقلل المشكلة كثيرا.

كما يُمكن باستخدام بعض برمجيات معالجة PDF، منها برمجية أدوبي، تضمين ملفات في ملفات PDF<reference>يوجد شرح عام لهذه الوطيفة في What do we mean by “embedded” files in PDF? - Open Preservation Foundation و تفاصيلها مشروحة في المواصفة ISO 32000.</ref>، مشابها لمرفقات البريد الإلكتروني، و هذا يمكّن أولئك المضطرين إلى إصدار ملفات PDF من تضمين نسخة نصية بسيطة من محتواها في نفس الملف[2]، و التنويه عن ذلك في موضع ظاهر في ملف PDF نفسه لتمكين الناس من استخراج المحتوى النّصي و إعادة استعماله.

في أحيان كثيرة يكون استخدام ملفات PDF جهدا زائدا عن الحاجة و غير مطلوب من الأصل، كما في حالة الرغبة في جمع ملفات صورية، مثل المسوحات الضوئية للكتب أو الوثائق، إذ من الأفضل في هذه الحالة جمع الملفات العديدة للصور في ملف واحد، باستغلال المعيار المتعارف عليه لصنع كتب رقمية تتألف من صور الصفحات المضغوطة في أرشيف ZIP أو TAR واحد مسمّى بالامتداد CBZ أو CBT [3]، و هي صيغة مفتوحة و توجد لها قارئات عديدة لكل نظم التشغيل الشائعة، بعضها حرّ.

أو استخدام صيغة رسومية تدعم تعدد الصفحات في ملف واحد، مثل TIFF، و هتان الأخيرتان هما الممارستان الأرشيفيتان الفُضليان.

ما هي أصلا؟

صيغة Portable Document Format (تختصر PDF) صيغة ملفات رقمية مشتقة من لغة البرمجة PostScript المصممة لوصف الرسوميات و التي يشيع استخدامها لإنشاء وثائق للطباعة، و لأغراض رسومية أخرى. و كلتا المواصفتين أنتجتهما شركة أدوبي، و كلاهما معيار

مصادر

  1. ISO 32000 الصادرة سنة 2008. للتفاصيل طالع wikipedia:History of the Portable Document Format (PDF)
  2. من أمثلة هذه البرمجيات PDF Chain للنظام لينكس
  3. صيغة Comic Book Archive صيغة عُرفية ابتكرها هواة الكُمكٍ و الروايات المصوّرة، و هي في أساسها ملف أرشيف أو مضغوط في إحدى الصيغ الشائعة. للمزيد من التفاصيل طالع مقالة ويكيبيديا الإنجليزية Wikipedia:Comic book archive