عن صيغة PDF

من ويكي أضِف
اذهب إلى التنقل اذهب إلى البحث

صيغة Portable Document Format (تختصر PDF) صيغة ملفات رقمية مشتقة من لغة البرمجة PostScript المصممة لوصف الرسوميات و التي يشيع استخدامها لإنشاء وثائق للطباعة، و لأغراض رسومية أخرى. و كلتا المواصفتين أنتجتهما شركة أدوبي.

تفيد صيغة الملفات PDF في إنتاج وثائق ذات هيئة معيّنة لا تتغير باختلاف البرمجيات المستخدمة في عرضها أو العتاد أو نظم التشغيل، و كصيغة للطباعة.

و برغم شيوع استخدامها لهذه الأغراض كصيغة فرضت نفسها عمليا لسنوات قبل أن تفتحها شركة أدوبي لتتحول إلى مواصفة قياسية[1] فإن لصيغة PDF عيوبا عدة:

بالغة التعقيد
تحمل عبئا موروثا من التقلبات و التغيرات في تصميمها و التضخّم في الوظائف نادرة الاستخدام. تقريبا لا توجد تطبيقات برمجية للمواصفة كلّها في تطبيقات الإنتاج أو العرض.
عربيتها معطوبة
إذا كان استخرج النصوص من وثائق PDF صعبا عموما في اللغات المكتوبة بالحرف اللاتيني، فإنه يكاد يكون مستحيلا من الوثائق العربية بسبب تطبيقها ترميزات غير الترميز القياسي للمحارف العربية، وصولا إلى أن النصوص أحيانًا لا تُرمّز كمحارف بل كرسوم، خصوصا في وثائق PDF المنتجة ببرمجيات قديمة. مما يعني عمليًا أن استخراج النصوص منها يتطلب إعادة إدخالها يدويا. فأيّ رقمية و أي حوسبة!
يصعب البحث فيها
للأسباب السابقة، يصعب البحث النصّي في وثائق PDF العربية. لذلك قّلما تظهر نتائج من محتويات وثائق PDF عربية في محركات البحث في الوِب.
غير قابلة للتحرير
إلا في حدود ضيقة باستخدام برمجيات غير شائعة. أحيانا تُرى هذه الخصيصة كميزة، عند رغبة المؤلف في إنتاج وثيقة نهائية للمطالعة فقط و الحول دون تغيير محتواها عمدا أو سهوا. لكن ينبغي التمييز بين كون هذا حاصلا كنتيجة ثانوية لتعقيد الصيغة و كونه مقصودًا. فالواقع أن الصعوبة البالغة لتحرير وثائق PDF ليست حماية فعالة لها من التعديل\التزييف لمن يعتزم ذلك و لديه الدراية التقنية اللازمة. فالوسيلة الوحيدة الفعالة لحماية وثيقة رقمية من التزييف هي توقيعها رقميا. أمًا غير ذلك قد يُصعِّب لكنه لا يمنع.
هي نهاية المطاف
هذه نتيجة ثانوية للخصيصة السابقة. إذ يصعب استخراج محتوى الوثيقة من مكونات مختلفة؛ أيْ النصوص و الصور و الرسوم، أو تحويلها لصيغة أخرى أو إعادة استخدامها، و هو عادة ما يكون معيقًا للاستخدامات المرغوبة.

فيما عدا حالات النشر المكتبي و التصميم الطباعي، فإنْ كلّ ما سبق معيق للاستخدامات المطلوبة و في أغلب الحالات يعاكس الغرض الأصلي لناشر الوثيقة، و هو انتشار محتواها و بقاؤه متداولا لأطول مدة ممكنة.

حلول أفضل

توجد عدة مقاربات للتغلب على أوجه القصور المختلفة السابقة الذكر، و هي غير متعارضة مع النشر في صيغة PDF، إذ يمكن تطبيقها جنبا إلى جنب، لتقديم محتوى الوثائق المرغوب انتشارها و إعادة استخدامها في صيغ مفتوحة:

  • النشر على الوب بتنسيق HTML
  • في ملفات نصية بسيطة (الشهيرة بصيغة TXT)، خاصة عندما لا يكون التنسيق ضروريًّا للوثيقة
  • في صيغة الملفات المفتوحة لمعالجات النصوص Open Document Format (ODF) التي تنتجها تطبيقات LibreOffice و [wikipedia:OpenDocument_software|غيرها]]
  • توجد صيغ حديثة قياسية للكتب الرقمية، مثل ePub، تصلح لأغراض النشر على الإنترنت، تدعمها تطبيقات قارئة لكل منصات التشغيل.
  • أو حتى في صيغ معالجات كلمات مٌغلقة، و هو أسوأ الحلول

في أحيان كثيرة يكون استخدام ملفات PDF غير مطلوب من الأصل، كما في حالة الرغبة في جمع ملفات صور، مثل المسوحات الضوئية للكتب أو الوثائق، إذ من الأفضل في هذه الحالة جمع الملفات العديدة للصور في ملف واحد باستغلال المعيار المتعارف عليه لصنع كتب رقمية في صيغة CBZ (و أختها CBT)، و هي تتألف من الملفات المفردة لصور الصفحات مضغوطةً سويًّا في أرشيف ZIP أو TAR واحد مسمّى بالامتداد CBZ أو CBT [2]، و هي صيغة مفتوحة و توجد لها قارئات عديدة لكل نظم التشغيل الشائعة، بعضها حرّ.

كما قد يكون مناسبا استخدام صيغة رسومية تدعم تعدد الصفحات في ملف واحد، مثل TIFF، و هتان الأخيرتان هما الممارستان الأرشيفيتان الفُضليان.

أما في حالة كون النصوص هي المحتوى الأساسي للوثيقة، فيُمكن باستخدام بعض برمجيات معالجة PDF[3]، منها برمجية أدوبي، تضمين ملفات من أي نوع في ملفات PDF[4]، مشابها لمرفقات البريد الإلكتروني، و بهذا يمكن لأولئك المضطرين إلى إصدار ملفات PDF تضمين نسخة نصية بسيطة من محتواها في نفس الملف، و التنويه عن ذلك في موضع ظاهر في ملف PDF نفسه لتمكين الناس من استخراج المحتوى النّصي و إعادة استعماله.

من الجدير بالذكر أن برمجيات LibreOffice يمكنها إنتاج وثائق PDF تتضمن في داخلها الوثائق الأصلية في صيغة ODF مما يعني عمليا إمكان تحرير محتواها باستخدام نفس البرمجية التي أنتجتها أو برمجيات متوافقة معها. و كون ليبرأوفس برمجية حرة متاحة على نظم التشغيل الشائعة الثلاثة يقلل المشكلة كثيرًا.

ينبغي هنا كذلك التنويه إلى أنّ برمجية قراءة ملفات PDF الأشهر، أكروبات Acrobat، التي تنتجها شركة أدوبي، برمجيةٌ ضخمة اكتُشِفَت فيها على مرِّ السنين ثغرات أمنية – و لا تزال – استُغِلَّ بعضها في اختراق نظم المستخدمين، علاوة على تضخّمها و فرط إشغالها موارد النظام الحاسوبي بلا داعي، لذلك يُنصح بتجنّبها قدر الإمكان باستبدالها ببرمجيات أخرى أخفّ تؤدي الوظيفة ذاتها[5].

مصادر

  1. ISO 32000 الصادرة سنة 2008. للتفاصيل طالع wikipedia:History of the Portable Document Format (PDF)
  2. صيغة Comic Book Archive صيغة عُرفية ابتكرها هواة الكُمكس و الروايات المصوّرة، و هي في أساسها ملف أرشيف أو مضغوط في إحدى الصيغ الشائعة. للمزيد من التفاصيل طالع مقالة ويكيبيديا الإنجليزية Wikipedia:Comic book archive
  3. من أمثلة هذه البرمجيات PDF Chain للنظام لينكس
  4. يوجد شرح عام لهذه الوظيفة في What do we mean by “embedded” files in PDF? - Open Preservation Foundation و تفاصيلها مشروحة في المواصفة ISO 32000.
  5. مثل سومطرة، البرمجية الحُرة مفتوحة المصدر، أو غيرها