الفرق بين المراجعتين ل"عن صيغة PDF"

من ويكي أضِف
اذهب إلى التنقل اذهب إلى البحث
(جوجل يقدر يبحث في نصوص بعض ملفات PDF على ما يبدو)
(صياغة)
سطر 17: سطر 17:
 
* أو حتى في صيغ معالجات كلمات شائعة تجارية، و هو أسوأ الحلول
 
* أو حتى في صيغ معالجات كلمات شائعة تجارية، و هو أسوأ الحلول
 
* توجد صيغ حديثة قياسية للكتب الرقمية، مثل [[Wikipedia:en:EPUB|ePub]]، تصلح لأغراض النشر على الإنترنت، مدعومة في قارئات لكل منصات التشغيل.
 
* توجد صيغ حديثة قياسية للكتب الرقمية، مثل [[Wikipedia:en:EPUB|ePub]]، تصلح لأغراض النشر على الإنترنت، مدعومة في قارئات لكل منصات التشغيل.
 +
 +
في أحيان كثيرة يكون استخدام ملفات PDF غير مطلوب من الأصل، كما في حالة الرغبة في جمع ملفات صور، مثل المسوحات الضوئية للكتب أو الوثائق، إذ من الأفضل في هذه الحالة جمع الملفات العديدة للصور في ملف واحد، باستغلال المعيار المتعارف عليه لصنع كتب رقمية في صيغة CBZ (و أختها CBT)، و هي تتألف من الملفات المفردة لصور الصفحات مضغوطةً في أرشيف ZIP أو TAR واحد مسمّى بالامتداد CBZ أو CBT <ref>صيغة Comic Book Archive صيغة عُرفية ابتكرها هواة الكُمكس و الروايات المصوّرة، و هي في أساسها ملف أرشيف أو مضغوط في إحدى الصيغ الشائعة. للمزيد من التفاصيل طالع مقالة ويكيبيديا الإنجليزية [[Wikipedia:Comic book archive]]</ref>، و هي صيغة مفتوحة و توجد لها قارئات عديدة لكل نظم التشغيل الشائعة، بعضها حرّ.
 +
 +
كما قد يكون مناسبا استخدام صيغة رسومية تدعم تعدد الصفحات في ملف واحد، مثل TIFF، و هتان الأخيرتان هما [[بروتوكول_للمسح_الضوئي_للوثائق|الممارستان الأرشيفيتان الفُضليان]].
 +
 +
أما في حالة كون النصوص هي المحتوى الأساسي للوثيقة، فيُمكن باستخدام بعض برمجيات معالجة PDF<ref>من أمثلة هذه البرمجيات [http://pdfchain.sourceforge.net PDF Chain للنظام لينكس]</ref>، منها برمجية أدوبي، تضمين ملفات في ملفات PDF<ref>يوجد شرح عام لهذه الوطيفة في [http://openpreservation.org/blog/2013/01/09/what-do-we-mean-embedded-files-pdf What do we mean by “embedded” files in PDF? - Open Preservation Foundation] و تفاصيلها مشروحة في المواصفة ISO 32000.</ref>، مشابها لمرفقات البريد الإلكتروني، و هذا يمكّن أولئك المضطرين إلى إصدار ملفات PDF من '''تضمين نسخة نصية بسيطة من محتواها في نفس الملف'''، و التنويه عن ذلك في موضع ظاهر في ملف PDF نفسه لتمكين الناس من استخراج المحتوى النّصي و إعادة استعماله.
  
 
'''من الجدير بالذكر''' أن [[توليد ملف PDF قابل للتحرير|برمجيات LibreOffice يمكنها إنتاج وثائق PDF تتضمن في داخلها الوثائق الأصلية في صيغة ODF]] مما يعني عمليا إمكان تحرير محتواها باستخدام نفس البرمجية التي أنتجتها أو برمجيات متوافقة معها. و كون ليبرأوفس برمجية حرة متاحة على نظم التشغيل الشائعة الثلاثة يقلل المشكلة كثيرا.
 
'''من الجدير بالذكر''' أن [[توليد ملف PDF قابل للتحرير|برمجيات LibreOffice يمكنها إنتاج وثائق PDF تتضمن في داخلها الوثائق الأصلية في صيغة ODF]] مما يعني عمليا إمكان تحرير محتواها باستخدام نفس البرمجية التي أنتجتها أو برمجيات متوافقة معها. و كون ليبرأوفس برمجية حرة متاحة على نظم التشغيل الشائعة الثلاثة يقلل المشكلة كثيرا.
  
كما يُمكن باستخدام بعض برمجيات معالجة PDF<ref>من أمثلة هذه البرمجيات [http://pdfchain.sourceforge.net PDF Chain للنظام لينكس]</ref>، منها برمجية أدوبي، تضمين ملفات في ملفات PDF<ref>يوجد شرح عام لهذه الوطيفة في [http://openpreservation.org/blog/2013/01/09/what-do-we-mean-embedded-files-pdf What do we mean by “embedded” files in PDF? - Open Preservation Foundation] و تفاصيلها مشروحة في المواصفة ISO 32000.</ref>، مشابها لمرفقات البريد الإلكتروني، و هذا يمكّن أولئك المضطرين إلى إصدار ملفات PDF من '''تضمين نسخة نصية بسيطة من محتواها في نفس الملف'''، و التنويه عن ذلك في موضع ظاهر في ملف PDF نفسه لتمكين الناس من استخراج المحتوى النّصي و إعادة استعماله.
+
ينبغي هنا كذلك التنويه إلى أنّ برمجية قراءة ملفات PDF الأشهر Adobe Acrobat التي تنتجها شركة أدوبي برمجية ضخمة اكتشفت فيها على مرّ السنوات ثغرات أمنية -- و لا تزال -- استغلّت أحيانا في اختراق نظم المستخدمين، علاوة على تضخّمها و فرط إشغالها موارد النظام الحاسوبي بلا داعي، لذلك يُنصح بتجنّبها قدر الإمكان باستبدالها ببرمجيات أخرى أخفّ تؤدي الوظيفة ذاتها، مثل [https://www.sumatrapdfreader.org/free-pdf-reader.html سومطرةالبرمجية الحُرة مفتوحة المصدر، أو [https://alternativeto.net/software/adobe-reader/?license=opensource غيرها].
 
 
في أحيان كثيرة يكون استخدام ملفات PDF غير مطلوب من الأصل، كما في حالة الرغبة في جمع ملفات صورية، مثل المسوحات الضوئية للكتب أو الوثائق، إذ من الأفضل في هذه الحالة جمع الملفات العديدة للصور في ملف واحد، باستغلال المعيار المتعارف عليه لصنع كتب رقمية تتألف من صور الصفحات المضغوطة في أرشيف ZIP أو TAR واحد مسمّى بالامتداد CBZ أو CBT <ref>صيغة Comic Book Archive صيغة عُرفية ابتكرها هواة الكُمكس و الروايات المصوّرة، و هي في أساسها ملف أرشيف أو مضغوط في إحدى الصيغ الشائعة. للمزيد من التفاصيل طالع مقالة ويكيبيديا الإنجليزية [[Wikipedia:Comic book archive]]</ref>، و هي صيغة مفتوحة و توجد لها قارئات عديدة لكل نظم التشغيل الشائعة، بعضها حرّ.
 
  
أو استخدام صيغة رسومية تدعم تعدد الصفحات في ملف واحد، مثل TIFF، و هتان الأخيرتان هما الممارستان الأرشيفيتان الفُضليان.
 
  
 
== ما هي أصلا؟ ==
 
== ما هي أصلا؟ ==
صيغة [[wikipedia:en:Portable Document Format|Portable Document Format]] (تختصر PDF) صيغة ملفات رقمية مشتقة من  لغة البرمجة PostScript المصممة لوصف الرسوميات و التي يشيع استخدامها لإنشاء وثائق للطباعة، و لأغراض رسومية أخرى. و كلتا المواصفتين أنتجتهما شركة أدوبي، و كلاهما معيار
+
صيغة [[wikipedia:en:Portable Document Format|Portable Document Format]] (تختصر PDF) صيغة ملفات رقمية مشتقة من  لغة البرمجة PostScript المصممة لوصف الرسوميات و التي يشيع استخدامها لإنشاء وثائق للطباعة، و لأغراض رسومية أخرى. و كلتا المواصفتين أنتجتهما شركة أدوبي.
  
 
== مصادر ==
 
== مصادر ==

مراجعة 17:11، 16 ديسمبر 2020

تفيد صيغة الملفات PDF في إنتاج وثائق ذات هيئة معيّنة لا تتغير باختلاف البرمجيات المستخدمة في عرضها أو العتاد أو نظم التشغيل، و كصيغة للطباعة.

و برغم شيوع استخدامها لهذه الأغراض كصيغة فرضت نفسها عمليا لسنوات قبل أن تفتحها شركة أدوبي لتتحول إلى مواصفة قياسية[1] فإن لصيغة PDF عيوبا عدة:

بالغة التعقيد
تحمل عبئا موروثا من التقلبات و التغيرات في تصميمها و التضخّم في الوظائف نادرة الاستخدام. تقريبا لا توجد تطبيقات برمجية للمواصفة كلّها في تطبيقات الإنتاج أو العرض.
عربيتها معطوبة
إذا كان استخرج النصوص من وثائق PDF صعبا عموما في اللغات المكتوبة بالحرف اللاتيني، فإنه يكاد يكون مستحيلا من الوثائق العربية بسبب الترميز غير القياسي للمحارف العربية و أن النصوص أحيانا لا تُرمّز كمحارف بل كرسوم، خصوصا في الوثائق المنتجة ببرمجيات قديمة. مما يعني عمليا أن استخراج النصوص منها يتطلب إعادة إدخالها يدويا. فأي رقمية و أي حوسبة!
يصعب البحث فيها
للأسباب السابقة، يصعب البحث النصّي في وثائق PDF العربية. لذلك قّلما تظهر نتائج من محتويات وثائق PDF عربية في محركات البحث في الوِب.
غير قابلة للتحرير
إلا في حدود ضيقة باستخدام برمجيات غير شائعة. أحيانا تُرى هذه الخصيصة كميزة، عند رغبة المؤلف في إنتاج وثيقة نهائية للمطالعة فقط و الحول دون تغيير محتواها عمدا أو سهوا. لكن ينبغي التمييز بين كون هذا حاصلا كنتيجة ثانوية لتعقيد الصيغة و كونه مقصودا. فالواقع أن الصعوبة البالغة لتحرير وثائق PDF ليست حماية فعالة لها من التعديل\التزييف لمن يعتزم ذلك و لديه الدراية التقنية اللازمة. فالوسيلة الوحيدة الفعالة لحماية وثيقة رقمية من التزييف هي توقيعها رقميا. غير ذلك قد يصعب لكنه لا يمنع.
هي نهاية المطاف
هذه نتيجة ثانوية للخصيصة السابقة. إذ يصعب استخراج محتوى الوثيقة من مكونات مختلفة؛ أي النصوص و الصور و الرسوم، أو تحويلها لصيغة أخرى أو إعادة استخدامها، و هو عادة ما يكون معيقا للاستخدامات المرغوبة.

فيما عدا حالات النشر المكتبي و التصميم الطباعي، فإن كل ما سبق معيق للاستخدامات المطلوبة و في أغلب الحالات يعاكس الغرض الأصلي لناشر الوثيقة، و هو انتشار محتواها و بقاؤه متداولا لأطول مدة ممكنة.

حلول أفضل

توجد عدة مقاربات للتغلب على أوجه القصور المختلفة السابقة الذكر، و هي غير متعارضة مع النشر في صيغة PDF، إذ يمكن تطبيقها جنبا إلى جنب، لتقديم محتوى الوثائق المرغوب انتشارها و إعادة استخدامها في صيغ مفتوحة:

  • نشر نصوص التقارير و الكتب الرقمية على الوب بتنسيق HTML
  • في ملفات نصية بسيطة (الشهيرة بصيغة TXT)، خاصة عندما لا يكون التنسيق الغني مطلبا لا غنى عنه للوثيقة
  • في صيغة قياسية مثل ODF التي تنتجها تطبيقات LibreOffice و غيره
  • أو حتى في صيغ معالجات كلمات شائعة تجارية، و هو أسوأ الحلول
  • توجد صيغ حديثة قياسية للكتب الرقمية، مثل ePub، تصلح لأغراض النشر على الإنترنت، مدعومة في قارئات لكل منصات التشغيل.

في أحيان كثيرة يكون استخدام ملفات PDF غير مطلوب من الأصل، كما في حالة الرغبة في جمع ملفات صور، مثل المسوحات الضوئية للكتب أو الوثائق، إذ من الأفضل في هذه الحالة جمع الملفات العديدة للصور في ملف واحد، باستغلال المعيار المتعارف عليه لصنع كتب رقمية في صيغة CBZ (و أختها CBT)، و هي تتألف من الملفات المفردة لصور الصفحات مضغوطةً في أرشيف ZIP أو TAR واحد مسمّى بالامتداد CBZ أو CBT [2]، و هي صيغة مفتوحة و توجد لها قارئات عديدة لكل نظم التشغيل الشائعة، بعضها حرّ.

كما قد يكون مناسبا استخدام صيغة رسومية تدعم تعدد الصفحات في ملف واحد، مثل TIFF، و هتان الأخيرتان هما الممارستان الأرشيفيتان الفُضليان.

أما في حالة كون النصوص هي المحتوى الأساسي للوثيقة، فيُمكن باستخدام بعض برمجيات معالجة PDF[3]، منها برمجية أدوبي، تضمين ملفات في ملفات PDF[4]، مشابها لمرفقات البريد الإلكتروني، و هذا يمكّن أولئك المضطرين إلى إصدار ملفات PDF من تضمين نسخة نصية بسيطة من محتواها في نفس الملف، و التنويه عن ذلك في موضع ظاهر في ملف PDF نفسه لتمكين الناس من استخراج المحتوى النّصي و إعادة استعماله.

من الجدير بالذكر أن برمجيات LibreOffice يمكنها إنتاج وثائق PDF تتضمن في داخلها الوثائق الأصلية في صيغة ODF مما يعني عمليا إمكان تحرير محتواها باستخدام نفس البرمجية التي أنتجتها أو برمجيات متوافقة معها. و كون ليبرأوفس برمجية حرة متاحة على نظم التشغيل الشائعة الثلاثة يقلل المشكلة كثيرا.

ينبغي هنا كذلك التنويه إلى أنّ برمجية قراءة ملفات PDF الأشهر Adobe Acrobat التي تنتجها شركة أدوبي برمجية ضخمة اكتشفت فيها على مرّ السنوات ثغرات أمنية -- و لا تزال -- استغلّت أحيانا في اختراق نظم المستخدمين، علاوة على تضخّمها و فرط إشغالها موارد النظام الحاسوبي بلا داعي، لذلك يُنصح بتجنّبها قدر الإمكان باستبدالها ببرمجيات أخرى أخفّ تؤدي الوظيفة ذاتها، مثل سومطرة، البرمجية الحُرة مفتوحة المصدر، أو غيرها.


ما هي أصلا؟

صيغة Portable Document Format (تختصر PDF) صيغة ملفات رقمية مشتقة من لغة البرمجة PostScript المصممة لوصف الرسوميات و التي يشيع استخدامها لإنشاء وثائق للطباعة، و لأغراض رسومية أخرى. و كلتا المواصفتين أنتجتهما شركة أدوبي.

مصادر

  1. ISO 32000 الصادرة سنة 2008. للتفاصيل طالع wikipedia:History of the Portable Document Format (PDF)
  2. صيغة Comic Book Archive صيغة عُرفية ابتكرها هواة الكُمكس و الروايات المصوّرة، و هي في أساسها ملف أرشيف أو مضغوط في إحدى الصيغ الشائعة. للمزيد من التفاصيل طالع مقالة ويكيبيديا الإنجليزية Wikipedia:Comic book archive
  3. من أمثلة هذه البرمجيات PDF Chain للنظام لينكس
  4. يوجد شرح عام لهذه الوطيفة في What do we mean by “embedded” files in PDF? - Open Preservation Foundation و تفاصيلها مشروحة في المواصفة ISO 32000.