تم الاندماج مع الموقع الرسمي لمشروع المكتبة الشاملة وقد يتم الاستغناء عن هذا النطاق قريبا

فصول الكتاب

ـ[حسين بن محمد]ــــــــ[17 - 06 - 08, 11:15 ص]ـ

السلام عليكم ورحمة الله وبركاته

حيى الله إخواني الكرام الأفاضل، وحيى الله أخي الطيماوي، وحفظ الله الجميع من كل سوء .. اللهم آمين ..

أحببت أن أدلو بدولي في هذا الموضوع الهام، والذي يشغل كثيرا من رواد ملتقى أهل الحديث لا سيما بعد انتشار الكتب المصورة وحاجة طلبة العلم إليها ..

أولا بخصوص مكتبة الإسكندرية:

لا أظن أن الموضوع يرتبط بنوع الماسح الضوئي لديهم، وعلى العموم هم يستخدمون عدة أنواع من الماسحات الضوئية، منها Cruse ، و Minolta وغيرهما. [انظر هنا ( http://www.bibalex.org/isis/frontend/Gallery/Gallery_Details.aspx?i=WtvSpsDmHCbIv1p3Z7BfJQ==) ] .

والصحيح أنهم - كما ذكر بعض الأخوة - يستخدمون لهذه التقنية برنامج Verus pro [ النسخة الاحترافية]، ولا يحتاجون معه غيره .. كما سيأتي في كلامنا.

ثانيا: بخصوص البحث في الكتب المصورة ..

نعم .. صحيح وحقيقة لا خيال .. البحث فيها ممكن

بخاصية Searchable image

أو تقنية ملفات pdf ذات النص المخفي

Searchable PDF Output [Image + Hidden Text] or

PDF plus hidden text

وتتلخص فكرتها بأن يتم عمل مسح وقراءة بتقنية ocr لملف pdf ، ويوضع النص في خلفية الصور في طبقة أخرى، بنفس مواقع الحروف والكلمات، ولا يظهر للقارئ إلا الصورة، ولكن عند النسخ والبحث يكون التعامل مع النص المخفي.

وهذه الإمكانية ليست جديدة، بل هي موجودة منذ فترة، بل وتجدها في برنامج Acrobat professional 7 ، ولكن لا تتيح العربية.

جرب بنفسك: عن طريق الأكروبات بروفيشونال، اصنع أو افتح أي ملف أكروبات مصور باللغة الإنجلزية، ثم من قائمة Document اختر Recognize Text Using OCR ، ثم اختر Start ، وعدل الخيارات كما يحلو لك (اكتشفها بنفسك). [يفضل التجربة على ملف قليل الصفحات حتى لا يأخذ وقتا في عملية القراءة]، ثم احفظ عملك، عن طريق أي برنامج لقراءة ملفات pdf تستطيع البحث والنسخ منه بكل سهولة ..

وفي المرفقات نموذج - عملته بنفسي - بالخطوات السابقة ..

وللتعرف أكثر على هذه الخاصية وفكرتها [انظر هنا ( http://www.data-entry-india.com/pdf-image-searchable-text-conversion-india.htm)، وهنا ( http://www.suntecindia.com/data-entry-india/pdf-image-searchable-text-conversion.htm)، وهنا ( http://www.dclab.com/pdfconversion3.asp)، وهنا ( http://www.alliancegroup.co.uk/pdf-searchable-images.htm)]

وللتعرف عليها من ملفات المساعدة للأكروبات بروفيشونال، تجدها تحت عنوان:

Converting image-only scanned pages to searchable text

أو من هنا ( http://www.tidalfire.com/acrobat-solutions/knowledgebase/hints-tips/hints.htm).

ملحوظة1: لا أدري هل يدعم القارئ الآلي هذه المزية أم لا.

ملحوظة2: لابد أن تجمتع إمكانية OCR مع searchable text في نفس البرنامج، وإلا فمحاولات وضع النص خلفية للصورة تصبح فاشلة ومعقدة وقد حاولتها مرارا فلم أفلح.

الآن نأتي للأهم

VERUS™ Professional

أما البرنامج الذي أعلمه الأفضل في مجال قراءة النص العربي فهو برنامج Verus ، والنسخة الاحترافية ( http://www.novodynamics.com/verus_pro.htm) منه تدعم خاصية Searchable PDF Output التي نحكي عنها .. ولذلك تعاقدت معه بعض المؤسسات مثل جوجل ومكتبة الإسكندرية وغيرهما .. وقد لاقى قبولا واسعا في معرض جيتكس السابق [انظر هنا ( http://www.alaswaq.net/articles/2007/09/09/10663.html)] .

ومن أهم مميزاته - كما ذكر الأخوة - هو تنقية الصورة قبل مسحها، مما يقلل نسبة الخطأ، والميزة الثانية والمهمة جدا أنه يتعرف على عدة أنواع من الخطوط العربية، ثم تأتي خاصية Searchable PDF Output والتي هي في النسخة الاحترافية منه فقط دون النسخة العادية. غير أن له قابلية للتدريب والتعليم .. وربما تفوق نتائجه القارئ الآلي ..

وهو يباع لدى شركة إنفاس (الشرق الأوسط) infas-me (http://www.infas-me.com/2007/IT/contact.htm)، ولهم وكيل بمصر والعراق أيضا.

والآن من لنا بهذا البرنامج لتجربته ... معلوم أن البرنامج يزيد ثمنه عن خمسة آلاف دولار، وربما يكون أرخص من ذلك لمن سأل وبحث. وللعلم هو أغلى البرامج في تخصصه (التعرف على النص OCR ) . يأتي بعده صخر .. واقرأ هذا الملف ( http://www.novodynamics.com/images/verus.pdf) تعرف كثيرا من إمكاناته ..


حاولت البحث على الشبكة فلم أفلح، وأظنه موجود على التورنت [وخبرتي به قليلة]، ولكن قد نجده بالبحث على موقع Torrentz.ws ، ولم أسطع أنا ذلك وليست لي خبرة كافية ولا صبر على هذا التورنت. فمن يبحث لنا في الأمر ..

ننتظركم

جزاكم الله خيرا وبارك بكم وفيكم .. ووفقنا وإياكم لكل ما يحب ويرضى .. اللهم آمين ..
¥

تعرف على الموسوعة الشاملة للتفسير