كيف تمت برمجة محرك البحث عن الصور؟
مرسل: الخميس 22 يوليو 2021, الساعة 12:01
السبب
ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
لاحظنا أن معظم المواقع، المختصة برقمنة القواميس العربية، لا تهتم كثيرا بإدراج الصور المناسبة لشرح بعض معاني الأسماء المستعصية. فلنقل مثلا أن الموقع قادر على أن يقول لك أن الصنوبر شجر والكوسج سمك وسوسن نبات والدعسوقة حشرة والبوم طائر والببر حيوان وهلم جرا ... لكن ليس كل الناس قادرين على تصور هيئة المخلوق ذهنيا. ومن هنا، وجب بناء محرك بحث حقيقي عن الصور ليساعد على هذه المهمة.
الرموز الصورية
ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
استخدم أي محرك بحث تشاء على الإنترنت، فسيفشل حثما في إيجاد الصور المناسبة لبعض الكلمات؛ وهذا أمر طبيعي جدا. وما محرك البحث عن الصور في العنقاء إلا واحدا من هذا القبيل. ومع ذلك، فستجد أن نظام آخر للترميز في العنقاء سيساعدك برموز صورية مختلفة ليخبرك عن نوع الكلمة، أهي شجر أم نبات أم حشرة أم حيوان أم سمك أم طائر وهكذا ذواليك... وقد تكون الكلمة اسما لنوعين من المخلوقات، خذ مثلا على ذلك كلمة العقرب.
وليكن في علمك أن منظومة الترميز هذه قادرة على التعرف وترميز عدد هائل من الكلمات داخل النصوص. وهذه الميزة تساعد محرك البحث عن الصور لحصر نطاق البحث وبالتالي تسريعه.
مصادر الصور
ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
محرك البحث عن الصور ما زال في نسخته التجريبية. ونريد أن نوسع قدرته ليشمل كافة المواقع على الإنترنت. ولكنه الآن منحصر على مسح رقمي للصور في موسوعة ويكيبيديا. فمن هنا نقول أن معظم الصور لا نمتلكها، بل هي نتاج بحث، وشأن محركنا في البحث عن الصور شأن محركات البحث الأخرى كـ google و bing الأمريكيين و baidu الصيني و yandex الروسي و duckduckgo. وسنقوم بتحسين إبراز مصادر كل صورة في القريب العاجل إن شاء الله.
محرك الصور عمليا
ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
محرك البحث عن الصور ذو كفاءة كبيرة في البحث عنها في مختلف مجالاتها. لكننا حصرنا عمله بنظام الترميز في العنقاء ليكون أدق في الأداء. فعند بحثك عن كلمة ما، ستتولى العنقاء ترميز الكلمات والجمل، ومن ثم ينطلق محرك البحث بمسح رقمي للنص واستجلاب الصور المناسبة له. وإليك في ما يلي باقة من البحث:
في مجال الحشرات: عقرب، دعسوقة، يعسوب، شبث...
في مجال الطيـــور: عقاب، صقر، قرلى، ببغاء...
في مجال النبـاتـات: عرفج، نسرين، سوسن، آس...
في مجال البحــــار: عنبر، لخم، سلمون،رعاد...
في مجال الثديـــات: ببر، فهد، سنور، ضأن...
بل وفي مجالات أخرى كالتعرف على الأشجار والجبال والأنهار والكواكب والأحجار الكريمة والمعادن وغيرها.
محرك البحث عن الصور في هندسة العنقاء
ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
يعتبر محرك البحث عن الصور جزءا شبه أساسيا في هندسة نظام العنقاء، وعلينا تحديث كفاءته بين الفينة والأخرى؛ وهذا سيكون من خلال المسح الرقمي للشبكة العنكبوتية العالمية واستخلاص الصور المناسبة منها. وقد قمنا بربطه بالقاموس التأثيلي أيضا عسى أن يكون نفعا لمن يهمه الأمر. ولعلنا نربطه بأنواع أخرى من القواميس الأخرى لا سيما القاموس التاريخي للغة العربية إن شاء الله.
برمجة محرك البحث عن الصور ليست صعبة؛ فما عليك إلا ان تبني زاحفا رقميا (web crawler) ليقوم بالسفر عبر شبكة الأنترنت، أو زيارة مواقع إلكترونية محددة واستخلاص المعلومات عن الصور فيها؛ هذا مع الأخذ بعين الاعتبار وصف الصورة إذا كان موجودا في صفحة الويب. يتم جمع هذه المعلومات في قاعدة بيانات وعليك تحديثها بشكل دوري.
كما لا تنسى أن تخزين الصور كلها في قاعدة البيانات أمر مكلف للغاية. وعليه، فسيكون من النفع تحويل الصور إلى متجهات عددية باستخدام إحدى الخوارزميات المختصة بهذا المجال. وننصح بنماذج من التعلم العميق (deep learning) في ما يمسى بـالذكاء الاصطناعي. ورغم أننا لم نُفَعِّلْه في العنقاء 100%، إلا أنه في قائمة الانتظار لعل وعسى نجد له الوقت الكافي إن شاء الله. وعلى كل، فقد استعنا بخوارزميات بحث بسيطة في قاعدة البيانات، وقد كفتنا الغرض، ولله الحمد.
الخلاصة
ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
هل تعرف مبيانات أخرى أفضل لدراسة الكلمات واللغة؟ أم عندك بعضا من الأفكار لتطوير منظومة الإنغرام، المهم شاركنا بها لتطوير العنقاء.
ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
لاحظنا أن معظم المواقع، المختصة برقمنة القواميس العربية، لا تهتم كثيرا بإدراج الصور المناسبة لشرح بعض معاني الأسماء المستعصية. فلنقل مثلا أن الموقع قادر على أن يقول لك أن الصنوبر شجر والكوسج سمك وسوسن نبات والدعسوقة حشرة والبوم طائر والببر حيوان وهلم جرا ... لكن ليس كل الناس قادرين على تصور هيئة المخلوق ذهنيا. ومن هنا، وجب بناء محرك بحث حقيقي عن الصور ليساعد على هذه المهمة.
الرموز الصورية
ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
استخدم أي محرك بحث تشاء على الإنترنت، فسيفشل حثما في إيجاد الصور المناسبة لبعض الكلمات؛ وهذا أمر طبيعي جدا. وما محرك البحث عن الصور في العنقاء إلا واحدا من هذا القبيل. ومع ذلك، فستجد أن نظام آخر للترميز في العنقاء سيساعدك برموز صورية مختلفة ليخبرك عن نوع الكلمة، أهي شجر أم نبات أم حشرة أم حيوان أم سمك أم طائر وهكذا ذواليك... وقد تكون الكلمة اسما لنوعين من المخلوقات، خذ مثلا على ذلك كلمة العقرب.
وليكن في علمك أن منظومة الترميز هذه قادرة على التعرف وترميز عدد هائل من الكلمات داخل النصوص. وهذه الميزة تساعد محرك البحث عن الصور لحصر نطاق البحث وبالتالي تسريعه.
مصادر الصور
ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
محرك البحث عن الصور ما زال في نسخته التجريبية. ونريد أن نوسع قدرته ليشمل كافة المواقع على الإنترنت. ولكنه الآن منحصر على مسح رقمي للصور في موسوعة ويكيبيديا. فمن هنا نقول أن معظم الصور لا نمتلكها، بل هي نتاج بحث، وشأن محركنا في البحث عن الصور شأن محركات البحث الأخرى كـ google و bing الأمريكيين و baidu الصيني و yandex الروسي و duckduckgo. وسنقوم بتحسين إبراز مصادر كل صورة في القريب العاجل إن شاء الله.
محرك الصور عمليا
ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
محرك البحث عن الصور ذو كفاءة كبيرة في البحث عنها في مختلف مجالاتها. لكننا حصرنا عمله بنظام الترميز في العنقاء ليكون أدق في الأداء. فعند بحثك عن كلمة ما، ستتولى العنقاء ترميز الكلمات والجمل، ومن ثم ينطلق محرك البحث بمسح رقمي للنص واستجلاب الصور المناسبة له. وإليك في ما يلي باقة من البحث:
في مجال الحشرات: عقرب، دعسوقة، يعسوب، شبث...
في مجال الطيـــور: عقاب، صقر، قرلى، ببغاء...
في مجال النبـاتـات: عرفج، نسرين، سوسن، آس...
في مجال البحــــار: عنبر، لخم، سلمون،رعاد...
في مجال الثديـــات: ببر، فهد، سنور، ضأن...
بل وفي مجالات أخرى كالتعرف على الأشجار والجبال والأنهار والكواكب والأحجار الكريمة والمعادن وغيرها.
محرك البحث عن الصور في هندسة العنقاء
ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
يعتبر محرك البحث عن الصور جزءا شبه أساسيا في هندسة نظام العنقاء، وعلينا تحديث كفاءته بين الفينة والأخرى؛ وهذا سيكون من خلال المسح الرقمي للشبكة العنكبوتية العالمية واستخلاص الصور المناسبة منها. وقد قمنا بربطه بالقاموس التأثيلي أيضا عسى أن يكون نفعا لمن يهمه الأمر. ولعلنا نربطه بأنواع أخرى من القواميس الأخرى لا سيما القاموس التاريخي للغة العربية إن شاء الله.
برمجة محرك البحث عن الصور ليست صعبة؛ فما عليك إلا ان تبني زاحفا رقميا (web crawler) ليقوم بالسفر عبر شبكة الأنترنت، أو زيارة مواقع إلكترونية محددة واستخلاص المعلومات عن الصور فيها؛ هذا مع الأخذ بعين الاعتبار وصف الصورة إذا كان موجودا في صفحة الويب. يتم جمع هذه المعلومات في قاعدة بيانات وعليك تحديثها بشكل دوري.
كما لا تنسى أن تخزين الصور كلها في قاعدة البيانات أمر مكلف للغاية. وعليه، فسيكون من النفع تحويل الصور إلى متجهات عددية باستخدام إحدى الخوارزميات المختصة بهذا المجال. وننصح بنماذج من التعلم العميق (deep learning) في ما يمسى بـالذكاء الاصطناعي. ورغم أننا لم نُفَعِّلْه في العنقاء 100%، إلا أنه في قائمة الانتظار لعل وعسى نجد له الوقت الكافي إن شاء الله. وعلى كل، فقد استعنا بخوارزميات بحث بسيطة في قاعدة البيانات، وقد كفتنا الغرض، ولله الحمد.
الخلاصة
ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
هل تعرف مبيانات أخرى أفضل لدراسة الكلمات واللغة؟ أم عندك بعضا من الأفكار لتطوير منظومة الإنغرام، المهم شاركنا بها لتطوير العنقاء.