القائمة البريديةhttp://www.nashiri.net/images/stories/contact_icon.png

الخوارزمي: افهم وتفاعل مع العربية

Write e-mail طباعة

Nashiri.Net
التاريخViews التعليقات
Total47583
الجمعة. 1810
الأحد. 1310
الخميس. 1010
الأربعاء. 0940
الإثنين. 0730

يحكى أن مستخدمًا عربيًا جلس أمام شاشة حاسوبه متلهفًا للحصول على معلومة ما بالعربية من خلال أحد محركات البحث، أحضر مشروبه المفضل توطئة لعملية بحث سوف تطول مدتها -كالعادة- حتى يصل لمراده بصورة دقيقة، ثم أدخل كلمة/جملة البحث المفتاحية وضغط على "بحث" فماذا حدث؟

جاءته النتائج على استحياء ولم تقل له إن أبيها يدعوه لأنه -أبيها- ليس عربيا، فتساءل ممتعضا إن كان الأب غير عربي أوليس الجدُ عربيًا؟ أين أنت يا جدي الخوارزمي؟ أليس من المؤسف ألا يكون للعربية محركًا متخصصًا وأنت من اخترعت الخوارزميات Algorithms التي تعمل عليها محركات البحث الأخرى؟

 

حسُن، لا أؤمن باستحضار الأرواح؛ فجدّنا الخوارزمي -رحمة الله عليه- قد وُري الثرى بعدما أدى ما عليه، فماذا عنا؟ أبشر أيها الصديق العربي؛ فإن الخوارزمي قد عاد من جديد لكن في صورة عصرية تتناسب مع معطيات القرن الحادي والعشرين، والخوارزمي المقصود في قرننا هذا هو الاسم الذي أطلقه دكتور مهندس حسام الدين محجوب على وليده الجديد ليعتمد حلاً دقيقًا لموضوع شكوى مستخدمنا من خلال تطبيق محرك البحث العربي المتطور.

 

كما نعلم، تختلف العربية عن اللاتينية في خصائص عدة أهمها الاشتقاق والحركات الإعرابية، وهذا تحديدا هو ما تفتقر إليه محركات البحث الحالية، لذلك يعتمد محرك الخوارزمي -وهو ثمرة جهود خمس عشر عاما أو يزيد من العمل الدءوب- على تقنيات تفهم العربية وتتفاعل معها ألا وهي "التحليل الصرفي" Morphological Analysis والتي تعني ببساطة التعامل مع كلمة البحث من خلال العودة لجذرها اللغوي للحصول على تصريفاتها بغية الوصول إلى النتائج المطلوبة في وقت قليل وبصورة دقيقة.

 

طلاسم؟ إذًا بالمثال يتضح المقال؛ أنت تريد البحث عن كلمة "اجتماع" في موقع ما:

  • محركات البحث العادية سوف تعطيك نتائج مثل (اجتماع - الاجتماع - الاجتماعات) إن وجدت في النص؛
  • الخوارزمي سوف يعطيك نتائج معتمدة على جذر الكلمة [ج.م.ع] مثل (جَمَعَ - أجْمَعَ - اجتَمَعَ - إجماع - جماعة - اجتماع - اجتماعية - جمعية، إلخ) إن وجدت في النص.

 

لمزيد من الدقة وحصرًا لنطاق البحث، فلا يقتصر البحث بالتحليل الصرفي بل يتعداه إلى البحث بالمعنى الذي يريده المستخدم، ثم يقوم المحرك بالبحث الصرفي بناء على ما حدده المستخدم بالمعنى سابقا.

 

طلاسم مرة أخرى؟ إذًا بالمثال يتضح المقال؛ أنت تريد البحث عن جملة "الفن الحديث" في موقع ما:

  • محركات البحث العادية سوف تعطيك نتائج معتمدة على الكلمتين مثل (فن – حديث - الفن - الحديث - فن حديث - الفن الحديث) أي في صورة متفرقة؛
  • أما الخوارزمي فيجب عليك أولا تحديد المعنى الذي تريده: هل تريد البحث عن كلمة "حديث" بمعنى (جديد) أم تريدها بمعنى (الكلام)؟ اختيارك للمعنى هو الذي يحدد للمحرك الخطوة التالية للبحث إما بالصيغة الصرفية لمعنى (الكلام) أو (الجديد).

 

يعني هذا -ببساطة- أنه في حال اختيارك للبحث عن "حديث" بمعنى (الكلام) فإن الجملة المفتاحية التي أدخلتها لن تظهر في نتائج البحث، لأنه لا يوجد شيء يسمى الفن الكلام أو أي مشتق من مشتقات الكلام، لذا سوف تقتصر نتائج بحث على جمل مثل "في المتحف قال المتحدثون الرسميون عن مجلس الإدارة"، ولن تظهر في تلكم النتائج جُمَلا مثل "وضعت الوزارة خطة لتحديث الحيّ".

 

هذا عن تطبيقات الويب لمديري المواقع العربية، فماذا إذًا عن تطبيقات المحرك في الشركات والمؤسسات (Enterprises)؟ حدث ولا حرج؛ ففي المؤسسات التي تعتمد على ُنظم إدارة الوثائق  Document Management Systems -مثل دور النشر، المكتبات، المؤسسات الصحافية- يقوم المحرك أولا بفهرسة وثائقك العربية بأنماطها المختلفة مثل "HTML،PDF ،TXT ، RTF" مع دعم كامل لتقنية اليونيكود -Unicode- ثم يبحث فيها داخل الشبكة المحلية باعتماد تقنية محرك الويب، كما يمكنه فهرسة كل قسم على حدة (دوريات ثقافية - دوريات أدبية - أخبار سياسية - أخبار علمية) مع الإدارة الكاملة لتلكم الفهارس: إضافة/حذف/دمج.

 

لا يستوي الحديث -بمعنى الكلام- عن التقنية بدون الحديث عن مخترعها كي ُنعطِ كل ذي حق حقه؛ دكتور حسام محجوب هو من أوائل الذين عملوا في مجال تطبيقات حاسوب IBM بالعربية وملحقاته في ثمانينيات وتسعينيات القرن الماضي ببريطانيا ثم بمصر، كما عمل على تطوير المدقق الإملائي العربي لطاقم النشر لبرنامج الوثائق "أوفيس 97"، بالإضافة إلي عمله في تطوير معاجم إلكترونية لمؤسسة سابقة بالمملكة العربية السعودية مثل "المكنز الكبير"، "المعجم الموسوعي لألفاظ القرآن الكريم وقراءاته"، "معجم اللغة العربية المعاصرة" وأخيرا -وليس آخرا إن شاء الرحمن- محرك البحث "الخوارزمي" الذي يعرف اختصارا باسم "KSearch".

 

ختاما: هذا المقال ليس خيالا علميا بل هو شرح ميسر لا يوفي حق مجهود فريق عربي متكامل يعي أهمية لغة الضاد على رأسه دكتور حسام الدين محجوب والأستاذ محمد جمال جزاهم ربي عنا خيرا ويستطيع مطورو المواقع العربية وكذا أصحاب المؤسسات المعنية بهذا الأمر التواصل معهم من خلال رابط الشركة

http://www.alkhawarizmy.com

هشام ماجد




الاسم الأدبي: هشام ماجد

الاسم الثلاثي: هشام محمد ماجد محمود

تاريخ الميلاد: 1 – يناير – 1977

الجنسية: مصري

تابع القراءة >>


Related Articles:


تعليقات عبر الفيسبُك

التعليقات  

 
0 #1 بشير بساطة 2007-10-21 15:33
بارك الله فيك أخي هشام وفي هذا الشرح الوافي ، لهذا المشروع العملاق
أشعر أننا لانزال بخير طالما أن هناك من يدرك أن لغته تستحق مشاريعاً كهذه.

دخلت للموقع ولم أعرف من أين أبحث عن كلمة؟ هل لي بتوضيح لو تكرمت ؟

بشير
اقتباس | Report to administrator
 
 
0 #2 هشام ماجد 2007-10-22 06:40
بارك الله فيك يا بشير، وأتفق معك فيما قلت تماما.

تستطيع تجربة المحرك من خلال رابط "النسخة التجريبية"، للتسهيل
http://www.alkhawarizmy.com/ar/ksearch_demo.html
أو
http://www.alkhawarizmy.com/en/ksearch_demo.html

هشام
اقتباس | Report to administrator
 
 
0 #3 زوزو 2008-12-10 01:37
this is a good aidea for this book
اقتباس | Report to administrator
 

أضف تعليقا


Security code
تحديث


© جميع الحقوق محفوظة، دار ناشري للنشر الإلكتروني 2003-2012م، 1424-1433 هـ.
رقم الإيداع في مكتبة الكويت الوطنية:  2008 / 306-4
الآراء المنشورة والممهورة بأسماء كاتبيها لا تعبر بالضرورة على رأي دار ناشري. لمزيد من المعلومات، يرجى قراءة إخلاء المسؤولية.

جَوَائـِـــز:

http://www.nashiri.net/images/stories/award2008.jpg