9:29 مساءً الجمعة 13 ديسمبر، 2019

اسماء محركات البحث , اشهر مواقع البحث العالمية


محرك البحث الباحوث هو برنامج حاسوبى مصمم للمساعدة في العثور على مستندات مخزنه على شبكات معلوماتيةالشبكه العنكبوتيه العالمية بالانجليزية: World Wide Web) او على حاسوب شخصي.

 

بنيت محركات البحث الاولي اعتمادا على التقنيات المستعملة في ادارة المكتبات الكلاسيكية.

 

حيث يتم بناء فهارس للمستندات تشكل قاعده للبيانات تفيد في البحث عن اي معلومة.

محركات البحث الاكثر استخداما و نسبة السيطره على محركات البحث في اوخر 2019
يسمح محرك البحث للمستخدم ان يطلب المحتوي الذى يقابل معايير محدده والقاعده فيها تلك التي تحتوى على كلمه او عبارة ما و يستدعى قائمة بالمراجع توافق تلك المعايير.

 

تستخدم محركات البحث مؤشرات/فهارس/مسارد منتظمه التحديث لتشتغل بسرعه و فعالية.
تعرض النتائج على شكل قائمة بعناوين المستندات التي توافق الطلب.

 

يرفق بالعناوين في الغالب مختصر عن المستند المشار الية او مقتطف منه للداله على موافقتة للبحث.

 

ترتب عناصر قائمة البحث على حسب معايير خاصة قد تختلف من محرك لاخر)،

 

من اهمها مدي موافقه كل عنصر للطلب.
عند الحديث عن محركات البحث فغالبا ما يقصد محركات البحث على شبكه الانترنت و محركات الويب بالخصوص.

 

محركات البحث في الويب تبحث عن المعلومات على الشبكه العنكبوتيه العالمية،

 

و منها يستعمل على نطاق ضيق يشمل البحث داخل الشبكات المحليه للمؤسسات اي انترانت بالانجليزية: Intranet).

 

اما محركات البحث الشخصيه فتبحث في الحواسيب الشخصيه الفردية.
بعض محركات البحث ايضا تحفر في البيانات المتاحه على المجموعات الاخبارية،

 

و قواعد البيانات الضخمة،

 

او ادله مواقع الوب مثل دموز دوت اورج.
محتويات [اخف] 1 تاريخ
2 اشهر محركات البحث
3 كيف تعمل محركات البحث
4 محركات البحث على الشبكه الانترنت
5 مشاكل تقنيات البحث
5.1 عدم طرح الاسئله الصحيحة
5.2 فجوه المفردات
5.3 الموازنه بين الكم و النوع
5.4 غموض الكلمات
5.5 الاسماء و انواعها
6 المعالجه الطبيعية للغة
6.1 دراسه الجمل
6.2 ازاله الالتباس: اختيار المعنى الصحيح
6.3 التصنيف التلقائي
6.4 زياده دقه الاستعلامات
6.5 ربط المفاهيم
7 الصورة الحالية
7.1 ايكساليد Exalead
7.2 انفراسيرتش Infrasearch
7.3 غوغل
7.4 اسك Ask
7.5 اوبن كولا OpenCola
7.6 اوتونومى Autonomy
7.7 بريموس Primus
8 المستقبل
8.1 تطبيقات مستقبلية
8.2 محركات البحث عربيا
9 انظر ايضا
10 ارتباطات خارجية
تاريخ[عدل] اول محرك بحث كان و اندكس بالانجليزية: Wandex [بحاجة لمصدر]،

 

و هو فهرس جمعة متجول و ب و هو زاحف عنكبوتى بالانجليزية: web crawler طورة ما ثيو جراى في معهد ما ساشوستس للتكنولوجيا MIT في 1993.

 

و يعد اليوب بالانجليزية: Aliweb محرك بحث اخر مبكر جدا و قد ظهر في 1993 و يعمل حتى اليوم.

 

و اول محرك بحث قائم على الزاحف العنكبوتى للنصوص الكاملة كان و بكراولر بالانجليزية: WebCrawler)،

 

و الذى خرج للوجود في 1994.

 

و على عكس سابقيه،

 

فقد ترك المستخدمين يبحثون عن اي كلمه على اي صفحة و يب،

 

و هو ما صار القاعده لكل محركات البحث الكبري منذ ذلك الوقت.

 

كان هو ايضا الاول في معرفه الجمهور به على نطاق و اسع.

 

فى 1994 كذلك جاء لايكوس بالانجليزية: Lycos الذى بدا في جامعة كارنيجى ميلون بالانجليزية: Carnegie Mellon University) و صار مشروعا تجاريا كبيرا.
بعد ذلك بقليل،

 

ظهر العديد من محركات البحث و تزاحمت على الشعبية.

 

و كان من ضمنها اكسايت بالانجليزية: Excite)،

 

انفوسيك بالانجليزية: Infoseek)،

 

و انكتومى بالانجليزية: Inktomi)،

 

و نورثرن لايت بالانجليزية: Northern Light)،

 

و التافيستا بالانجليزية: Alta Vista).

 

و في بعض الحالات تنافست مع الادله ذات الشعبية مثل ياهو

 

(بالانجليزية:

 

Yahoo).

 

فيما بعد،

 

ادمجت الادله او اضافت اليها تقنيه محرك البحث من اجل اداء اكبر للوظائف.
عرفت محركات البحث ايضا بكونها بعض المع النجوم في نوبه الاستثمار في الانترنت التي و قعت في اواخر التسعينات.

 

دخلت عده شركات السوق في مشهد كبير،

 

مسجله مكاسب قياسيه خلال طرح اسهمها العام الافتتاحي.

 

و قد سحب البعض محركاتهم البحثيه العامة،

 

و هم يسوقون نسخا للشركات فقط،

 

مثل نورثرن لايت التي كانت من ال8 او 9 محركات بحث المبكره بعد ان جاء لايكوس بالانجليزية: Lycos).
قبل مجيء الانترنت،

 

كانت هناك بواحيث لموافيق بروتوكولات)او استخدامات اخرى،

 

مثل محرك بحث اركى لمواقع اف‌.تي.‌بى المجهوله بالانجليزية: anonymous FTP و محرك بحث ڤيرونيكا لبروتوكول جوفر.
وستاتى بعض محركات البحث الاخرى منها اية ناين.كوم a9.com امازون.كوم)،

 

اسك چيڤيز/تيوما بالانجليزية: Ask Jeeves/Teoma)،

 

جيجابلاست،

 

سناپ بالانجليزية: Snap)،

 

و الهاللو بالانجليزية: Walhello)،

 

كازاز بالانجليزية: Kazazz)،

 

و وايسنت بالانجليزية: WiseNut).

 

و بعض اخر اخر محركات البحث،

 

و التي تبحث فقط انواعا محدده من المحتوي هي پلازو Plazoo لمردود الخلاصات RSS feeds)،

 

و جوهوك GoHook لملفات پى دى اف PDF بشكل رئيسي).

 

و من اشهر المحركات ايضا: Yooci و ThroughSearch
اشهر محركات البحث[عدل] جوجل بالانجليزية: Google)
ياهو بالانجليزية: Yahoo!)
بينج بالانجليزية: Bing)
لايف سيرش بالانجليزية: LiveSearch)
دك دك غو بالانجليزية: DuckDuckGo)
كيف تعمل محركات البحث[عدل] تعمل محركات البحث عن طريق تخزين المعلومات عن عدد كبير من صفحات الوب،

 

و التي تستعيدها من الشبكه العالمية و ورلد و ايد و ب نفسها.

 

تستعاد هذه الصفحات بواسطه زاحف و ب يعرف احيانا ايضا ب

 

عنكبوت‘ و هو مستعرض و ب الى يتبع كل رابط يراه.

 

بعد ذلك يجرى تحليل كل صفحة لتحديد كيف ينبغى فهرستها على سبيل المثال،

 

تستخلص الكلمات من العناوين،

 

رؤوس الموضوعات،

 

او حقول خاصة تعرف ب ميتا تاجز).

 

تخزن البيانات عن صفحات الوب في قاعده بيانات فهرسيه للاستخدام في عمليات البحث طلبا للمعلومات لاحقا.

 

بعض محركات البحث،

 

مثل جوجل،

 

تخزن كل او بعض الصفحة المصدر وتشير لها ب مخبوءة و بالمثل معلومات عن صفحات الوب،

 

بينما بعضها تخزن كل كلمه من كل صفحة تجدها،

 

مثل التاڤيستا.

 

هذه الصفحة المخبوءه تمسك بنص البحث الفعلى بما انه هو الذى تمت فهرستة فعليا،

 

لذا فقد تكون مفيدة جدا عندما يكون محتوي الصفحة الحاليه قد جري تحديثة و لم تعد الفاظ البحث فيه.

 

ربما تعتبر هذه المشكلة شكلا خفيفا من تعفن الروابط،

 

و تزيد معالجه جوجل لها من امكانيه الاستخدام بارضاء توقعات المستخدم بان ترد الفاظ البحث في صفحات الوب العائده في الرد.

 

و هو ما يرضى

 

مبدا مفاجاه اخف من مفاجاة‘ بما ان المستخدم يتوقع بشكل طبيعي الفاظ البحث في النتيجة العائده له.

 

و هذه الصله بالبحث تجعل هذه الصفحات المخبوءه مفيدة جدا،

 

حتى اكثر من و اقع انها قد تحتوى على بيانات ربما لم تعد متاحه في موضع اخر.
عندما يتوجة مستخدم لمحرك البحث و يجرى عملية بحث طلبا للمعلومات،

 

كما هو سائد باعطاء كلمات مفتاحية،

 

يفتش المحرك في الفهرس و يقدم قائمة بصفحات الوب الافضل توافقا تبعا لمعاييره،

 

فى المعتاد مع ملخص قصير يحتوى على عنوان الوثيقه و احيانا اجزاء من النص.

 

معظم محركات البحث تدعم استخدام الاصطلاحات البولينيه نسبة للجبر البولينى و هو نوع من المتغيرات المنطقية): AND و OR و NOT لمزيد من تحديد طلب المعلومات.

 

و هناك خدمه و ظيفيه متقدمه هي البحث بالتقارب،

 

و التي تسمح لك بتحديد المسافه بين الكلمات المفتاحية،

 

باستخدام الفاظ مثل NEAR،

 

NOT NEAR،

 

FOLLOWED BY،

 

NOT FOLLOWED BY،

 

SENTENCE،

 

FAR.
يعتمد مدي فائده محرك بحث على مدي صله النتائج التي يرد بها.

 

فبينما قد تكون هناك ملايين صفحات الوب التي تحتوى على كلمه او عبارة محددة،

 

قد تكون بعض اوثق صلة،

 

او اروج،

 

او معتمدة اكثر من غيرها.

 

معظم محركات البحث توظف اساليب لوضع مراتب النتائج لتقدم افضل النتائج اولا.

 

الكيفية التي يقرر بها محرك بحث اي الصفحات هي الافضل توافقا،

 

و ما النظام الذى يجب ان تظهر به النتائج،

 

تختلف بشكل شاسع من محرك لاخر.

 

الاساليب ايضا تتغير عبر الزمن بتغير استخدام انترنت و تكنيكات جديدة تتطور.
معظم محركات البحث هي مضاربات تجاريه يدعمها عائد اعلانى و ،

 

 

بالنتيجة،

 

يوظف البعض الممارسه المثيره للجدل بالسماح للمعلنين بدفع النقود ليرفعوا لهم قوائهم في مراتب نتائج البحث.
الاغلبيه الكاسحه من محركات البحث تديرها شركات خاصة تستخدم خوارزميات ملكها و قواعد بيانات مغلقة،

 

و اكثرها رواجا حاليا هي جوجل و باحث اماسان و ياهو.

 

توجد تقنيه محركات بحث مفتوحه المصدر مثل اتشتيدج،

 

نتش،

 

سيناز،

 

ايجوثور و اوبنافتياس،

 

و لكن ليس هناك خادم بحث و ورلد و ايد و ب مشاع يستخدم هذه التقنية.
جاء تطور محرك بحث الوب من تطور محركات البحث على شبكات الاجهزة و الشبكات الداخلية.
محركات البحث على الشبكه الانترنت[عدل] يمكننا القول بان الشبكه و مواقعها لن تكون ذات فائده كبيرة بالنسبة لنا لو لم تكن محركات البحث على انترنت موجودة.

 

فى البدء كانت محركات البحث عبارة عن ادلاء تقوم بفهرسه مواقع الانترنت الجديدة.

 

و قد كان ذلك فعالا عندما كان حجم انترنت يقدر بملايين الصفحات.

 

ثم تطورت انترنت،

 

و انضم اليها الملايين من مؤسسات الاعمال،

 

و المؤسسات الحكومية،

 

و بلايين الصفحات من ادله استخدام المنتجات،

 

و المعلومات الخاصة بالمستثمرين،

 

و غير ذلك من المعلومات التي تقوم بتسيير عجله اقتصاد انترنت.

 

و مع هذا النمو اصبح من الضروري،

 

بل و من الحتمى اضافه محرك بحث فعال الى كافه مواقع انترنت،

 

يقوم بفهرسه و تصنيف المعلومات الموجوده ضمن هذه المواقع كى تتمكن من خدمه زوارها بشكل فعال.

 

و اليوم،

 

و بعد ان اصبحت محركات البحث جزءا اساسيا في حضارتنا الانترنتية،

 

فان هناك العشرات من الشركات العامله في مجال انتاج برمجيات،

 

و تقنيات،

 

و اساليب بحث جديدة موجهه نحو انترنت و انترانت.

 

و بسبب الدور المتزايد الذى تلعبة التجاره و الاعمال الالكترونيه في اقتصاد اليوم،

 

فان الحافز المادى على الاقل موجود.

 

و لكن رغم النجاح الذى تدعى الشركات المنتجه لتقنيات البحث تحقيقه،

 

فان المستخدمين لا زالوا يشكون من افتقار محركات البحث الى الدقه المطلوبة،

 

و تلبيه النتائج التي يتم تحصيلها لمتطلبات المستخدمين
مشاكل تقنيات البحث[عدل] ان مفتاح النجاح في الحصول على نتائج بحث جيدة،

 

تكمن في نوعيه الاستفسارات،

 

او الاسئلة،

 

او العبارات او الكلمات المفتاحيه التي نقوم بادخالها في محركات البحث.

 

لكن المشكلة الاساسية هنا تكمن في ان الغالبيه العظمي من المستخدمين لا يقومون عاده بادخال الاستفسارات او الكلمات المفتاحيه الصحيحة،

 

و التي تؤدى الى الحصول على النتائج المطلوبة،

 

و سنستعرض فيما يلى المشاكل الشائعه في عالم البحث عن المعلومات،

 

و الطرق التي يحاول بها الباحثون معالجه هذه المشكلات.
عدم طرح الاسئله الصحيحة[عدل] من الحقائق الغريبة التي يؤكدها خبراء المعلومات هي ان المستخدمين نادرا ما يقومون بطرح الاسئله التي تعبر عما يريدونة فعلا.

 

و السبب الرئيس في ذلك هو الافتقار الى الفهم الصحيح للموضوع قيد البحث،

 

و بالتالي عدم استخدام الكلمات المفتاحيه الصحيحة،

 

و التي تؤدى الى تكوين استعلامات و اسئله صحيحة.

 

فالمشكلة الاساسية هنا اذا،

 

هى مساعدة المستخدمين على طرح الاسئله و تكوين الاستعلامات الصحيحة.

 

و من مظاهر هذه المشكلة ايضا هي صغر حجم الاستعلامات التي يكونها المستخدم عاده للاستفسار عن موضوع معين.

 

فاذا كان مستخدم ما يريد معلومات عن “السفر” مثلا،

 

فانة يبدا بادخال كلمه عامة في محرك البحث،

 

و من ثم،

 

و اعتمادا على النتائج التي يحصل عليها،

 

يقوم بتضييق نطاق بحثة الى ان يصل الى ما يريده.

 

و السبب في ان العديد من مستخدمى انترنت يستعملون هذا الاسلوب يكمن في انهم لا يعرفون حقا الحجم المهول للمعلومات الموجوده في قواعد البيانات الخاصة بمحركات البحث،

 

و التي تفوق عاده ما يمكن لاى انسان التعامل معه.
فجوه المفردات[عدل] تتميز معظم اللغات الطبيعية بتنوع المفردات التي تتناول نفس المعنى،

 

فمثلا السحاب،

 

الغمام،

 

المزن،

 

العارض..

 

و غيرها تدور حول نفس المعنى سحاب،

 

و بينما يدرك الانسان تطابق هذه المفردات في المعنى تعجز محركات البحث التقليديه عن استيعاب كل المرادفات الممكنة،

 

فتفتقر نتائجها الى كثير من الوثائق ذات العلاقه بموضوع البحث لكنها لم تستخدم نفس مفردات المستخدم،

 

و تسمي هذه المشكلة فجوه المفردات.
الموازنه بين الكم و النوع[عدل] عند التعامل مع تقنيات البحث فلا بد من الموازنه بين الكم و النوع،

 

او ما يدعوة الخبراء بالدقه و القدره على الاسترجاع.

 

و هي علاقه عكسيه تماما،

 

فكلما تم تضييق نطاق البحث سعيا عن نتائج اكثر دقة،

 

كلما قل مقدار البيانات الذى يمكن استرجاعه.

 

و لذلك فان هناك حاجة لوجود محركات بحث تقدم دقه عاليه دون التضحيه بمقدار النتائج “الدقيقة” التي نسترجعها.
غموض الكلمات[عدل] معظم الكلمات تحمل اكثر من معنى،

 

و معظم محركات البحث المستخدمة اليوم تقوم بمطابقه الكلمات و ليس معانيها،

 

و لذلك فان نتائج عمليات البحث التي نحصل عليها،

 

تحتوى غالبا على الكلمات المفتاحيه الصحيحة،

 

و لكنها ذات المعنى الخاطئ.

 

فاذا جربت مثلا ان تبحث عن معنى كلمه “جافا” مثلا،

 

و هي احدي لغات البرمجه الشائعه الاستخدام،

 

فانك ستحصل الكثير من النتائج المتعلقه بالجفاف،

 

او باسم جزيره اندونيسيه تحمل الاسم نفسه،

 

اضافه الى معلومات عن لغه البرمجه لانة يبحث عن البنيه الصرفيه و الشكلية للكلمه و ليس المعنى.
الاسماء و انواعها[عدل] وماذا عن البحث في الاسماء،

 

اى البحث عن معلومات عن الاشخاص و الاماكن،

 

و ما الى ذلك.

 

خصوصا وان الكتاب يغيرون عاده الطريقة التي يقومون بها بكتابة الاسماء.

 

و اذا ما تحدثنا مثلا عن اسماء الشركات،

 

فانها تتغير باستمرار نتيجة عملية الاندماج و الضم،

 

مما يجعل عملية البحث صعبة.

 

و قد يقول البعض انه يمكن التغلب على هذه المشكلة نوعا ما باستخدام برمجيات الفهرسة،

 

و لكن المشكلة هي ان المعلومات في عالمنا تتغير باستمرار مما يجعل الفهرسه اليدويه صعبة.

 

و ماذا عن الفهرسه الالية

 

الاجابه هي انه لا توجد بعد التقنيه التي يمكنها القيام بذلك بدقة،

 

بحيث يمكن التمييز مثلا بين مقال كامل عن شخص معين،

 

و مقال اخر يذكر اسم الشخص بشكل عابر.
المعالجه الطبيعية للغة[عدل] يجمع العاملون في مجال محركات البحث بان الحل لكافه هذه المشاكل يكمن في تصميم محركات البحث،

 

و برمجيات البحث عموما،

 

بحيث تستفيد من برمجيات المعالجه الطبيعية للغه Natural Language Processingعموما،

 

و المعالجه الطبيعية للمعنى Natural Meaning Processing،

 

و الاستفاده من قواعد اللغة.

 

النقطه الاساسية هنا هي ان اللغه عموما مبنيه على اساس قواعد ذات اساس شبية بالمعادلات الرياضية،

 

كما ان عبارات اللغه و كلماتها تكون مبنيه حسب هيكليه معينة, فلكل جمله مبتدا و خبر،

 

او فعل و فاعل و مفعول به،

 

كما ان الكلمات تاتى عاده من جذور و اصول.

 

و هذه الهيكليه المبنيه ضمن اللغه تتناسب و طبيعه عمل برمجيات الحاسوب،

 

و التي تحتاج الى هيكليه معينة تنفذ على اساسها عملياتها.

 

اما المعالجه الطبيعية للمعنى فهي اكثر صعوبة،

 

فكلمه مثل “راحة” يمكن لها ان تعني عده اشياء،

 

كالارتياح بعد التعب،

 

او الراحه الابديه و التي تعني الموت،

 

او راحه اليد.

 

و لهذا فان برمجيات البحث يجب ان تتمكن من فهم الكلمه ضمن سياق النص،

 

و دور الكلمه في هذا السياق.

 

و لكن حتى هذا الاسلوب لا يفلح دوما في فهم المعنى.

 

جرب ان تقرا ديوانا شعريا جيدا،

 

و ستجد ان هنالك الكثير من الكلمات الصعبة،

 

و التي قد يحاول البعض فهمها من السياق،

 

و لكننا عندما نعجز عن ذلك فاننا نتجة الى القاموس.

 

و هذا اسلوب يمكن لبرمجيات الحاسوب اتباعه،

 

اى الاعتماد على قاموس او فهرس بالكلمات و العبارات الشائعه الاستخدام،

 

و البحث في السياق.

 

و فيما يلى بعض مفاهيم البحث التي تعتمد على المعالجه الطبيعية للغة؛
دراسه الجمل[عدل] تتميز الجمل بانها ذات هيكليه محدده و واضحة،

 

مما يساعد في فهم المعنى بشكل سريع.

 

و من خلال تحديد نوع الجملة،

 

يمكن لبرمجيات البحث ان تقوم بعملها بشكل اكثر دقة.

 

و لعمل ذلك فان هذه البرمجيات يجب ان تعتمد على كميات كبيرة من المصادر و المراجع اللغوية،

 

كالمكانز،

 

و التي تحتوى على عبارات و جمل ذات علاقات محدده مسبقا.

 

و باستخدام هذه المكانز يمكن لبرمجيات البحث ان تفهم بشكل افضل طبيعه العلاقه بين الكلمات المختلفة و مواقعها الصحيحة ضمن الجمل.

 

و رغم الفائده العظيمه للمكانز،

 

فان مدي فعاليتها يعتمد على تحديثها باستمرار،

 

و الا فانها تفقد فاعليتها تدريجيا.

 

و باستخدام المكانز،

 

و تصريف الجمل و اعرابها يمكن الحصول على نظم بحث قوية يمكنها فهم عبارات البحث و معاني الكلمات ضمن السياق بشكل افضل.
ازاله الالتباس: اختيار المعنى الصحيح[عدل] اوضحنا في النقطه اعلاة كيف يمكن للمكانز و نظم تصريف و اعراب الجمل ان تسهم بشكل افضل في فهم المعنى من خلال السياق.

 

و هذه التقنيه مفيدة اذا كنا نبحث ضمن نص معين،

 

و لكنها ليست مفيدة عند ادخال الاستفسارات و الاستعلامات ضمن محركات البحث،

 

حيث تتكون هذه عاده من عدد محدود من الكلمات،

 

و بالتالي فان حجم النص غير كاف لتحليل معنى الكلمات.

 

و الحل لهذه المشكلة و اضح الى درجه الاحراج و يتمثل في سؤال المستخدم عن المعنى الذى يقصده؛

 

فعندما يدخل المستخدم كلمه “راحة” مثلا ضمن مربع الاستعلام،

 

فان محرك البحث يسالة عن المعنى المقصود،

 

او المعنى المراد البحث عنه،

 

قبل الشروع بعملية البحث.

 

و توجد اليوم العديد من محركات البحث التي تستخدم قواميس مضمنه تقوم بتقديم قوائم بالمعاني المختلفة التي تمثلها الكلمه الواحده قبل الشروع في عملية البحث.

 

و من هذه المحركات هناك LexiGuide من شركة LexiQuest،

 

و Oingo،

 

و Simplifind على موقع Simpli.com.
التصنيف التلقائي[عدل] هذا الاسلوب هو الاقدم،

 

حيث يتم تصنيف الوثائق حسب تصنيفات و فروع معينة،

 

و من ثم البحث بشكل منفصل ضمن كل تصنيف عن المعلومات المطلوبة.

 

فمثلا،

 

عند البحث عن كلمه “نواة” فان بحثك قد يقودك الى تصنيف يتعلق بعلوم الزراعة،

 

و انواع الحبوب،

 

و ما الى ذلك،

 

و لكنة في الوقت نفسة قد يقودك الى تصنيف يقع ضمن علوم الفيزياء النووية.

 

و الحل هنا يكمن في تصنيف الوثائق المتعلقه بانويه الحبوب و المزروعات في قسم الزراعه مثلا،

 

و الوثائق المتعلقه بانويه الذرات في قسم الفيزياء الذرية.

 

و لكن ماذا لو كانت لدينا و ثيقه تتعلق بتاثير التجارب النوويه على انويه الحبوب و المزروعات

 

هل يجب عندها وضع الوثيقه في القسمين،

 

ام ما هو الحل

 

و هنا تنشا لدينا مشكلة المعنى المزدوج.

 

و من هنا تاتى اهمية التصنيف التلقائي،

 

حيث يتم استخدام علوم النحو من تصريف و اعراب،

 

و استخدام المكانز و القواميس،

 

بحيث يتمكن النظام من “فهم” المواضيع الرئيسه في و ثيقه ما .

 

 

و يتم ذلك باستخدام اساليب احصائيه تقوم بدراسه تكرار الكلمات ضمن و ثيقه ما ،

 

 

و من ثم تحديد السياق،

 

و الذى يساعد في عملية البحث.

 

و كمثال على ذلك لناخذ كلمة،

 

او اسم مثل “فهد” او “ليث” و هي اسماء عربية دارجة.

 

و لنفترض اننا كتبنا موضوعا في مجلتنا عن شخص اسمه “فهد”،

 

و لنفترض ان محرك بحث اراد تصنيف مقالنا هذا.

 

فى هذه الحال،

 

و اذا كان محرك البحث يستخدم اسلوب التصنيف التلقائي،

 

فانة سيقوم من خلال دراسه النص و نوعيه الكلمات الموجوده فيه و علاقاتها و تكرارها،

 

بتحديد ان المقال ينتمى الى تصنيف علوم الحاسوب و الانترنت و ليس الحيوانات و الوحوش البرية.

 

و تتبع برمجيات التصنيف التلقائى قواعد معينة يحددها المبرمجون،

 

او يمكن للاله نفسها ان تتعلم ذاتيا كيف تقوم بتصنيف الكلمات.

 

او يمكن استخدام الاسلوبين،

 

بحيث يتم تصنيف الوثائق التي تتبع نمطا معينا بشكل تلقائي،

 

فى حين يتم تحويل تلك التي يستحيل تصنيفها الى عامل بشرى كى يقوم بذلك.
زياده دقه الاستعلامات[عدل] من يستعمل محركات البحث باستمرار يعلم انه من المحتوم الحصول على مئات الالوف من النتائج على الاقل عند البحث عن موضوع معين بشكل عام.

 

اما عند تضييق نطاق البحث،

 

فاننا نحصل على مقدار اقل من النتائج الاكثر دقة.

 

و لزياده دقه الاستعلامات،

 

فان بعض محركات البحث يقوم بتعديل الاستعلام،

 

و ذلك بتقديم معان مرادفه لكلمات البحث الى المستخدم،

 

لمساعدتة على تحديد موضوع بحثة بدقه اكبر.

 

ففى مثل هذه النظم،

 

و اذا كان موضوع استعلامك هو “الرياضة” مثلا،

 

فان النظام يقدم لك عددا من البدائل التي تساعد في تحديد موضوع البحث مثل “التربيه البدنية”،

 

“اللياقه البدنية” او “اللياقة” و غير ذلك من المرادفات التي تساعد على توجية العملية بحيث يحصل المستخدم على اكبر كم من النتائج الدقيقة التي تعبر عن موضوع البحث.
ربط المفاهيم[عدل] اذا جربت اليوم ان تبحث عن العبارة “اسطوانات الليزر” وهي العبارة العاميه و القديمة للاقراص المدمجة فانك لن تحصل على الكثير من النتائج المفيدة من محركات البحث،

 

حيث ان عبارة “الاقراص المدمجة” هي الكلمه الشائعه و المستخدمة في الغالبيه العظمي من المطبوعات.

 

و لهذا فان العديد من محركات البحث هذه الايام تستخدم اسلوب الربط بين المفاهيم،

 

بحيث انك اذا قمت بكتابة العبارة “اقراص الليزر” فانك ستحصل على معلومات عن “الاقراص المدمجة”.

 

و يعتمد هذا الاسلوب على تحديد العلاقه بين الكلمات و العبارات في قاعده البيانات بشكل مسبق،

 

كما انه مفيد عند البحث في و ثائق متعدده اللغات،

 

فالبحث عن كلمه “اقراص الليزر” يمكن ان يعطى نتائج لوثائق باللغه الانجليزية عن “Compact Disks” او CDs و ما الى ذلك،

 

و هذا اسلوب مفيد جدا في عالم انترنتى لم تعد فيه اللغه الانجليزية هي السائدة.
الصورة الحالية[عدل] انظر الى اي موقع للتجاره الالكترونية،

 

و ستجد انه غير ذا فائده تذكر اذا لم يكن محرك البحث المستخدم به قادرا على نقلك الى صفحة المنتج،

 

او المنتجات،

 

التي تريدها خلال اسرع وقت ممكن.

 

و لذلك نجد ان بوابات التجاره و الاعمال الالكترونيه العالمية مثل Ebay و امازون تعتبر برمجيات البحث احد اهم موجوداتها و تسعي باستمرار الى تحديثها.

 

و قد قامت شركة Ebay قبل سنوات بشراء نظام بحث متقدم من شركة Fast Search & Transfer النرويجية،

 

و التي كانت تنتج تقنيه بحث جديدة تقوم بتقديم احدث المعلومات للباحثين عن نتائج المزادات و الاسعار المتداولة.

 

كما ان امازون و مواقع مثل Marthastewar.com تقوم بالتعامل مع شركة Google و AskJeeves بحيث يتم ربط المستخدمين بالبضائع التي يريدون شرائها من خلال كتابة سؤال اعتيادى ضمن مربع الاستعلام.

 

و تقول الخبيره ما رثا فراي،

 

و هي باحثه في شؤون التجاره الالكترونيه في مجموعة باتريشيا سيبولد،

 

“يمكن القول بان السبب الرئيس في فشل معظم مواقع التجاره الالكترونية،

 

يعود الى اعتمادها لتقنيات بحث ضعيفة.” كما اكتشفت مؤسسة ميديا ميتريكس للابحاث بان 80 من مستخدمى انترنت،

 

يتوقفون عن استخدام موقع ما اذا لم تعمل و ظيفه البحث المضمنه فيه بالشكل الصحيح.

 

و من هنا كان السباق بين عدد من الشركات لتطوير تقنيات بحث متقدمة،

 

يمكن للبشر الاعتياديين التعامل معها،

 

و الحصول على النتائج التي يريدونها تماما.

 

و سنستعرض فيما يلى عددا من الشركات العالمية التي ابتكرت تقنيات يمكن لها ان تغير و جة انترنت الى الابد.
ايكساليد Exalead[عدل] ايكساليد Exalead محرك بحث فرنسي متخصص في التقنيات الحديته للبحث نوعيه نتائج البحث, تصنيف النتائج, صور تمهيديه لكل صفحة.(Exalead)
انفراسيرتش Infrasearch[عدل] تجمع هذه الشركة ما بين تقنيات البحث المتقدمه التي تحدثنا عنها في الصفحات السابقة،

 

و بين تقنيات برمجيات مشاركه الملفات،

 

و هي ما يطلق عليه البعض برمجيات الند الى الند،

 

او ما يعرف بالانجليزية باسم P2P،

 

(انظر مقالنا في هذا العدد و المتعلق بهذا الموضوع).

 

و قد قامت شركة صن ما يكروسيستمز العملاقه مؤخرا بشراء هذه الشركة الشابه بمؤسسيها المراهقين الثلاث و طاقم عملها الذى يتكون من 15 مبرمجا.

 

و تعد هذه التقنية،

 

اذا ما كتب لها النجاح في مختبرات صن فان تقنيه انفراسيرتش تعد بالسيطره على عالم البحث عبر انترنت.

 

و تعمل تقنيه انفراسيرتش بالشكل التالي؛

 

يقوم المستخدم بتنزيل برنامج صغير الحجم على جهازه،

 

و مشاركه دليل معين،

 

او عده ادله على جهازه،

 

يريد ان يمكن المستخدمين الاخرين من البحث فيها.

 

و هذا البرنامج شبية ببرنامج نابستر،

 

و لكن قدراتة لا تقتصر على ملفات MP3 فقط،

 

بل تتعداها لتشمل كل انواع الملفات،

 

فاذا كنت تبحث عن الحل لمساله رياضيه معينة مثلا،

 

و كان احد الطلبه قد قام بحل هذه المساله او المعادلة،

 

و وضع الحل ضمن ملف على جهازه،

 

فانة يمكنك عند البحث باستخدام انفراسيرتش ان تعثر على هذا الملف و حل المعادلة،

 

اذا كان هذا المستخدم قد اختار مشاركتة مع الغير عبر الشبكة.

 

و لا تتوقف قدرات انفراسيرتش هنا،

 

فاذا كنت تريد شراء سيارة معينة،

 

فان برنامج انفراسيرتش ياخذك الى دليل على موقع الشركة،

 

و من ثم توجيهك الى القسم الخاص بالسيارة التي تريدها،

 

و الحصول على اخر المعلومات عن هذه السيارة،

 

بما في ذلك صورة لاحدث موديل لها قام احد المستخدمين بالتقاطها و وضعها على جهازة ليشاركها مع الغير.

 

كما يمكن للوكيل مثلا ان يشارك ملفا على جهازة يحتوى على عقد البيع و اجراءات التسجيل و ما الى ذلك.

 

و بما ان برنامج انفراسيرتش مجاني،

 

فقد كان المخطط الاصلي للشركة هو جعل المؤسسات التجارية،

 

التي تختار استخدام البرنامج في عملياتها،

 

تقوم بدفع مقابل ما دى بسيط جدا مقابل كل عملية بحث تقوم اجهزة انفراسيرتش المزوده بتوجيهها الى المؤسسة التجارية.

 

و هذا يعني ان عوائد الشركة تعتمد على عدد الاشخاص الذين يقومون بالبحث في شبكتها.

 

و اضافه الى ذلك،

 

فان انفراسيرتش كانت تخطط للتعاون مع محركات البحث الشائعه الاستخدام،

 

و ذلك لجعل نتائج بحثها “طازجة” و حديثه باكبر قدر ممكن،

 

حيث ان نتائج البحث التي نحصل عليها عاده من هذه المحركات تعتمد على مدي نشاط الروبوتات التي تقوم بفهرسه مواقع انترنت،

 

و هي عاده متاخره حوالى 24 ساعة عما نشر على الشبكة.

 

اما باستخدام تقنيه انفراسيرتش فان النتائج تكون طازجه بالدقيقة و الثانية.

 

و كما قلنا اعلاه،

 

فان انفراسيرتش الان ملك لصن ما يكروسيتمز،

 

و نرجوان نري منتجها عما قريب على انترنت.
غوغل[عدل] بدا محرك البحث هذا Google.com كمشروع لرساله دكتوراه حول تقنيات الذكاء الاصطناعى و المعالجه الطبيعية للغه في جامعة ستانفورد في الولايات المتحدة،

 

و تحول اليوم الى بوابه انترنت عالمية كبري تخدم البحث ب 66 لغه منها العربية)،

 

تقوم بمعالجه 120 مليون طلب بحث يوميا حسب احصائيات مؤسسة ميديا ميتركس للابحاث)،

 

كما ان الموقع اصبح مؤخرا ضمن اكبر 15 موقعا في الولايات المتحدة.

 

و لا يتوقف الامر هنا،

 

حيث ان عوائدة تصل الى 50 مليون دولار سنويا،

 

و يتوقع البعض ان يصل حجم هذه العوائد في المستقبل القريب الى مليار دولار امريكي حسب مجلة بيزنس و يك الامريكية.

 

و المستخدم لهذا الموقع يعرف تمام المعرفه مدي دقتة في تقديم النتائج المطلوبة،

 

و من المره الاولى،

 

كما انه لا يتطلب خبره كبري من المستخدم في صياغه الاسئله و الاستعلامات.

 

و يعتمد هذا الموقع تقنيات احصائيه و رياضيه متقدمه تقوم بدراسه الوثائق المفهرسة،

 

و تكرار الكلمات ضمن كل و ثيقة،

 

و بالتالي الحكم على موضوعها و علاقتها بعبارة البحث التي يقوم المستخدم باستعمالها.

 

و مهما كانت الوصفة السحريه التي يستخدمها موقع غوغل فانه يعتبر الافضل بين كافه مواقع البحث المستخدمة اليوم.
اسك Ask[عدل] موقع Ask.com يستخدم اللغه الطبيعية في البحث و يعتمد قاعده بيانات و تقنيات تمكن المستخدم من توجية سؤال البحث “باللغه الانجليزية” بلغه سهلة وعاميه ايضا لتقوم قاعده البيانات بالمطابقه بين الكلمات المفتاحيه في السؤال،

 

و بين ما هو موجود في قاعده بياناتها.

 

و رغم ذلك فان محرك “اسك” يعتمد جزئيا على التدخل البشرى لتصنيف المعلومات و فهرستها اذا لم تكن موجوده في قاعده البيانات.

 

فعند حصول حدث اخبارى ما مثلا،

 

فان “اسك”لن يتمكن من التعامل مع اي سؤال يتعلق بهذا الحدث الا اذا قام مدراء قواعد البيانات بتحديث النظام.
وقد قامت الشركة المسئوله عن الموقع بطرح نظام مستقل،

 

يمكن للمؤسسات العامله في مجالات التجاره و الاعمال الالكترونيه تضمينة في مواقعها بحيث يمكن لعملائها توجية اسئله و استفسارات باللغه الطبيعية،

 

و الحصول على اجوبه لها دون اي تدخل بشري.
اوبن كولا OpenCola[عدل] نعود هنا الى شركة اخرى تستخدم تقنيات مشاركه الملفات،

 

و المعالجه الطبيعية للغة،

 

اضافه الى اسلوب المجتمعات الخبيره Expert Communities،

 

لخدمه عملية البحث.

 

و تنتج هذه الشركة برنامجا صغيرا مجانيا يقوم المستخدم بتنزيلة و تثبيته على جهازه،

 

و من ثم يمكن له سحب و اسقاط ملف ما سواء نص،

 

او موسيقى،

 

او صورة،

 

او اي نسق كان ضمن هذا البرنامج،

 

و الذى يقوم بالبحث ضمن اجهزة كمبيوتر اخرى مشاركه في الشبكة،

 

عن ملفات مشابهة.

 

فاذا كنتم مثلي،

 

من هواه جمع اللوحات الالكترونيه للمدرسة الانطباعيه او التكعيبية،

 

و كانت لديكم صورة تمثل احدي هذه المدارس الفنية،

 

فيمكن وضع هذه الصورة ضمن البرنامج،

 

و الذى يبحث بعدها في اجهزة الكومبيوتر المشاركه ضمن الشبكه ليحصل على ملفات مماثلة.

 

و ماذا عن فكرة المجتمعات الخبيرة

 

تهدف اوبن كولا الى تشجيع المشاركين في شبكتها على مشاركه اجهزتهم مع اشخاص يشابهونهم في الاهتمامات،

 

فاذا كان لدى مجلد على جهازى يحتوى على لوحات الكترونيه للمدرسة التكعيبيه مثلا،

 

فاننى اقوم بمشاركتها ضمن موقع اوبن كولا و ضمن تصنيف خاص بهذه النوعيه من اللوحات.

 

كما ان اوبن كولا تستخدم روبوتات موزعة،

 

او عناصر الية،

 

تعتمد اسلوب البحث في العناصر البرمجية.

 

و يمكن للمستخدمين تحسين دقه النتائج التي يحصلون عليها بتدريب هذه الروبوتات الباحثة،

 

و التي تتعلم من خلال التجربة.
اوتونومى Autonomy[عدل] تعتمد البرمجيات التي تستخدمها هذه الشركة Autonomy.com على تقنيه المطابقه ما بين انساق النص و تكرار العبارات و الكلمات،

 

و ذلك لتحديد المفاهيم الرئيسيه المميزه لوثيقه ما ،

 

 

و تشفيرها ضمن هذه الوثيقة،

 

و من ثم البحث عن و ثائق تحتوى على مفاهيم مشابهه في نصوص اخرى.

 

و باستخدام هذا الاسلوب يمكن للباحث ان يقوم بكتابة جمل تصف ما يبحث عنه بلغه سهلة،

 

و البحث على هذا الاساس.

 

كما ان محرك بحث اوتونومى يمكنة ان يتعلم ما يريدة المستخدم،

 

بناء على نوعيه المواد التي يقراها او يستعرضها هذا المستخدم.
بريموس Primus[عدل] تركز برمجيات البحث الخاصة بهذه الشركة على المواد التي تتعامل مع خدمه الزبائن،

 

او المواد الموجوده ضمن نماذج الكترونية،

 

و هي على هذا الاساس مكمله لما تقوم به شركة اوتونومي.

 

و تسمح هذه البرمجيات للمستخدمين بان يقوموا بتوجية اسئله الى قاعده البيانات باستخدام اللغه الطبيعية.

 

و يقوم النظام بجمع نتائج البحث،

 

و تقديمها للمستخدمين الذين يقومون بطرح اسئله مشابهة.
المستقبل[عدل] يوجد على انترنت اليوم بلايين الصفحات،

 

و حسب المصادر المتوفره فانه قد تم حتى اليوم فهرسه ما يزيد قليلا على البليون صفحة.

 

و تتسابق الشركات التي تقوم بفهرسه هذه الصفحات في اتاحتها لمستخدمى انترنت،

 

و الحفاظ على سرعه الاستجابه التي يحصل عليها المستخدم.

 

و اضافه الى السرعه فان على قواعد البيانات هذه ان تثبت و جودها بتقديم اجوبه “طازجة”،

 

و متناسقة،

 

و ذات علاقه بما يبحث عنه المستخدم.

 

كما ان عجله الابتكار لا تتوقف في مجال البحث،

 

فموقع www.hotlinks.com يتيح للمستخدمين امكانيه حفظ مفضلاتهم Favorites ضمن دليل على انترنت،

 

و ذلك كى تكون هذه المفضلات متاحه للمستخدم اينما كان،

 

و يمكن للمستخدمين ان يختاروا مشاركه مفضلاتهم مع مستخدمى انترنت الاخرين،

 

و تمكين زوار الموقع من البحث على انترنت من خلال البحث في مفضلات الاخرين،

 

و بالتالي الحصول على معلومات راي مستخدمون اخرون انها مفيدة لدرجه وضع المواقع التي تحتويها ضمن مفضلاتهم.

 

كما ان هناك مواقع للبحث مثل www.expertcentral.com و التي تقدم للباحثين اجابات متخصصة.

 

و اضافه الى ذلك فهناك العديد من محركات البحث التي تعتمد تقنيات الشبكات العصبيه Neural Networks،

 

و محركات البحث التي يمكن تثبيتها على اجهزة المستخدمين،

 

و فهرسه محتويات اقراصهم الصلبة.

 

و نظرا للاهمية المتواصله لمحركات البحث،

 

فان التقنيات الجديدة ستواصل ظهورها،

 

و ستواصل التقنيه تطورها لتقديم نتائج افضل للمستخدمين.

 

و بظهور هذه التقنيات فان بعضها سيفشل و بعضها سينجح،

 

و ستصبح التقنيات الناجحه جزءا من محركات البحث المستخدمة اليوم.
تطبيقات مستقبلية[عدل] اذا لم تكن تريد انفاق الملايين في ابتكار تقنيات للذكاء الاصطناعى و المعالجه الطبيعية للغة،

 

فان الحل الاسهل هو استخدام الميزات التي تقدمها لغه XML لجعل عملية البحث اكثر دقة.

 

فهذه اللغه كما هو معروف تعتمد على توصيف الوثائق و البيانات عند نشرها على الشبكة.

 

فالمادة المتعلقه بالاسعار مثلا يتم توصيفها بعلامات تدل على انها تمثل السعر،

 

و المادة التي تصف ابعاد بضاعه معينة يتم توصيفها بهذا الشكل.

 

و باستخدام XML يمكن للروبوتات التي تقوم بفهرسه مواقع انترنت ان تفهم المحتوي الموجود ضمن الصفحات.

 

و بالتالي فعندما تبحث عن تذكره سفر بسعر معين مثلا،

 

فان الروبوتات لا تقوم فقط بالعثور على التذكره بافضل الاسعار،

 

و لكنها تعثر ايضا على افضل سعر لغرفه فندق،

 

او سيارة مستاجرة.

 

و من التطبيقات الاخرى مثلا هي انك اذا عرضت سيرتك الذاتيه على الروبوت فانه يقترح عليك افضل و ظيفه تناسب مؤهلاتك.

 

او اذا عرضت على الروبوت ملفك الصحي فانه يقترح عليك الفيتامينات التي يجب عليك تناولها،

 

او النوادى الصحية التي يمكنك الانضمام اليها.

 

و بالطبع فاننا لا نعتقد ان XML هي الحل السحري،

 

و لكنها يمكن ان تؤدى الى زياده نجاعه عمليات البحث اذا ما اقترنت بالتقنيات الاخرى المذكوره في موضوعنا هذا.
محركات البحث عربيا[عدل] عربيا لا توجد محركات بحث كثيرة تعتمد على نفسها،

 

يمكن حصرها في 2 او 3 فقط اذ ان اغلب محركات البحث العربية تعتمد على محركات بحث اجنبية هذا لعدم قدره الشركات العربية على الاستثمار في هذا المجال و تبقي اغلب محركات البحث التي تعتمد على نفسها كليا ضعيفه لضعف التجهيزات اذ تكون غالبا من اجتهاد افراد على سرفرات عامة.

صورة اسماء محركات البحث , اشهر مواقع البحث العالمية

pictures صورة

 


207 مشاهدة