اسماء محركات البحث , اشهر مواقع البحث العالمية

آخر تحديث ف17 يناير 2021 الجمعة 8:41 صباحا بواسطه سحر فتحي

محرك البحث الباحوث هو برنامج حاسوبى مصمم للمساعدة فالعثور على مستندات مخزنه على شبكات معلوماتيةالشبكه العنكبوتيه العالمية بالانجليزية: World Wide Web) او على حاسوب شخصي.

 


بنيت محركات البحث الاولي اعتمادا على التقنيات المستعملة فادارة المكتبات الكلاسيكية.

 


حيث يتم بناء فهارس للمستندات تشكل قاعده للبيانات تفيد فالبحث عن اي معلومة.

محركات البحث الاكثر استخداما و نسبة السيطره على محركات البحث فاوخر 2021

يسمح محرك البحث للمستخدم ان يطلب المحتوي الذي يقابل معايير محدده والقاعده بها تلك التي تحتوى على كلمه او عبارة ما و يستدعى قائمة بالمراجع توافق تلك المعايير.

 


تستخدم محركات البحث مؤشرات/فهارس/مسارد منتظمه التحديث لتشتغل بسرعه و فعالية.

تعرض النتائج على شكل قائمة بعناوين المستندات التي توافق الطلب.

 


يرفق بالعناوين فالغالب مختصر عن المستند المشار الية او مقتطف منه للداله على موافقتة للبحث.

 


ترتب عناصر قائمة البحث على حسب معايير خاصة ربما تختلف من محرك لاخر)،

 


من اهمها مدي موافقه جميع عنصر للطلب.

عند الحديث عن محركات البحث فغالبا ما يقصد محركات البحث على شبكه الانترنت و محركات الويب بالخصوص.

 


محركات البحث فالويب تبحث عن المعلومات على الشبكه العنكبوتيه العالمية،

 


ومنها يستخدم على نطاق ضيق يشمل البحث داخل الشبكات المحليه للمؤسسات اي انترانت بالانجليزية: Intranet).

 


اما محركات البحث الشخصيه فتبحث فالحواسيب الشخصيه الفردية.

بعض محركات البحث كذلك تحفر فالبيانات المتاحه على المجموعات الاخبارية،

 


وقواعد البيانات الضخمة،

 


او ادله مواقع الوب كدموز دوت اورج.

محتويات [اخف]
1 تاريخ

2 اشهر محركات البحث

3 كيف تعمل محركات البحث

4 محركات البحث على الشبكه الانترنت

5 مشاكل تقنيات البحث

5.1 عدم طرح الاسئله الصحيحة

5.2 فجوه المفردات

5.3 الموازنه بين الكم و النوع

5.4 غموض الكلمات

5.5 الاسماء و نوعياتها

6 المعالجه الطبيعية للغة

6.1 دراسه الجمل

6.2 ازاله الالتباس: اختيار المعني الصحيح

6.3 التصنيف التلقائي

6.4 زياده دقه الاستعلامات

6.5 ربط المفاهيم

7 الصورة الحالية

7.1 ايكساليد Exalead

7.2 انفراسيرتش Infrasearch

7.3 غوغل

7.4 اسك Ask

7.5 اوبن كولا OpenCola

7.6 اوتونومى Autonomy

7.7 بريموس Primus

8 المستقبل

8.1 تطبيقات مستقبلية

8.2 محركات البحث عربيا

9 انظر ايضا

10 ارتباطات خارجية

تاريخ[عدل]
اول محرك بحث كان و اندكس بالانجليزية: Wandex [بحاجة لمصدر]،

 


وهو فهرس جمعة متجول و ب و هو زاحف عنكبوتى بالانجليزية: web crawler طورة ما ثيو جراى فمعهد ما ساشوستس للتكنولوجيا MIT ف1993.

 


ويعد اليوب بالانجليزية: Aliweb محرك بحث احدث مبكر جدا جدا و ربما ظهر ف1993 و يعمل حتي اليوم.

 


واول محرك بحث قائم على الزاحف العنكبوتى للنصوص الكاملة كان و بكراولر بالانجليزية: WebCrawler)،

 


والذى خرج للوجود ف1994.

 


وعلي عكس سابقيه،

 


فقد ترك المستخدمين يبحثون عن اي كلمه على اي صفحة و يب،

 


وهو ما صار القاعده لكل محركات البحث الكبري منذ هذا الوقت.

 


كان هو كذلك الاول فمعرفه الجمهور فيه على نطاق و اسع.

 


فى 1994 ايضا جاء لايكوس بالانجليزية: Lycos الذي بدا فجامعة كارنيجى ميلون بالانجليزية: Carnegie Mellon University) و صار مشروعا تجاريا كبيرا.

بعد هذا بقليل،

 


ظهر الكثير من محركات البحث و تزاحمت على الشعبية.

 


وكان من ضمنها اكسايت بالانجليزية: Excite)،

 


انفوسيك بالانجليزية: Infoseek)،

 


وانكتومى بالانجليزية: Inktomi)،

 


ونورثرن لايت بالانجليزية: Northern Light)،

 


والتافيستا بالانجليزية: Alta Vista).

 


وفى بعض الحالات تنافست مع الادله ذات الشعبية كياهو

 


(بالانجليزية:

 


Yahoo).

 


فيما بعد،

 


ادمجت الادله او اضافت اليها تقنيه محرك البحث من اجل اداء اكبر للوظائف.

عرفت محركات البحث كذلك بكونها بعض المع النجوم فنوبه الاستثمار فالانترنت التي و قعت فاواخر التسعينات.

 


دخلت عده شركات السوق فمشهد كبير،

 


مسجله مكاسب قياسيه اثناء طرح اسهمها العام الافتتاحي.

 


وقد سحب البعض محركاتهم البحثيه العامة،

 


وهم يسوقون نسخا للشركات فقط،

 


مثل نورثرن لايت التي كانت من ال8 او 9 محركات بحث المبكره بعد ان جاء لايكوس بالانجليزية: Lycos).

قبل مجيء الانترنت،

 


كانت هنالك بواحيث لموافيق بروتوكولات)او استخدامات اخرى،

 


مثل محرك بحث اركى لمواقع اف‌.تي.‌بى المجهوله بالانجليزية: anonymous FTP و محرك بحث ڤيرونيكا لبروتوكول جوفر.

وستاتى بعض محركات البحث الثانية =منها اية ناين.كوم a9.com امازون.كوم)،

 


اسك چيڤيز/تيوما بالانجليزية: Ask Jeeves/Teoma)،

 


جيجابلاست،

 


سناپ بالانجليزية: Snap)،

 


والهاللو بالانجليزية: Walhello)،

 


كازاز بالانجليزية: Kazazz)،

 


ووايسنت بالانجليزية: WiseNut).

 


وبعض احدث اخر محركات البحث،

 


والتى تبحث فقط نوعياتا محدده من المحتوي هي پلازو Plazoo لمردود الخلاصات RSS feeds)،

 


وجوهوك GoHook لملفات پى دى اف PDF بشكل اساسي).

 


ومن اشهر المحركات ايضا: Yooci و ThroughSearch

اشهر محركات البحث[عدل]
جوجل بالانجليزية: Google)

ياهو بالانجليزية: Yahoo!)

بينج بالانجليزية: Bing)

لايف سيرش بالانجليزية: LiveSearch)

دك دك غو بالانجليزية: DuckDuckGo)

كيف تعمل محركات البحث[عدل]
تعمل محركات البحث عن طريق تخزين المعلومات عن عدد كبير من صفحات الوب،

 


والتى تستعيدها من الشبكه العالمية و ورلد و ايد و ب نفسها.

 


تستعاد هذي الصفحات بواسطه زاحف و ب يعرف احيانا كذلك ب

 


عنكبوت‘ و هو مستعرض و ب الى يتبع جميع رابط يراه.

 


بعد هذا يجرى تحليل جميع صفحة لتحديد كيف ينبغى فهرستها على سبيل المثال،

 


تستخلص العبارات من العناوين،

 


رؤوس الموضوعات،

 


او حقول خاصة تعرف ب ميتا تاجز).

 


تخزن البيانات عن صفحات الوب فقاعده بيانات فهرسيه للاستعمال فعمليات البحث طلبا للمعلومات لاحقا.

 


بعض محركات البحث،

 


مثل جوجل،

 


تخزن جميع او بعض الصفحة المصدر وتشير لها ب مخبوءة و بالمثل معلومات عن صفحات الوب،

 


بينما بعضها تخزن جميع كلمه من جميع صفحة تجدها،

 


مثل التاڤيستا.

 


هذه الصفحة المخبوءه تمسك بنص البحث الفعلى بما انه هو الذي تمت فهرستة فعليا،

 


لذا فقد تكون مفيدة جدا جدا عندما يصبح محتوي الصفحة الحاليه ربما جري تجديدة و لم تعد الفاظ البحث فيه.

 


ربما تعتبر هذي المشكلة شكلا خفيفا من تعفن الروابط،

 


وتزيد معالجه جوجل لها من امكانيه الاستعمال بارضاء توقعات المستخدم بان ترد الفاظ البحث فصفحات الوب العائده فالرد.

 


وهو ما يرضى

 


مبدا مفاجاه اخف من مفاجاة‘ بما ان المستخدم يتوقع بشكل طبيعي الفاظ البحث فالنتيجة العائده له.

 


وهذه الصله بالبحث تجعل هذي الصفحات المخبوءه مفيدة جدا،

 


حتي اكثر من و اقع انها ربما تحتوى على بيانات قد لم تعد متاحه فموضع اخر.

عندما يتوجة مستعمل لمحرك البحث و يجرى عملية بحث طلبا للمعلومات،

 


كما هو سائد باعطاء عبارات مفتاحية،

 


يفتش المحرك فالفهرس و يقدم قائمة بصفحات الوب الاروع توافقا تبعا لمعاييره،

 


فى المعتاد مع ملخص قصير يحتوى على عنوان الوثيقه و احيانا اجزاء من النص.

 


معظم محركات البحث تدعم استعمال الاصطلاحات البولينيه نسبة للجبر البولينى و هو نوع من المتغيرات المنطقية): AND و OR و NOT لمزيد من تحديد طلب المعلومات.

 


وهنالك خدمه و ظيفيه متقدمه هي البحث بالتقارب،

 


والتى تسمح لك بتحديد المسافه بين العبارات المفتاحية،

 


باستعمال الفاظ كNEAR،

 


NOT NEAR،

 


FOLLOWED BY،

 


NOT FOLLOWED BY،

 


SENTENCE،

 


FAR.

يعتمد مدي فوائد محرك بحث على مدي صله النتائج التي يرد بها.

 


فبينما ربما تكون هنالك ملايين صفحات الوب التي تحتوى على كلمه او عبارة محددة،

 


قد تكون بعض اوثق صلة،

 


او اروج،

 


او معتمدة اكثر من غيرها.

 


معظم محركات البحث توظف اساليب لوضع مراتب النتائج لتقدم اروع النتائج اولا.

 


الطريقة التي يقرر فيها محرك بحث اي الصفحات هي الاروع توافقا،

 


وما النظام الذي يجب ان تخرج فيه النتائج،

 


تختلف بشكل شاسع من محرك لاخر.

 


الاساليب كذلك تتغير عبر الزمن بتغير استعمال انترنت و تكنيكات حديثة تتطور.

معظم محركات البحث هي مضاربات تجاريه يدعمها عائد اعلانى و ،

 


بالنتيجة،

 


يوظف البعض الممارسه المثيره للجدل بالسماح للمعلنين بدفع النقود ليرفعوا لهم قوائهم فمراتب نتائج البحث.

الاغلبيه الكاسحه من محركات البحث تديرها شركات خاصة تستعمل خوارزميات ملكها و قواعد بيانات مغلقة،

 


واكثرها رواجا حاليا هي جوجل و باحث اماسان و ياهو.

 


توجد تقنيه محركات بحث مفتوحه المصدر كاتشتيدج،

 


نتش،

 


سيناز،

 


ايجوثور و اوبنافتياس،

 


ولكن ليس هنالك خادم بحث و ورلد و ايد و ب مشاع يستعمل هذي التقنية.

جاء تطور محرك بحث الوب من تطور محركات البحث على شبكات الاجهزة و الشبكات الداخلية.

محركات البحث على الشبكه الانترنت[عدل]
يمكننا القول بان الشبكه و مواقعها لن تكون ذات فوائد كبار بالنسبة لنا لو لم تكن محركات البحث على انترنت موجودة.

 


فى البدء كانت محركات البحث عبارة عن ادلاء تقوم بفهرسه مواقع الانترنت الجديدة.

 


وقد كان هذا فعالا عندما كان حجم انترنت يقدر بملايين الصفحات.

 


ثم تطورت انترنت،

 


وانضم اليها الملايين من مؤسسات الاعمال،

 


والمؤسسات الحكومية،

 


وبلايين الصفحات من ادله استعمال المنتجات،

 


والمعلومات الخاصة بالمستثمرين،

 


وغير هذا من المعلومات التي تقوم بتسيير عجله اقتصاد انترنت.

 


ومع ذلك النمو اصبح من الضروري،

 


بل و من الحتمى اضافه محرك بحث فعال الى كافه مواقع انترنت،

 


يقوم بفهرسه و تصنيف المعلومات الموجوده ضمن هذي المواقع كى تتمكن من خدمه زوارها بشكل فعال.

 


واليوم،

 


وبعد ان اصبحت محركات البحث جزءا رئيسيا فحضارتنا الانترنتية،

 


فان هنالك العشرات من الشركات العامله فمجال انتاج برمجيات،

 


وتقنيات،

 


واساليب بحث حديثة موجهه نحو انترنت و انترانت.

 


وبسبب الدور المتزايد الذي تلعبة التجاره و الاعمال الالكترونيه فاقتصاد اليوم،

 


فان الحافز المادى على الاقل موجود.

 


ولكن رغم النجاح الذي تدعى الشركات المنتجه لتقنيات البحث تحقيقه،

 


فان المستخدمين لا زالوا يشكون من افتقار محركات البحث الى الدقه المطلوبة،

 


وتلبيه النتائج التي يتم تحصيلها لمتطلبات المستخدمين

مشاكل تقنيات البحث[عدل]
ان مفتاح النجاح فالحصول على نتائج بحث جيدة،

 


تكمن فنوعيه الاستفسارات،

 


او الاسئلة،

 


او الكلمات او العبارات المفتاحيه التي نقوم بادخالها فمحركات البحث.

 


لكن المشكلة الرئيسية هنا تكمن فان الغالبيه العظمي من المستخدمين لا يقومون عاده بادخال الاستفسارات او العبارات المفتاحيه الصحيحة،

 


والتى تؤدى الى الحصول على النتائج المطلوبة،

 


وسنستعرض فيما يلى المشاكل الشائعه فعالم البحث عن المعلومات،

 


والطرق التي يحاول فيها الباحثون معالجه هذي المشكلات.

عدم طرح الاسئله الصحيحة[عدل]
من الحقائق الغريبة التي يؤكدها خبراء المعلومات هي ان المستخدمين نادرا ما يقومون بطرح الاسئله التي تعبر عما يريدونة فعلا.

 


والاسباب =الرئيس فذلك هو الافتقار الى الفهم الصحيح للمقال قيد البحث،

 


وبالتالي عدم استعمال العبارات المفتاحيه الصحيحة،

 


والتى تؤدى الى تكوين استعلامات و اسئله صحيحة.

 


فالمشكلة الرئيسية هنا اذا،

 


هى مساعدة المستخدمين على طرح الاسئله و تكوين الاستعلامات الصحيحة.

 


ومن مظاهر هذي المشكلة كذلك هي صغر حجم الاستعلامات التي يصبحها المستخدم عاده للاستفسار عن مقال معين.

 


فاذا كان مستعمل ما يريد معلومات عن “السفر” مثلا،

 


فانة يبدا بادخال كلمه عامة فمحرك البحث،

 


ومن ثم،

 


واعتمادا على النتائج التي يحصل عليها،

 


يقوم بتضييق نطاق بحثة الى ان يصل الى ما يريده.

 


والاسباب =فان الكثير من مستعملى انترنت يستخدمون ذلك الاسلوب يكمن فانهم لا يعرفون حقا الحجم المهول للمعلومات الموجوده فقواعد البيانات الخاصة بمحركات البحث،

 


والتى تفوق عاده ما ممكن لاى انسان التعامل معه.

فجوه المفردات[عدل]
تتميز معظم اللغات الطبيعية بتنوع المفردات التي تتناول نفس المعنى،

 


فمثلا السحاب،

 


الغمام،

 


المزن،

 


العارض..

 


وغيرها تدور حول نفس المعني سحاب،

 


وبينما يدرك الانسان تطابق هذي المفردات فالمعني تعجز محركات البحث التقليديه عن استيعاب جميع المرادفات الممكنة،

 


فتفتقر نتائجها الى كثير من الوثائق ذات العلاقه بمقال البحث لكنها لم تستعمل نفس مفردات المستخدم،

 


وتسمي هذي المشكلة فجوه المفردات.

الموازنه بين الكم و النوع[عدل]
عند التعامل مع تقنيات البحث فلا بد من الموازنه بين الكم و النوع،

 


او ما يدعوة الخبراء بالدقه و القدره على الاسترجاع.

 


وهي علاقه عكسيه تماما،

 


فكلما تم تضييق نطاق البحث سعيا عن نتائج اكثر دقة،

 


كلما قل مقدار البيانات الذي ممكن استرجاعه.

 


و لذا فان هنالك حاجة لوجود محركات بحث تقدم دقه عاليه دون التضحيه بمقدار النتائج “الدقيقة” التي نسترجعها.

غموض الكلمات[عدل]
معظم العبارات تحمل اكثر من معنى،

 


ومعظم محركات البحث المستخدمة اليوم تقوم بمطابقه العبارات و ليس معانيها،

 


و لذا فان نتائج عمليات البحث التي نحصل عليها،

 


تحتوى غالبا على العبارات المفتاحيه الصحيحة،

 


ولكنها ذات المعني الخاطئ.

 


فاذا جربت مثلا ان تبحث عن معني كلمه “جافا” مثلا،

 


وهي احدي لغات البرمجه الشائعه الاستخدام،

 


فانك ستحصل العديد من النتائج المتعلقه بالجفاف،

 


او باسم جزيره اندونيسيه تحمل الاسم نفسه،

 


اضافه الى معلومات عن لغه البرمجه لانة يبحث عن البنيه الصرفيه و الشكلية للكلمه و ليس المعنى.

الاسماء و نوعياتها[عدل]
وماذا عن البحث فالاسماء،

 


اى البحث عن معلومات عن الاشخاص و الاماكن،

 


وما الى ذلك.

 


خصوصا و ان الكتاب يغيرون عاده الكيفية التي يقومون فيها بكتابة الاسماء.

 


واذا ما تحدثنا مثلا عن اسماء الشركات،

 


فانها تتغير باستمرار نتيجة عملية الاندماج و الضم،

 


مما يجعل عملية البحث صعبة.

 


وقد يقول البعض انه ممكن التغلب على هذي المشكلة نوعا ما باستعمال برمجيات الفهرسة،

 


ولكن المشكلة هي ان المعلومات فعالمنا تتغير باستمرار مما يجعل الفهرسه اليدويه صعبة.

 


وماذا عن الفهرسه الالية

 


الاجابه هي انه لا توجد بعد التقنيه التي يمكنها القيام بذلك بدقة،

 


بحيث ممكن التمييز مثلا بين موضوع كامل عن شخص معين،

 


وموضوع احدث يذكر اسم الشخص بشكل عابر.

المعالجه الطبيعية للغة[عدل]
يجمع العاملون فمجال محركات البحث بان الحل لكافه هذي المشاكل يكمن فتصميم محركات البحث،

 


وبرمجيات البحث عموما،

 


بحيث تستفيد من برمجيات المعالجه الطبيعية للغه Natural Language Processingعموما،

 


والمعالجه الطبيعية للمعني Natural Meaning Processing،

 


والاستفاده من قواعد اللغة.

 


النقطه الرئيسية هنا هي ان اللغه عموما مبنيه على اساس قواعد ذات اساس شبية بالمعادلات الرياضية،

 


كما ان كلمات اللغه و كلماتها تكون مبنيه حسب هيكليه معينة,

 


فلكل جمله مبتدا و خبر،

 


او فعل و فاعل و مفعول به،

 


كما ان العبارات تاتى عاده من جذور و اصول.

 


وهذه الهيكليه المبنيه ضمن اللغه تتناسب و طبيعه عمل برمجيات الحاسوب،

 


والتى تحتاج الى هيكليه معينة تنفذ على اساسها عملياتها.

 


اما المعالجه الطبيعية للمعني فهي اكثر صعوبة،

 


فكلمه ك“راحة” ممكن لها ان تعني عده اشياء،

 


كالارتياح بعد التعب،

 


او الراحه الابديه و التي تعني الموت،

 


او راحه اليد.

 


ولهذا فان برمجيات البحث يجب ان تتمكن من فهم الكلمه ضمن سياق النص،

 


ودور الكلمه فهذا السياق.

 


ولكن حتي ذلك الاسلوب لا يفلح دوما ففهم المعنى.

 


جرب ان تقرا ديوانا شعريا جيدا،

 


وستجد ان هناك العديد من العبارات الصعبة،

 


والتى ربما يحاول البعض فهمها من السياق،

 


ولكننا عندما نعجز عن هذا فاننا نتجة الى القاموس.

 


وهذا اسلوب ممكن لبرمجيات الحاسوب اتباعه،

 


اى الاعتماد على قاموس او فهرس بالعبارات و الكلمات الشائعه الاستخدام،

 


والبحث فالسياق.

 


وفيما يلى بعض مفاهيم البحث التي تعتمد على المعالجه الطبيعية للغة؛

دراسه الجمل[عدل]
تتميز الجمل بانها ذات هيكليه محدده و واضحة،

 


مما يساعد ففهم المعني بشكل سريع.

 


ومن اثناء تحديد نوع الجملة،

 


يمكن لبرمجيات البحث ان تقوم بعملها بشكل اكثر دقة.

 


ولعمل هذا فان هذي البرمجيات يجب ان تعتمد على كميات كبار من المصادر و المراجع اللغوية،

 


كالمكانز،

 


والتى تحتوى على كلمات و جمل ذات علاقات محدده مسبقا.

 


وباستعمال هذي المكانز ممكن لبرمجيات البحث ان تفهم بشكل اروع طبيعه العلاقه بين العبارات المختلفة و مواقعها الصحيحة ضمن الجمل.

 


ورغم الفوائد العظيمه للمكانز،

 


فان مدي فعاليتها يعتمد على تحديثها باستمرار،

 


والا فانها تفقد فاعليتها تدريجيا.

 


وباستعمال المكانز،

 


وتصريف الجمل و اعرابها ممكن الحصول على نظم بحث قويه يمكنها فهم كلمات البحث و معاني العبارات ضمن السياق بشكل افضل.

ازاله الالتباس: اختيار المعني الصحيح[عدل]
اوضحنا فالنقطه اعلاة كيف ممكن للمكانز و نظم تصريف و اعراب الجمل ان تسهم بشكل اروع ففهم المعني من اثناء السياق.

 


وهذه التقنيه مفيدة اذا كنا نبحث ضمن نصف معين،

 


ولكنها ليست مفيدة عند ادخال الاستفسارات و الاستعلامات ضمن محركات البحث،

 


حيث تتكون هذي عاده من عدد محدود من الكلمات،

 


وبالتالي فان حجم النص غير كاف لتحليل معني الكلمات.

 


والحل لهذه المشكلة و اضح الى درجه الاحراج و يتمثل فسؤال المستخدم عن المعني الذي يقصده؛

 


فعندما يدخل المستخدم كلمه “راحة” مثلا ضمن مربع الاستعلام،

 


فان محرك البحث يسالة عن المعني المقصود،

 


او المعني المراد البحث عنه،

 


قبل الشروع بعملية البحث.

 


وتوجد اليوم الكثير من محركات البحث التي تستعمل قواميس مضمنه تقوم بتقديم قوائم بالمعاني المختلفة التي تمثلها الكلمه الواحده قبل الشروع فعملية البحث.

 


ومن هذي المحركات هنالك LexiGuide من شركة LexiQuest،

 


و Oingo،

 


و Simplifind على موقع Simpli.com.

التصنيف التلقائي[عدل]
هذا الاسلوب هو الاقدم،

 


حيث يتم تصنيف الوثائق حسب تصنيفات و فروع معينة،

 


ومن بعدها البحث بشكل منفصل ضمن جميع تصنيف عن المعلومات المطلوبة.

 


فمثلا،

 


عند البحث عن كلمه “نواة” فان بحثك ربما يقودك الى تصنيف يتعلق بعلوم الزراعة،

 


وانواع الحبوب،

 


وما الى ذلك،

 


ولكنة فالوقت نفسة ربما يقودك الى تصنيف يقع ضمن علوم الفيزياء النووية.

 


والحل هنا يكمن فتصنيف الوثائق المتعلقه بانويه الحبوب و المزروعات فقسم الزراعه مثلا،

 


والوثائق المتعلقه بانويه الذرات فقسم الفيزياء الذرية.

 


ولكن ماذا لو كانت لدينا و ثيقه تتعلق بتاثير التجارب النوويه على انويه الحبوب و المزروعات

 


هل يجب عندها وضع الوثيقه فالقسمين،

 


ام ما هو الحل

 


وهنا تنشا لدينا مشكلة المعني المزدوج.

 


ومن هنا تاتى اهمية التصنيف التلقائي،

 


حيث يتم استعمال علوم النحو من تصريف و اعراب،

 


واستعمال المكانز و القواميس،

 


بحيث يتمكن النظام من “فهم” المقالات الرئيسه فو ثيقه ما .

 


ويتم هذا باستعمال اساليب احصائيه تقوم بدراسه تكرار العبارات ضمن و ثيقه ما ،

 


ومن بعدها تحديد السياق،

 


والذى يساعد فعملية البحث.

 


وكمثال على هذا لناخذ كلمة،

 


او اسم ك“فهد” او “ليث” و هي اسماء عربية دارجة.

 


ولنفترض اننا كتبنا موضوعا فمجلتنا عن شخص اسمه “فهد”،

 


ولنفترض ان محرك بحث اراد تصنيف مقالنا هذا.

 


فى هذي الحال،

 


واذا كان محرك البحث يستعمل اسلوب التصنيف التلقائي،

 


فانة سيقوم من اثناء دراسه النص و نوعيه العبارات الموجوده به و علاقاتها و تكرارها،

 


بتحديد ان الموضوع ينتمى الى تصنيف علوم الحاسوب و الانترنت و ليس الحيوانات و الوحوش البرية.

 


وتتبع برمجيات التصنيف التلقائى قواعد معينة يحددها المبرمجون،

 


او ممكن للاله نفسها ان تتعلم ذاتيا كيف تقوم بتصنيف الكلمات.

 


او ممكن استعمال الاسلوبين،

 


بحيث يتم تصنيف الوثائق التي تتبع نمطا معينا بشكل تلقائي،

 


فى حين يتم تحويل تلك التي يستحيل تصنيفها الى عامل بشرى كى يقوم بذلك.

زياده دقه الاستعلامات[عدل]
من يستخدم محركات البحث باستمرار يعلم انه من المحتوم الحصول على مئات الالوف من النتائج على الاقل عند البحث عن مقال معين بشكل عام.

 


اما عند تضييق نطاق البحث،

 


فاننا نحصل على مقدار اقل من النتائج الاكثر دقة.

 


ولزياده دقه الاستعلامات،

 


فان بعض محركات البحث يقوم بتعديل الاستعلام،

 


وذلك بتقديم معان مرادفه لعبارات البحث الى المستخدم،

 


لمساعدتة على تحديد مقال بحثة بدقه اكبر.

 


ففى كهذه النظم،

 


واذا كان مقال استعلامك هو “الرياضة” مثلا،

 


فان النظام يقدم لك عددا من البدائل التي تساعد فتحديد مقال البحث ك“التربيه البدنية”،

 


“اللياقه البدنية” او “اللياقة” و غير هذا من المرادفات التي تساعد على توجية العملية بحيث يحصل المستخدم على اكبر كم من النتائج الدقيقه التي تعبر عن مقال البحث.

ربط المفاهيم[عدل]
اذا جربت اليوم ان تبحث عن العبارة “اسطوانات الليزر” وهي العبارة العاميه و القديمة للاقراص المدمجة فانك لن تحصل على العديد من النتائج المفيدة من محركات البحث،

 


حيث ان عبارة “الاقراص المدمجة” هي الكلمه الشائعه و المستخدمة فالغالبيه العظمي من المطبوعات.

 


ولهذا فان الكثير من محركات البحث هذي الايام تستعمل اسلوب الربط بين المفاهيم،

 


بحيث انك اذا قمت بكتابة العبارة “اقراص الليزر” فانك ستحصل على معلومات عن “الاقراص المدمجة”.

 


ويعتمد ذلك الاسلوب على تحديد العلاقه بين العبارات و الكلمات فقاعده البيانات بشكل مسبق،

 


كما انه مفيد عند البحث فو ثائق متعدده اللغات،

 


فالبحث عن كلمه “اقراص الليزر” ممكن ان يعطى نتائج لوثائق باللغه الانجليزيه عن “Compact Disks” او CDs و ما الى ذلك،

 


وهذا اسلوب مفيد جدا جدا فعالم انترنتى لم تعد به اللغه الانجليزيه هي السائدة.

الصورة الحالية[عدل]
انظر الى اي موقع للتجاره الالكترونية،

 


وستجد انه غير ذا فوائد تذكر اذا لم يكن محرك البحث المستخدم فيه قادرا على نقلك الى صفحة المنتج،

 


او المنتجات،

 


التى تريدها اثناء اسرع وقت ممكن.

 


و لذا نجد ان بوابات التجاره و الاعمال الالكترونيه العالمية كEbay و امازون تعتبر برمجيات البحث احد اهم موجوداتها و تسعي باستمرار الى تحديثها.

 


وقد قامت شركة Ebay قبل سنوات بشراء نظام بحث متقدم من شركة Fast Search & Transfer النرويجية،

 


والتى كانت تنتج تقنيه بحث حديثة تقوم بتقديم اخر المعلومات للباحثين عن نتائج المزادات و الاسعار المتداولة.

 


كما ان امازون و مواقع كMarthastewar.com تقوم بالتعامل مع شركة Google و AskJeeves بحيث يتم ربط المستخدمين بالبضائع التي يريدون شرائها من اثناء كتابة سؤال اعتيادى ضمن مربع الاستعلام.

 


وتقول الخبيره ما رثا فراي،

 


وهي باحثه فشؤون التجاره الالكترونيه فمجموعة باتريشيا سيبولد،

 


“يمكن القول بان الاسباب =الرئيس ففشل معظم مواقع التجاره الالكترونية،

 


يعود الى اعتمادها لتقنيات بحث ضعيفة.” كما اكتشفت مؤسسة ميديا ميتريكس للابحاث بان 80 من مستعملى انترنت،

 


يتوقفون عن استعمال موقع ما اذا لم تعمل و ظيفه البحث المضمنه به بالشكل الصحيح.

 


ومن هنا كان السباق بين عدد من الشركات لتطوير تقنيات بحث متقدمة،

 


يمكن للبشر الاعتياديين التعامل معها،

 


والحصول على النتائج التي يريدونها تماما.

 


وسنستعرض فيما يلى عددا من الشركات العالمية التي ابتكرت تقنيات ممكن لها ان تغير و جة انترنت الى الابد.

ايكساليد Exalead[عدل]
ايكساليد Exalead محرك بحث فرنسي متخصص فالتقنيات الحديته للبحث نوعيه نتائج البحث,

 


تصنيف النتائج,

 


صور تمهيديه لكل صفحة.(Exalead)

انفراسيرتش Infrasearch[عدل]
تجمع هذي الشركة ما بين تقنيات البحث المتقدمه التي تحدثنا عنها فالصفحات السابقة،

 


وبين تقنيات برمجيات مشاركه الملفات،

 


وهي ما يطلق عليه البعض برمجيات الند الى الند،

 


او ما يعرف بالانجليزيه باسم P2P،

 


(انظر مقالنا فهذا العدد و المتعلق بهذا الموضوع).

 


وقد قامت شركة صن ما يكروسيستمز العملاقه مؤخرا بشراء هذي الشركة الشابه بمؤسسيها المراهقين الثلاث و طاقم عملها الذي يتكون من 15 مبرمجا.

 


وتعد هذي التقنية،

 


اذا ما كتب لها النجاح فمختبرات صن فان تقنيه انفراسيرتش تعد بالسيطره على عالم البحث عبر انترنت.

 


وتعمل تقنيه انفراسيرتش بالشكل الاتي؛

 


يقوم المستخدم بتنزيل برنامج صغير الحجم على جهازه،

 


ومشاركه دليل معين،

 


او عده ادله على جهازه،

 


يريد ان ممكن المستخدمين الاخرين من البحث فيها.

 


وهذا البرنامج شبية ببرنامج نابستر،

 


ولكن قدراتة لا تقتصر على ملفات MP3 فقط،

 


بل تتعداها لتشمل كل نوعيات الملفات،

 


فاذا كنت تبحث عن الحل لمساله رياضيه معينة مثلا،

 


وكان احد الطلبه ربما قام بحل هذي المساله او المعادلة،

 


ووضع الحل ضمن ملف على جهازه،

 


فانة يمكنك عند البحث باستعمال انفراسيرتش ان تعثر على ذلك الملف و حل المعادلة،

 


اذا كان ذلك المستخدم ربما اختار مشاركتة مع الغير عبر الشبكة.

 


ولا تتوقف قدرات انفراسيرتش هنا،

 


فاذا كنت تريد شراء سيارة معينة،

 


فان برنامج انفراسيرتش ياخذك الى دليل على موقع الشركة،

 


ومن بعدها توجيهك الى القسم الخاص بالسيارة التي تريدها،

 


والحصول على احدث المعلومات عن هذي السيارة،

 


بما فذلك صورة لاحدث موديل لها قام احد المستخدمين بالتقاطها و وضعها على جهازة ليشاركها مع الغير.

 


كما ممكن للوكيل مثلا ان يشارك ملفا على جهازة يحتوى على عقد البيع و اجراءات التسجيل و ما الى ذلك.

 


وبما ان برنامج انفراسيرتش مجاني،

 


فقد كان المخطط الاصلي للشركة هو جعل المؤسسات التجارية،

 


التى تختار استعمال البرنامج فعملياتها،

 


تقوم بدفع مقابل ما دى بسيط جدا جدا مقابل جميع عملية بحث تقوم اجهزة انفراسيرتش المزوده بتوجيهها الى المؤسسة التجارية.

 


وهذا يعني ان عوائد الشركة تعتمد على عدد الاشخاص الذين يقومون بالبحث فشبكتها.

 


واضافه الى ذلك،

 


فان انفراسيرتش كانت تخطط للتعاون مع محركات البحث الشائعه الاستخدام،

 


وذلك لجعل نتائج بحثها “طازجة” و جديدة باكبر قدر ممكن،

 


حيث ان نتائج البحث التي نحصل عليها عاده من هذي المحركات تعتمد على مدي نشاط الروبوتات التي تقوم بفهرسه مواقع انترنت،

 


وهي عاده متاخره حوالى 24 ساعة عما نشر على الشبكة.

 


اما باستعمال تقنيه انفراسيرتش فان النتائج تكون طازجه بالدقيقه و الثانية.

 


وكما قلنا اعلاه،

 


فان انفراسيرتش الان ملك لصن ما يكروسيتمز،

 


ونرجو ان نري منتجها عما قريب على انترنت.

غوغل[عدل]
بدا محرك البحث ذلك Google.com كمشروع لرساله دكتوراه حول تقنيات الذكاء الاصطناعى و المعالجه الطبيعية للغه فجامعة ستانفورد فالولايات المتحدة،

 


وتحول اليوم الى بوابه انترنت عالمية كبري تخدم البحث ب 66 لغه منها العربية)،

 


تقوم بمعالجه 120 مليون طلب بحث يوميا حسب احصائيات مؤسسة ميديا ميتركس للابحاث)،

 


كما ان الموقع اصبح مؤخرا ضمن اكبر 15 موقعا فالولايات المتحدة.

 


ولا يتوقف الامر هنا،

 


حيث ان عوائدة تصل الى 50 مليون دولار سنويا،

 


ويتوقع البعض ان يصل حجم هذي العوائد فالمستقبل القريب الى مليار دولار امريكي حسب مجلة بيزنس و يك الامريكية.

 


والمستخدم لهذا الموقع يعرف تمام المعرفه مدي دقتة فتقديم النتائج المطلوبة،

 


ومن المره الاولى،

 


كما انه لا يتطلب خبره كبري من المستخدم فصياغه الاسئله و الاستعلامات.

 


ويعتمد ذلك الموقع تقنيات احصائيه و رياضيه متقدمه تقوم بدراسه الوثائق المفهرسة،

 


وتكرار العبارات ضمن جميع و ثيقة،

 


وبالتالي الحكم على موضوعها و علاقتها بعبارة البحث التي يقوم المستخدم باستعمالها.

 


ومهما كانت الوصفة السحريه التي يستعملها موقع غوغل فانه يعتبر الاروع بين كافه مواقع البحث المستخدمة اليوم.

اسك Ask[عدل]
موقع Ask.com يستعمل اللغه الطبيعية فالبحث و يعتمد قاعده بيانات و تقنيات تمكن المستخدم من توجية سؤال البحث “باللغه الانجليزية” بلغه سهلة وعاميه كذلك لتقوم قاعده البيانات بالمطابقه بين العبارات المفتاحيه فالسؤال،

 


وبين ما هو موجود فقاعده بياناتها.

 


ورغم هذا فان محرك “اسك” يعتمد جزئيا على التدخل البشرى لتصنيف المعلومات و فهرستها اذا لم تكن موجوده فقاعده البيانات.

 


فعند حصول حدث اخبارى ما مثلا،

 


فان “اسك”لن يتمكن من التعامل مع اي سؤال يتعلق بهذا الحدث الا اذا قام مدراء قواعد البيانات بتحديث النظام.

وقد قامت الشركة المسئوله عن الموقع بطرح نظام مستقل،

 


يمكن للمؤسسات العامله فمجالات التجاره و الاعمال الالكترونيه تضمينة فمواقعها بحيث ممكن لعملائها توجية اسئله و استفسارات باللغه الطبيعية،

 


والحصول على اجوبه لها دون اي تدخل بشري.

اوبن كولا OpenCola[عدل]
نعود هنا الى شركة ثانية =تستعمل تقنيات مشاركه الملفات،

 


والمعالجه الطبيعية للغة،

 


اضافه الى اسلوب المجتمعات الخبيره Expert Communities،

 


لخدمه عملية البحث.

 


وتنتج هذي الشركة برنامجا صغيرا مجانيا يقوم المستخدم بتنزيلة و تثبيته على جهازه،

 


ومن بعدها ممكن له سحب و اسقاط ملف ما سواء نص،

 


او موسيقى،

 


او صورة،

 


او اي نسق كان ضمن ذلك البرنامج،

 


والذى يقوم بالبحث ضمن اجهزة كمبيوتر ثانية =مشاركه فالشبكة،

 


عن ملفات مشابهة.

 


فاذا كنتم مثلي،

 


من هواه جمع اللوحات الالكترونيه للمدرسة الانطباعيه او التكعيبية،

 


وكانت لديكم صورة تمثل احدي هذي المدارس الفنية،

 


فيمكن وضع هذي الصورة ضمن البرنامج،

 


والذى يبحث بعدين فاجهزة الكومبيوتر المشاركه ضمن الشبكه ليحصل على ملفات مماثلة.

 


وماذا عن فكرة المجتمعات الخبيرة

 


تهدف اوبن كولا الى تشجيع المشاركين فشبكتها على مشاركه اجهزتهم مع اشخاص يشابهونهم فالاهتمامات،

 


فاذا كان لدى مجلد على جهازى يحتوى على لوحات الكترونيه للمدرسة التكعيبيه مثلا،

 


فاننى اقوم بمشاركتها ضمن موقع اوبن كولا و ضمن تصنيف خاص بهذه النوعيه من اللوحات.

 


كما ان اوبن كولا تستعمل روبوتات موزعة،

 


او عناصر الية،

 


تعتمد اسلوب البحث فالعناصر البرمجية.

 


ويمكن للمستخدمين تحسين دقه النتائج التي يحصلون عليها بتدريب هذي الروبوتات الباحثة،

 


والتى تتعلم من اثناء التجربة.

اوتونومى Autonomy[عدل]
تعتمد البرمجيات التي تستعملها هذي الشركة Autonomy.com على تقنيه المطابقه ما بين انساق النص و تكرار الكلمات و الكلمات،

 


وذلك لتحديد المفاهيم الاساسيه المميزه لوثيقه ما ،

 


وتشفيرها ضمن هذي الوثيقة،

 


ومن بعدها البحث عن و ثائق تحتوى على مفاهيم مشابهه فنصوص اخرى.

 


وباستعمال ذلك الاسلوب ممكن للباحث ان يقوم بكتابة جمل تصف ما يبحث عنه بلغه سهلة،

 


والبحث على ذلك الاساس.

 


كما ان محرك بحث اوتونومى يمكنة ان يتعلم ما يريدة المستخدم،

 


بناء على نوعيه المواد التي يقراها او يستعرضها ذلك المستخدم.

بريموس Primus[عدل]
تركز برمجيات البحث الخاصة بهذه الشركة على المواد التي تتعامل مع خدمه الزبائن،

 


او المواد الموجوده ضمن نماذج الكترونية،

 


وهي على ذلك الاساس مكمله لما تقوم فيه شركة اوتونومي.

 


وتسمح هذي البرمجيات للمستخدمين بان يقوموا بتوجية اسئله الى قاعده البيانات باستعمال اللغه الطبيعية.

 


ويقوم النظام بجمع نتائج البحث،

 


وتقديمها للمستخدمين الذين يقومون بطرح اسئله مشابهة.

المستقبل[عدل]
يوجد على انترنت اليوم بلايين الصفحات،

 


وحسب المصادر المتوفره فانه ربما تم حتي اليوم فهرسه ما يزيد قليلا على البليون صفحة.

 


وتتسابق الشركات التي تقوم بفهرسه هذي الصفحات فاتاحتها لمستخدمى انترنت،

 


والحفاظ على سرعه الاستجابه التي يحصل عليها المستخدم.

 


واضافه الى السرعه فان على قواعد البيانات هذي ان تثبت و جودها بتقديم اجوبه “طازجة”،

 


ومتناسقة،

 


وذات علاقه بما يبحث عنه المستخدم.

 


كما ان عجله الابتكار لا تتوقف فمجال البحث،

 


فموقع www.hotlinks.com يتيح للمستخدمين امكانيه حفظ مفضلاتهم Favorites ضمن دليل على انترنت،

 


وذلك كى تكون هذي المفضلات متاحه للمستخدم اينما كان،

 


ويمكن للمستخدمين ان يختاروا مشاركه مفضلاتهم مع مستعملى انترنت الاخرين،

 


وتمكين زوار الموقع من البحث على انترنت من اثناء البحث فمفضلات الاخرين،

 


وبالتالي الحصول على معلومات راي مستعملون اخرون انها مفيدة لدرجه وضع المواقع التي تحتويها ضمن مفضلاتهم.

 


كما ان هنالك مواقع للبحث كwww.expertcentral.com و التي تقدم للباحثين اجابات متخصصة.

 


واضافه الى هذا فهنالك الكثير من محركات البحث التي تعتمد تقنيات الشبكات العبنوته Neural Networks،

 


ومحركات البحث التي ممكن تثبيتها على اجهزة المستخدمين،

 


وفهرسه محتويات اقراصهم الصلبة.

 


ونظرا للاهمية المتواصله لمحركات البحث،

 


فان التقنيات الحديثة ستواصل ظهورها،

 


وستواصل التقنيه تطورها لتقديم نتائج اروع للمستخدمين.

 


وبظهور هذي التقنيات فان بعضها سيفشل و بعضها سينجح،

 


وستصبح التقنيات الناجحه جزءا من محركات البحث المستخدمة اليوم.

تطبيقات مستقبلية[عدل]
اذا لم تكن تريد انفاق الملايين فابتكار تقنيات للذكاء الاصطناعى و المعالجه الطبيعية للغة،

 


فان الحل الاسهل هو استعمال الميزات التي تقدمها لغه XML لجعل عملية البحث اكثر دقة.

 


فهذه اللغه كما هو معروف تعتمد على توصيف الوثائق و البيانات عند نشرها على الشبكة.

 


فالمادة المتعلقه بالاسعار مثلا يتم توصيفها بعلامات تدل على انها تمثل السعر،

 


والمادة التي تصف ابعاد بضاعه معينة يتم توصيفها بهذا الشكل.

 


وباستعمال XML ممكن للروبوتات التي تقوم بفهرسه مواقع انترنت ان تفهم المحتوي الموجود ضمن الصفحات.

 


وبالتالي فعندما تبحث عن تذكره سفر بسعر معين مثلا،

 


فان الروبوتات لا تقوم فقط بالعثور على التذكره باروع الاسعار،

 


ولكنها تعثر كذلك على اروع سعر لغرفه فندق،

 


او سيارة مستاجرة.

 


ومن التطبيقات الثانية =مثلا هي انك اذا عرضت سيرتك الذاتيه على الروبوت فانه يقترح عليك اروع و ظيفه تناسب مؤهلاتك.

 


او اذا عرضت على الروبوت ملفك الصحي فانه يقترح عليك الفيتامينات التي يجب عليك تناولها،

 


او النوادى الصحية التي يمكنك الانضمام اليها.

 


وبالطبع فاننا لا نعتقد ان XML هي الحل السحري،

 


ولكنها ممكن ان تؤدى الى زياده نجاعه عمليات البحث اذا ما اقترنت بالتقنيات الثانية =المذكوره فموضوعنا هذا.

محركات البحث عربيا[عدل]
عربيا لا توجد محركات بحث عديدة تعتمد على نفسها،

 


يمكن حصرها ف2 او 3 فقط اذ ان اغلب محركات البحث العربية تعتمد على محركات بحث اجنبية ذلك لعدم قدره الشركات العربية على الاستثمار فهذا المجال و تبقي اغلب محركات البحث التي تعتمد على نفسها كليا ضعيفه لضعف التجهيزات اذ تكون غالبا من اجتهاد افراد على سرفرات عامة.


 

  • اسماء محركات البحث
  • مواقع البحث
  • أسماء قواعد البيانات العالمية
  • اشهر مواقع واسماءها

1٬249 مشاهدة

اسماء محركات البحث , اشهر مواقع البحث العالمية

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني.