اسماء محركات البحث , اشهر مواقع البحث العالمية

محرك البحث (الباحوث) هو برنامج حاسوبى مصمم للمساعده فالعثور علي مستندات مخزنه علي شبكات معلوماتيةالشبكه العنكبوتيه العالميه (بالانجليزية: World Wide Web)) او علي حاسوب شخصي. بنيت محركات البحث الاولي اعتمادا علي التقنيات المستعمله فاداره المكتبات الكلاسيكية. حيث يتم بناء فهارس للمستندات تشكل قاعده للبيانات تفيد فالبحث عن اي معلومة.

محركات البحث الاكثر استخداما و نسبه السيطره علي محركات البحث فاوخر 2023


يسمح محرك البحث للمستخدم ان يطلب المحتوي الذي يقابل معايير محدده (والقاعده بها تلك التي تحتوى علي كلمه او عباره ما ) و يستدعى قائمه بالمراجع توافق تلك المعايير. تستعمل محركات البحث مؤشرات/فهارس/مسارد منتظمه التحديث لتشتغل بسرعه و فعالية.


تعرض النتائج علي شكل قائمه بعناوين المستندات التي توافق الطلب. يرفق بالعناوين فالغالب مختصر عن المستند المشار الية او مقتطف منة للداله علي موافقتة للبحث. ترتب عناصر قائمه البحث علي حسب معايير خاصه (قد تختلف من محرك لاخر)، من اهمها مدي موافقه جميع عنصر للطلب.


عند الحديث عن محركات البحث فغالبا ما يقصد محركات البحث علي شبكه الانترنت و محركات الويب بالخصوص. محركات البحث فالويب تبحث عن المعلومات علي الشبكه العنكبوتيه العالمية، و منها يستخدم علي نطاق ضيق يشمل البحث داخل الشبكات المحليه للمؤسسات اي انترانت (بالانجليزية: Intranet). اما محركات البحث الشخصيه فتبحث فالحواسيب الشخصيه الفردية.


بعض محركات البحث كذلك تحفر فالبيانات المتاحه علي المجموعات الاخبارية، و قواعد البيانات الضخمة، او ادله مواقع الوب كدموز دوت اورج.


محتويات [اخف]

1 تاريخ


2 اشهر محركات البحث


3 كيف تعمل محركات البحث


4 محركات البحث علي الشبكه الانترنت


5 مشاكل تقنيات البحث


5.1 عدم طرح الاسئله الصحيحة


5.2 فجوه المفردات


5.3 الموازنه بين الكم و النوع


5.4 غموض الكلمات


5.5 الاسماء و نوعياتها


6 المعالجه الطبيعيه للغة


6.1 دراسه الجمل


6.2 ازاله الالتباس: اختيار المعني الصحيح


6.3 التصنيف التلقائي


6.4 زياده دقه الاستعلامات


6.5 ربط المفاهيم


7 الصوره الحالية


7.1 ايكساليد Exalead


7.2 انفراسيرتش Infrasearch


7.3 غوغل


7.4 اسك Ask


7.5 اوبن كولا OpenCola


7.6 اوتونومى Autonomy


7.7 بريموس Primus


8 المستقبل


8.1 تطبيقات مستقبلية


8.2 محركات البحث عربيا


9 انظر ايضا


10 ارتباطات خارجية


تاريخ[عدل]

اول محرك بحث كان و اندكس (بالانجليزية: Wandex) [بحاجه لمصدر]، و هو فهرس جمعة متجول و ب و هو زاحف عنكبوتى (بالانجليزية: web crawler) طورة ما ثيو جراى فمعهد ما ساشوستس للتكنولوجيا MIT ف1993. و يعد اليوب (بالانجليزية: Aliweb) محرك بحث احدث مبكر جدا جدا و ربما ظهر ف1993 و يعمل حتي اليوم. و اول محرك بحث قائم علي الزاحف العنكبوتى للنصوص الكامله كان و بكراولر (بالانجليزية: WebCrawler)، و الذي خرج للوجود ف1994. و علي عكس سابقيه، فقد ترك المستخدمين يبحثون عن اي كلمه علي اي صفحه و يب، و هو ما صار القاعده لكل محركات البحث الكبري منذ هذا الوقت. كان هو كذلك الاول فمعرفه الجمهور بة علي نطاق و اسع. ف1994 ايضا جاء لايكوس (بالانجليزية: Lycos) (الذى بدا فجامعه كارنيجى ميلون (بالانجليزية: Carnegie Mellon University)) و صار مشروعا تجاريا كبيرا.


بعد هذا بقليل، ظهر الكثير من محركات البحث و تزاحمت علي الشعبية. و كان من ضمنها اكسايت (بالانجليزية: Excite)، انفوسيك (بالانجليزية: Infoseek)، و انكتومى (بالانجليزية: Inktomi)، و نورثرن لايت (بالانجليزية: Northern Light)، و التافيستا (بالانجليزية: Alta Vista). و فبعض الحالات تنافست مع الادله ذات الشعبيه كياهو! (بالانجليزية: !Yahoo). فيما بعد، ادمجت الادله او اضافت اليها تقنيه محرك البحث من اجل اداء اكبر للوظائف.


عرفت محركات البحث كذلك بكونها بعض المع النجوم فنوبه الاستثمار فالانترنت التي و قعت فاواخر التسعينات. دخلت عده شركات السوق فمشهد كبير، مسجله مكاسب قياسيه اثناء طرح اسهمها العام الافتتاحي. و ربما سحب البعض محركاتهم البحثيه العامة، و هم يسوقون نسخا للشركات فقط، كنورثرن لايت التي كانت من ال8 او 9 محركات بحث المبكره بعد ان جاء لايكوس (بالانجليزية: Lycos).


قبل مجيء الانترنت، كانت هنالك بواحيث لموافيق (بروتوكولات)او استخدامات اخرى، كمحرك بحث اركى لمواقع اف‌.تي.‌بى المجهوله (بالانجليزية: anonymous FTP) و محرك بحث ڤيرونيكا لبروتوكول جوفر.


وستاتى بعض محركات البحث الاخري منها اية ناين.كوم a9.com (امازون.كوم)، اسك چيڤيز/تيوما (بالانجليزية: Ask Jeeves/Teoma)، جيجابلاست، سناپ (بالانجليزية: Snap)، و الهاللو (بالانجليزية: Walhello)، كازاز (بالانجليزية: Kazazz)، و وايسنت (بالانجليزية: WiseNut). و بعض احدث اخر محركات البحث، و التي تبحث فقط نوعياتا محدده من المحتوي هى پلازو Plazoo (لمردود الخلاصات RSS feeds)، و جوهوك GoHook (لملفات پى دى اف PDF بشكل رئيسي). و من اشهر المحركات ايضا: Yooci و ThroughSearch


اشهر محركات البحث[عدل]

جوجل (بالانجليزية: Google)


ياهو (بالانجليزية: Yahoo!)


بينج (بالانجليزية: Bing)


لايف سيرش (بالانجليزية: LiveSearch)


دك دك غو (بالانجليزية: DuckDuckGo)


كيف تعمل محركات البحث[عدل]

تعمل محركات البحث عن طريق تخزين المعلومات عن عدد كبير من صفحات الوب، و التي تستعيدها من الشبكه العالميه و ورلد و ايد و ب نفسها. تستعاد هذة الصفحات بواسطه زاحف و ب (يعرف احيانا كذلك ب ’عنكبوت‘) – و هو مستعرض و ب الى يتبع جميع رابط يراه. بعد هذا يجرى تحليل جميع صفحه لتحديد كيف ينبغى فهرستها (علي سبيل المثال، تستخلص العبارات من العناوين، رؤوس الموضوعات، او حقول خاصه تعرف ب ميتا تاجز). تخزن البيانات عن صفحات الوب فقاعده بيانات فهرسيه للاستعمال فعمليات البحث طلبا للمعلومات لاحقا. بعض محركات البحث، كجوجل، تخزن جميع او بعض الصفحه المصدر (وتشير لها ب مخبوءة) و بالمثل معلومات عن صفحات الوب، بينما بعضها تخزن جميع كلمه من جميع صفحه تجدها، كالتاڤيستا. هذة الصفحه المخبوءه تمسك بنص البحث الفعلى بما انه هو الذي تمت فهرستة فعليا، لذلك فقد تكون مفيده جدا جدا عندما يصبح محتوي الصفحه الحاليه ربما جري تجديدة و لم تعد الفاظ البحث فيه. قد تعتبر هذة المشكله شكلا خفيفا من تعفن الروابط، و تزيد معالجه جوجل لها من امكانيه الاستعمال بارضاء توقعات المستخدم بان ترد الفاظ البحث فصفحات الوب العائده فالرد. و هو ما يرضى ’مبدا مفاجاه اخف من مفاجاة‘ بما ان المستخدم يتوقع بشكل طبيعى الفاظ البحث فالنتيجه العائده له. و هذة الصله بالبحث تجعل هذة الصفحات المخبوءه مفيده جدا، حتي اكثر من و اقع انها ربما تحتوى علي بيانات قد لم تعد متاحه فموضع اخر.


عندما يتوجة مستعمل لمحرك البحث و يجرى عمليه بحث طلبا للمعلومات، كما هو سائد باعطاء عبارات مفتاحية، يفتش المحرك فالفهرس و يقدم قائمه بصفحات الوب الاروع توافقا تبعا لمعاييره، فالمعتاد مع ملخص قصير يحتوى علي عنوان الوثيقه و احيانا اجزاء من النص. معظم محركات البحث تدعم استعمال الاصطلاحات البولينيه (نسبه للجبر البولينى و هو نوع من المتغيرات المنطقية): AND و OR و NOT لمزيد من تحديد طلب المعلومات. و هنالك خدمه و ظيفيه متقدمه هى البحث بالتقارب، و التي تسمح لك بتحديد المسافه بين العبارات المفتاحية، باستعمال الفاظ كNEAR، NOT NEAR، FOLLOWED BY، NOT FOLLOWED BY، SENTENCE، FAR.


يعتمد مدي فوائد محرك بحث علي مدي صله النتائج التي يرد بها. فبينما ربما تكون هنالك ملايين صفحات الوب التي تحتوى علي كلمه او عباره محددة، ربما تكون بعض اوثق صلة، او اروج، او معتمده اكثر من غيرها. معظم محركات البحث توظف اساليب لوضع مراتب النتائج لتقدم اروع النتائج اولا. الطريقة التي يقرر فيها محرك بحث اي الصفحات هى الاروع توافقا، و ما النظام الذي يجب ان تخرج بة النتائج، تختلف بشكل شاسع من محرك لاخر. الاساليب كذلك تتغير عبر الزمن بتغير استعمال انترنت و تكنيكات حديثة تتطور.


معظم محركات البحث هى مضاربات تجاريه يدعمها عائد اعلانى و ، بالنتيجة، يوظف البعض الممارسه المثيره للجدل بالسماح للمعلنين بدفع النقود ليرفعوا لهم قوائهم فمراتب نتائج البحث.


الاغلبيه الكاسحه من محركات البحث تديرها شركات خاصه تستعمل خوارزميات ملكها و قواعد بيانات مغلقة، و اكثرها رواجا حاليا هى جوجل و باحث اماسان و ياهو. توجد تقنيه محركات بحث مفتوحه المصدر كاتشتيدج، نتش، سيناز، ايجوثور و اوبنافتياس، و لكن ليس هنالك خادم بحث و ورلد و ايد و ب مشاع يستعمل هذة التقنية.


جاء تطور محرك بحث الوب من تطور محركات البحث علي شبكات الاجهزه و الشبكات الداخلية.


محركات البحث علي الشبكه الانترنت[عدل]

يمكننا القول بان الشبكه و مواقعها لن تكون ذات فوائد كبيره بالنسبه لنا لو لم تكن محركات البحث علي انترنت موجودة. فالبدء كانت محركات البحث عباره عن ادلاء تقوم بفهرسه مواقع الانترنت الجديدة. و ربما كان هذا فعالا عندما كان حجم انترنت يقدر بملايين الصفحات. بعدها تطورت انترنت، و انضم اليها الملايين من مؤسسات الاعمال، و المؤسسات الحكومية، و بلايين الصفحات من ادله استعمال المنتجات، و المعلومات الخاصه بالمستثمرين، و غير هذا من المعلومات التي تقوم بتسيير عجله اقتصاد انترنت. و مع ذلك النمو اصبح من الضروري، بل و من الحتمى اضافه محرك بحث فعال الي كافه مواقع انترنت، يقوم بفهرسه و تصنيف المعلومات الموجوده ضمن هذة المواقع كى تتمكن من خدمه زوارها بشكل فعال. و اليوم، و بعد ان اصبحت محركات البحث جزءا اساسيا فحضارتنا الانترنتية، فان هنالك العشرات من الشركات العامله فمجال انتاج برمجيات، و تقنيات، و اساليب بحث حديثة موجهه نحو انترنت و انترانت. و بسبب الدور المتزايد الذي تلعبة التجاره و الاعمال الالكترونيه فاقتصاد اليوم، فان الحافز المادى علي الاقل موجود. و لكن رغم النجاح الذي تدعى الشركات المنتجه لتقنيات البحث تحقيقه، فان المستخدمين لا زالوا يشكون من افتقار محركات البحث الي الدقه المطلوبة، و تلبيه النتائج التي يتم تحصيلها لمتطلبات المستخدمين


مشاكل تقنيات البحث[عدل]

ان مفتاح النجاح فالحصول علي نتائج بحث جيدة، تكمن فنوعيه الاستفسارات، او الاسئلة، او الكلمات او العبارات المفتاحيه التي نقوم بادخالها فمحركات البحث. لكن المشكله الاساسيه هنا تكمن فان الغالبيه العظمي من المستخدمين لا يقومون عاده بادخال الاستفسارات او العبارات المفتاحيه الصحيحة، و التي تؤدى الي الحصول علي النتائج المطلوبة، و سنستعرض فيما يلى المشاكل الشائعه فعالم البحث عن المعلومات، و الطرق التي يحاول فيها الباحثون معالجه هذة المشكلات.


عدم طرح الاسئله الصحيحة[عدل]

من الحقائق الغريبه التي يؤكدها خبراء المعلومات هى ان المستخدمين نادرا ما يقومون بطرح الاسئله التي تعبر عما يريدونة فعلا. و الاسباب =الرئيس فذلك هو الافتقار الي الفهم الصحيح للمقال قيد البحث، و بالتالي عدم استعمال العبارات المفتاحيه الصحيحة، و التي تؤدى الي تكوين استعلامات و اسئله صحيحة. فالمشكله الاساسيه هنا اذا، هى مساعده المستخدمين علي طرح الاسئله و تكوين الاستعلامات الصحيحة. و من مظاهر هذة المشكله كذلك هى صغر حجم الاستعلامات التي يكونها المستخدم عاده للاستفسار عن مقال معين. فاذا كان مستعمل ما يريد معلومات عن “السفر” مثلا، فانة يبدا بادخال كلمه عامه فمحرك البحث، و من ثم، و اعتمادا علي النتائج التي يحصل عليها، يقوم بتضييق نطاق بحثة الي ان يصل الي ما يريده. و الاسباب =فان الكثير من مستعملى انترنت يستخدمون ذلك الاسلوب يكمن فانهم لا يعرفون حقا الحجم المهول للمعلومات الموجوده فقواعد البيانات الخاصه بمحركات البحث، و التي تفوق عاده ما ممكن لاى انسان التعامل معه.


فجوه المفردات[عدل]

تتميز معظم اللغات الطبيعيه بتنوع المفردات التي تتناول نفس المعنى، فمثلا ( السحاب، الغمام، المزن، العارض.. و غيرها) تدور حول نفس المعني سحاب، و بينما يدرك الانسان تطابق هذة المفردات فالمعني تعجز محركات البحث التقليديه عن استيعاب جميع المرادفات الممكنة، فتفتقر نتائجها الي كثير من الوثائق ذات العلاقه بمقال البحث لكنها لم تستعمل نفس مفردات المستخدم، و تسمي هذة المشكله فجوه المفردات.


الموازنه بين الكم و النوع[عدل]

عند التعامل مع تقنيات البحث فلا بد من الموازنه بين الكم و النوع، او ما يدعوة الخبراء بالدقه و القدره علي الاسترجاع. و هى علاقه عكسيه تماما، فكلما تم تضييق نطاق البحث سعيا عن نتائج اكثر دقة، كلما قل مقدار البيانات الذي ممكن استرجاعه. و لذا فان هنالك حاجه لوجود محركات بحث تقدم دقه عاليه دون التضحيه بمقدار النتائج “الدقيقة” التي نسترجعها.


غموض الكلمات[عدل]

معظم العبارات تحمل اكثر من معنى، و معظم محركات البحث المستخدمه اليوم تقوم بمطابقه العبارات و ليس معانيها، و لذا فان نتائج عمليات البحث التي نحصل عليها، تحتوى غالبا علي العبارات المفتاحيه الصحيحة، و لكنها ذات المعني الخاطئ. فاذا جربت مثلا ان تبحث عن معني كلمه “جافا” مثلا، و هى احدي لغات البرمجه الشائعه الاستخدام، فانك ستحصل العديد من النتائج المتعلقه بالجفاف، او باسم جزيره اندونيسيه تحمل الاسم نفسه، اضافه الي معلومات عن لغه البرمجه لانة يبحث عن البنيه الصرفيه و الشكلية للكلمه و ليس المعنى.


الاسماء و نوعياتها[عدل]

وماذا عن البحث فالاسماء، اي البحث عن معلومات عن الاشخاص و الاماكن، و ما الي ذلك. خصوصا و ان الكتاب يغيرون عاده الكيفية التي يقومون فيها بكتابه الاسماء. و اذا ما تحدثنا مثلا عن اسماء الشركات، فانها تتغير باستمرار نتيجه عمليه الاندماج و الضم، مما يجعل عمليه البحث صعبة. و ربما يقول البعض انه ممكن التغلب علي هذة المشكله نوعا ما باستعمال برمجيات الفهرسة، و لكن المشكله هى ان المعلومات فعالمنا تتغير باستمرار مما يجعل الفهرسه اليدويه صعبة. و ما ذا عن الفهرسه الالية؟ الاجابه هى انه لا توجد بعد التقنيه التي يمكنها القيام بذلك بدقة، بحيث ممكن التمييز مثلا بين موضوع كامل عن شخص معين، و موضوع احدث يذكر اسم الشخص بشكل عابر.


المعالجه الطبيعيه للغة[عدل]

يجمع العاملون فمجال محركات البحث بان الحل لكافه هذة المشاكل يكمن فتصميم محركات البحث، و برمجيات البحث عموما، بحيث تستفيد من برمجيات المعالجه الطبيعيه للغه Natural Language Processingعموما، و المعالجه الطبيعيه للمعني Natural Meaning Processing، و الاستفاده من قواعد اللغة. النقطه الاساسيه هنا هى ان اللغه عموما مبنيه علي اساس قواعد ذات اساس شبية بالمعادلات الرياضية، كما ان كلمات اللغه و كلماتها تكون مبنيه حسب هيكليه معينة, فلكل جمله مبتدا و خبر، او فعل و فاعل و مفعول به، كما ان العبارات تاتى عاده من جذور و اصول. و هذة الهيكليه المبنيه ضمن اللغه تتناسب و طبيعه عمل برمجيات الحاسوب، و التي تحتاج الي هيكليه معينه تنفذ علي اساسها عملياتها. اما المعالجه الطبيعيه للمعني فهى اكثر صعوبة، فكلمه ك“راحة” ممكن لها ان تعنى عده اشياء، كالارتياح بعد التعب، او الراحه الابديه و التي تعنى الموت، او راحه اليد. و لهذا فان برمجيات البحث يجب ان تتمكن من فهم الكلمه ضمن سياق النص، و دور الكلمه فهذا السياق. و لكن حتي ذلك الاسلوب لا يفلح دوما ففهم المعنى. جرب ان تقرا ديوانا شعريا جيدا، و ستجد ان هناك العديد من العبارات الصعبة، و التي ربما يحاول البعض فهمها من السياق، و لكننا عندما نعجز عن هذا فاننا نتجة الي القاموس. و ذلك اسلوب ممكن لبرمجيات الحاسوب اتباعه، اي الاعتماد علي قاموس او فهرس بالعبارات و الكلمات الشائعه الاستخدام، و البحث فالسياق. و فيما يلى بعض مفاهيم البحث التي تعتمد علي المعالجه الطبيعيه للغة؛


دراسه الجمل[عدل]

تتميز الجمل بانها ذات هيكليه محدده و واضحة، مما يساعد ففهم المعني بشكل سريع. و من اثناء تحديد نوع الجملة، ممكن لبرمجيات البحث ان تقوم بعملها بشكل اكثر دقة. و لعمل هذا فان هذة البرمجيات يجب ان تعتمد علي كميات كبيره من المصادر و المراجع اللغوية، كالمكانز، و التي تحتوى علي كلمات و جمل ذات علاقات محدده مسبقا. و باستعمال هذة المكانز ممكن لبرمجيات البحث ان تفهم بشكل اروع طبيعه العلاقه بين العبارات المختلفه و مواقعها الصحيحه ضمن الجمل. و رغم الفوائد العظيمه للمكانز، فان مدي فعاليتها يعتمد علي تحديثها باستمرار، و الا فانها تفقد فاعليتها تدريجيا. و باستعمال المكانز، و تصريف الجمل و اعرابها ممكن الحصول علي نظم بحث قويه يمكنها فهم كلمات البحث و معانى العبارات ضمن السياق بشكل افضل.


ازاله الالتباس: اختيار المعني الصحيح[عدل]

اوضحنا فالنقطه اعلاة كيف ممكن للمكانز و نظم تصريف و اعراب الجمل ان تسهم بشكل اروع ففهم المعني من اثناء السياق. و هذة التقنيه مفيده اذا كنا نبحث ضمن نصف معين، و لكنها ليست مفيده عند ادخال الاستفسارات و الاستعلامات ضمن محركات البحث، حيث تتكون هذة عاده من عدد محدود من الكلمات، و بالتالي فان حجم النص غير كاف لتحليل معني الكلمات. و الحل لهذة المشكله و اضح الي درجه الاحراج و يتمثل فسؤال المستخدم عن المعني الذي يقصده؛ فعندما يدخل المستخدم كلمه “راحة” مثلا ضمن مربع الاستعلام، فان محرك البحث يسالة عن المعني المقصود، او المعني المراد البحث عنه، قبل الشروع بعمليه البحث. و توجد اليوم الكثير من محركات البحث التي تستعمل قواميس مضمنه تقوم بتقديم قوائم بالمعانى المختلفه التي تمثلها الكلمه الواحده قبل الشروع فعمليه البحث. و من هذة المحركات هنالك LexiGuide من شركه LexiQuest، و Oingo، و Simplifind علي موقع Simpli.com.


التصنيف التلقائي[عدل]

هذا الاسلوب هو الاقدم، حيث يتم تصنيف الوثائق حسب تصنيفات و فروع معينة، و من بعدها البحث بشكل منفصل ضمن جميع تصنيف عن المعلومات المطلوبة. فمثلا، عند البحث عن كلمه “نواة” فان بحثك ربما يقودك الي تصنيف يتعلق بعلوم الزراعة، و نوعيات الحبوب، و ما الي ذلك، و لكنة فالوقت نفسة ربما يقودك الي تصنيف يقع ضمن علوم الفيزياء النووية. و الحل هنا يكمن فتصنيف الوثائق المتعلقه بانويه الحبوب و المزروعات فقسم الزراعه مثلا، و الوثائق المتعلقه بانويه الذرات فقسم الفيزياء الذرية. و لكن ما ذا لو كانت لدينا و ثيقه تتعلق بتاثير التجارب النوويه علي انويه الحبوب و المزروعات؟ هل يجب عندها و ضع الوثيقه فالقسمين، ام ما هو الحل؟ و هنا تنشا لدينا مشكله المعني المزدوج. و من هنا تاتى اهميه التصنيف التلقائي، حيث يتم استعمال علوم النحو من تصريف و اعراب، و استعمال المكانز و القواميس، بحيث يتمكن النظام من “فهم” المقالات الرئيسه فو ثيقه ما . و يتم هذا باستعمال اساليب احصائيه تقوم بدراسه تكرار العبارات ضمن و ثيقه ما ، و من بعدها تحديد السياق، و الذي يساعد فعمليه البحث. و كمثال علي هذا لناخذ كلمة، او اسم ك“فهد” او “ليث” و هى اسماء عربيه دارجة. و لنفترض اننا كتبنا موضوعا فمجلتنا عن شخص اسمة “فهد”، و لنفترض ان محرك بحث اراد تصنيف مقالنا هذا. فهذة الحال، و اذا كان محرك البحث يستعمل اسلوب التصنيف التلقائي، فانة سيقوم من اثناء دراسه النص و نوعيه العبارات الموجوده فية و علاقاتها و تكرارها، بتحديد ان الموضوع ينتمى الي تصنيف علوم الحاسوب و الانترنت و ليس الحيوانات و الوحوش البرية. و تتبع برمجيات التصنيف التلقائى قواعد معينه يحددها المبرمجون، او ممكن للاله نفسها ان تتعلم ذاتيا كيف تقوم بتصنيف الكلمات. او ممكن استعمال الاسلوبين، بحيث يتم تصنيف الوثائق التي تتبع نمطا معينا بشكل تلقائي، فحين يتم تحويل تلك التي يستحيل تصنيفها الي عامل بشرى كى يقوم بذلك.


زياده دقه الاستعلامات[عدل]

من يستخدم محركات البحث باستمرار يعلم انه من المحتوم الحصول علي مئات الالوف من النتائج علي الاقل عند البحث عن مقال معين بشكل عام. اما عند تضييق نطاق البحث، فاننا نحصل علي مقدار اقل من النتائج الاكثر دقة. و لزياده دقه الاستعلامات، فان بعض محركات البحث يقوم بتعديل الاستعلام، و هذا بتقديم معان مرادفه لعبارات البحث الي المستخدم، لمساعدتة علي تحديد مقال بحثة بدقه اكبر. ففى كهذة النظم، و اذا كان مقال استعلامك هو “الرياضة” مثلا، فان النظام يقدم لك عددا من البدائل التي تساعد فتحديد مقال البحث ك“التربيه البدنية”، “اللياقه البدنية” او “اللياقة” و غير هذا من المرادفات التي تساعد علي توجية العمليه بحيث يحصل المستخدم علي اكبر كم من النتائج الدقيقه التي تعبر عن مقال البحث.


ربط المفاهيم[عدل]

اذا جربت اليوم ان تبحث عن العباره “اسطوانات الليزر” (وهى العباره العاميه و القديمه للاقراص المدمجة) فانك لن تحصل علي العديد من النتائج المفيده من محركات البحث، حيث ان عباره “الاقراص المدمجة” هى الكلمه الشائعه و المستخدمه فالغالبيه العظمي من المطبوعات. و لهذا فان الكثير من محركات البحث هذة الايام تستعمل اسلوب الربط بين المفاهيم، بحيث انك اذا قمت بكتابه العباره “اقراص الليزر” فانك ستحصل علي معلومات عن “الاقراص المدمجة”. و يعتمد ذلك الاسلوب علي تحديد العلاقه بين العبارات و الكلمات فقاعده البيانات بشكل مسبق، كما انه مفيد عند البحث فو ثائق متعدده اللغات، فالبحث عن كلمه “اقراص الليزر” ممكن ان يعطى نتائج لوثائق باللغه الانجليزيه عن “Compact Disks” او CDs و ما الي ذلك، و ذلك اسلوب مفيد جدا جدا فعالم انترنتى لم تعد فية اللغه الانجليزيه هى السائدة.


الصوره الحالية[عدل]

انظر الي اي موقع للتجاره الالكترونية، و ستجد انه غير ذا فوائد تذكر اذا لم يكن محرك البحث المستخدم بة قادرا علي نقلك الي صفحه المنتج، او المنتجات، التي تريدها اثناء اسرع و قت ممكن. و لذا نجد ان بوابات التجاره و الاعمال الالكترونيه العالميه كEbay و امازون تعتبر برمجيات البحث احد اهم موجوداتها و تسعي باستمرار الي تحديثها. و ربما قامت شركه Ebay قبل سنوات بشراء نظام بحث متقدم من شركه Fast Search & Transfer النرويجية، و التي كانت تنتج تقنيه بحث حديثة تقوم بتقديم اخر المعلومات للباحثين عن نتائج المزادات و الاسعار المتداولة. كما ان امازون و مواقع كMarthastewar.com تقوم بالتعامل مع شركه Google و AskJeeves بحيث يتم ربط المستخدمين بالبضائع التي يريدون شرائها من اثناء كتابه سؤال اعتيادى ضمن مربع الاستعلام. و تقول الخبيره ما رثا فراي، و هى باحثه فشؤون التجاره الالكترونيه فمجموعه باتريشيا سيبولد، “يمكن القول بان الاسباب =الرئيس ففشل معظم مواقع التجاره الالكترونية، يعود الي اعتمادها لتقنيات بحث ضعيفة.” كما اكتشفت مؤسسه ميديا ميتريكس للابحاث بان 80% من مستعملى انترنت، يتوقفون عن استعمال موقع ما اذا لم تعمل و ظيفه البحث المضمنه فية بالشكل الصحيح. و من هنا كان السباق بين عدد من الشركات لتطوير تقنيات بحث متقدمة، ممكن للبشر الاعتياديين التعامل معها، و الحصول علي النتائج التي يريدونها تماما. و سنستعرض فيما يلى عددا من الشركات العالميه التي ابتكرت تقنيات ممكن لها ان تغير و جة انترنت الي الابد.


ايكساليد Exalead[عدل]

ايكساليد (Exalead) محرك بحث فرنسى متخصص فالتقنيات الحديته للبحث : نوعيه نتائج البحث, تصنيف النتائج, صور تمهيديه لكل صفحة.(Exalead)


انفراسيرتش Infrasearch[عدل]

تجمع هذة الشركه ما بين تقنيات البحث المتقدمه التي تحدثنا عنها فالصفحات السابقة، و بين تقنيات برمجيات مشاركه الملفات، و هى ما يطلق علية البعض برمجيات الند الي الند، او ما يعرف بالانجليزيه باسم P2P، (انظر مقالنا فهذا العدد و المتعلق بهذا الموضوع). و ربما قامت شركه صن ما يكروسيستمز العملاقه مؤخرا بشراء هذة الشركه الشابه بمؤسسيها (المراهقين الثلاث) و طاقم عملها الذي يتكون من 15 مبرمجا. و تعد هذة التقنية، اذا ما كتب لها النجاح فمختبرات صن فان تقنيه انفراسيرتش تعد بالسيطره علي عالم البحث عبر انترنت. و تعمل تقنيه انفراسيرتش بالشكل الاتي؛ يقوم المستخدم بتنزيل برنامج صغير الحجم علي جهازه، و مشاركه دليل معين، او عده ادله علي جهازه، يريد ان ممكن المستخدمين الاخرين من البحث فيها. و ذلك البرنامج شبية ببرنامج نابستر، و لكن قدراتة لا تقتصر علي ملفات MP3 فقط، بل تتعداها لتشمل كل نوعيات الملفات، فاذا كنت تبحث عن الحل لمساله رياضيه معينه مثلا، و كان احد الطلبه ربما قام بحل هذة المساله او المعادلة، و وضع الحل ضمن ملف علي جهازه، فانة يمكنك عند البحث باستعمال انفراسيرتش ان تعثر علي ذلك الملف و حل المعادلة، اذا كان ذلك المستخدم ربما اختار مشاركتة مع الغير عبر الشبكة. و لا تتوقف قدرات انفراسيرتش هنا، فاذا كنت تريد شراء سياره معينة، فان برنامج انفراسيرتش ياخذك الي دليل علي موقع الشركة، و من بعدها توجيهك الي القسم الخاص بالسياره التي تريدها، و الحصول علي احدث المعلومات عن هذة السيارة، بما فذلك صوره لاحدث موديل لها قام احد المستخدمين بالتقاطها و وضعها علي جهازة ليشاركها مع الغير. كما ممكن للوكيل مثلا ان يشارك ملفا علي جهازة يحتوى علي عقد البيع و اجراءات التسجيل و ما الي ذلك. و بما ان برنامج انفراسيرتش مجاني، فقد كان المخطط الاصلى للشركه هو جعل المؤسسات التجارية، التي تختار استعمال البرنامج فعملياتها، تقوم بدفع مقابل ما دى بسيط جدا جدا مقابل جميع عمليه بحث تقوم اجهزه انفراسيرتش المزوده بتوجيهها الي المؤسسه التجارية. و ذلك يعنى ان عوائد الشركه تعتمد علي عدد الاشخاص الذين يقومون بالبحث فشبكتها. و اضافه الي ذلك، فان انفراسيرتش كانت تخطط للتعاون مع محركات البحث الشائعه الاستخدام، و هذا لجعل نتائج بحثها “طازجة” و جديدة باكبر قدر ممكن، حيث ان نتائج البحث التي نحصل عليها عاده من هذة المحركات تعتمد علي مدي نشاط الروبوتات التي تقوم بفهرسه مواقع انترنت، و هى عاده متاخره حوالى 24 ساعه عما نشر علي الشبكة. اما باستعمال تقنيه انفراسيرتش فان النتائج تكون طازجه بالدقيقه و الثانية. و كما قلنا اعلاه، فان انفراسيرتش الان ملك لصن ما يكروسيتمز، و نرجو ان نري منتجها عما قريب علي انترنت.


غوغل[عدل]

بدا محرك البحث ذلك Google.com كمشروع لرساله دكتوراه حول تقنيات الذكاء الاصطناعى و المعالجه الطبيعيه للغه فجامعه ستانفورد فالولايات المتحدة، و تحول اليوم الي بوابه انترنت عالميه كبري تخدم البحث ب 66 لغه (منها العربية)، تقوم بمعالجه 120 مليون طلب بحث يوميا (حسب احصائيات مؤسسه ميديا ميتركس للابحاث)، كما ان الموقع اصبح مؤخرا ضمن اكبر 15 موقعا فالولايات المتحدة. و لا يتوقف الامر هنا، حيث ان عوائدة تصل الي 50 مليون دولار سنويا، و يتوقع البعض ان يصل حجم هذة العوائد فالمستقبل القريب الي مليار دولار امريكى حسب مجله بيزنس و يك الامريكية. و المستخدم لهذا الموقع يعرف تمام المعرفه مدي دقتة فتقديم النتائج المطلوبة، و من المره الاولى، كما انه لا يتطلب خبره كبري من المستخدم فصياغه الاسئله و الاستعلامات. و يعتمد ذلك الموقع تقنيات احصائيه و رياضيه متقدمه تقوم بدراسه الوثائق المفهرسة، و تكرار العبارات ضمن جميع و ثيقة، و بالتالي الحكم علي موضوعها و علاقتها بعباره البحث التي يقوم المستخدم باستعمالها. و مهما كانت الوصفه السحريه التي يستعملها موقع غوغل فانة يعتبر الاروع بين كافه مواقع البحث المستخدمه اليوم.


اسك Ask[عدل]

موقع Ask.com يستعمل اللغه الطبيعيه فالبحث و يعتمد قاعده بيانات و تقنيات تمكن المستخدم من توجية سؤال البحث “باللغه الانجليزية” بلغه سهله (وعاميه ايضا) لتقوم قاعده البيانات بالمطابقه بين العبارات المفتاحيه فالسؤال، و بين ما هو موجود فقاعده بياناتها. و رغم هذا فان محرك “اسك” يعتمد جزئيا علي التدخل البشرى لتصنيف المعلومات و فهرستها اذا لم تكن موجوده فقاعده البيانات. فعند حصول حدث اخبارى ما مثلا، فان “اسك”لن يتمكن من التعامل مع اي سؤال يتعلق بهذا الحدث الا اذا قام مدراء قواعد البيانات بتحديث النظام.


وقد قامت الشركه المسئوله عن الموقع بطرح نظام مستقل، ممكن للمؤسسات العامله فمجالات التجاره و الاعمال الالكترونيه تضمينة فمواقعها بحيث ممكن لعملائها توجية اسئله و استفسارات باللغه الطبيعية، و الحصول علي اجوبه لها دون اي تدخل بشري.


اوبن كولا OpenCola[عدل]

نعود هنا الي شركه اخري تستعمل تقنيات مشاركه الملفات، و المعالجه الطبيعيه للغة، اضافه الي اسلوب المجتمعات الخبيره Expert Communities، لخدمه عمليه البحث. و تنتج هذة الشركه برنامجا صغيرا مجانيا يقوم المستخدم بتنزيلة و تثبيتة علي جهازه، و من بعدها ممكن له سحب و اسقاط ملف ما (سواء نص، او موسيقى، او صورة، او اي نسق كان) ضمن ذلك البرنامج، و الذي يقوم بالبحث ضمن اجهزه كمبيوتر اخري مشاركه فالشبكة، عن ملفات مشابهة. فاذا كنتم مثلي، من هواه جمع اللوحات الالكترونيه للمدرسه الانطباعيه او التكعيبية، و كانت لديكم صوره تمثل احدي هذة المدارس الفنية، فيمكن و ضع هذة الصوره ضمن البرنامج، و الذي يبحث بعدين فاجهزه الكومبيوتر المشاركه ضمن الشبكه ليحصل علي ملفات مماثلة. و ما ذا عن فكره المجتمعات الخبيرة؟ تهدف اوبن كولا الي تشجيع المشاركين فشبكتها علي مشاركه اجهزتهم مع اشخاص يشابهونهم فالاهتمامات، فاذا كان لدى مجلد علي جهازى يحتوى علي لوحات الكترونيه للمدرسه التكعيبيه مثلا، فاننى اقوم بمشاركتها ضمن موقع اوبن كولا و ضمن تصنيف خاص بهذة النوعيه من اللوحات. كما ان اوبن كولا تستعمل روبوتات موزعة، او عناصر الية، تعتمد اسلوب البحث فالعناصر البرمجية. و ممكن للمستخدمين تحسين دقه النتائج التي يحصلون عليها بتدريب هذة الروبوتات الباحثة، و التي تتعلم من اثناء التجربة.


اوتونومى Autonomy[عدل]

تعتمد البرمجيات التي تستعملها هذة الشركه Autonomy.com علي تقنيه المطابقه ما بين انساق النص و تكرار الكلمات و الكلمات، و هذا لتحديد المفاهيم الرئيسيه المميزه لوثيقه ما ، و تشفيرها ضمن هذة الوثيقة، و من بعدها البحث عن و ثائق تحتوى علي مفاهيم مشابهه فنصوص اخرى. و باستعمال ذلك الاسلوب ممكن للباحث ان يقوم بكتابه جمل تصف ما يبحث عنة بلغه سهلة، و البحث علي ذلك الاساس. كما ان محرك بحث اوتونومى يمكنة ان يتعلم ما يريدة المستخدم، بناء علي نوعيه المواد التي يقراها او يستعرضها ذلك المستخدم.


بريموس Primus[عدل]

تركز برمجيات البحث الخاصه بهذة الشركه علي المواد التي تتعامل مع خدمه الزبائن، او المواد الموجوده ضمن نماذج الكترونية، و هى علي ذلك الاساس مكمله لما تقوم بة شركه اوتونومي. و تسمح هذة البرمجيات للمستخدمين بان يقوموا بتوجية اسئله الي قاعده البيانات باستعمال اللغه الطبيعية. و يقوم النظام بجمع نتائج البحث، و تقديمها للمستخدمين الذين يقومون بطرح اسئله مشابهة.


المستقبل[عدل]

يوجد علي انترنت اليوم بلايين الصفحات، و حسب المصادر المتوفره فانة ربما تم حتي اليوم فهرسه ما يزيد قليلا علي البليون صفحة. و تتسابق الشركات التي تقوم بفهرسه هذة الصفحات فاتاحتها لمستخدمى انترنت، و الحفاظ علي سرعه الاستجابه التي يحصل عليها المستخدم. و اضافه الي السرعه فان علي قواعد البيانات هذة ان تثبت و جودها بتقديم اجوبه “طازجة”، و متناسقة، و ذات علاقه بما يبحث عنة المستخدم. كما ان عجله الابتكار لا تتوقف فمجال البحث، فموقع www.hotlinks.com يتيح للمستخدمين امكانيه حفظ مفضلاتهم Favorites ضمن دليل علي انترنت، و هذا كى تكون هذة المفضلات متاحه للمستخدم اينما كان، و ممكن للمستخدمين ان يختاروا مشاركه مفضلاتهم مع مستعملى انترنت الاخرين، و تمكين زوار الموقع من البحث علي انترنت من اثناء البحث فمفضلات الاخرين، و بالتالي الحصول علي معلومات راي مستعملون اخرون انها مفيده لدرجه و ضع المواقع التي تحتويها ضمن مفضلاتهم. كما ان هنالك مواقع للبحث كwww.expertcentral.com و التي تقدم للباحثين اجابات متخصصة. و اضافه الي هذا فهنالك الكثير من محركات البحث التي تعتمد تقنيات الشبكات العبنوته Neural Networks، و محركات البحث التي ممكن تثبيتها علي اجهزه المستخدمين، و فهرسه محتويات اقراصهم الصلبة. و نظرا للاهميه المتواصله لمحركات البحث، فان التقنيات الحديثة ستواصل ظهورها، و ستواصل التقنيه تطورها لتقديم نتائج اروع للمستخدمين. و بظهور هذة التقنيات فان بعضها سيفشل و بعضها سينجح، و ستصبح التقنيات الناجحه جزءا من محركات البحث المستخدمه اليوم.


تطبيقات مستقبلية[عدل]

اذا لم تكن تريد انفاق الملايين فابتكار تقنيات للذكاء الاصطناعى و المعالجه الطبيعيه للغة، فان الحل الاسهل هو استعمال الميزات التي تقدمها لغه XML لجعل عمليه البحث اكثر دقة. فهذة اللغه كما هو معروف تعتمد علي توصيف الوثائق و البيانات عند نشرها علي الشبكة. فالماده المتعلقه بالاسعار مثلا يتم توصيفها بعلامات تدل علي انها تمثل السعر، و الماده التي تصف ابعاد بضاعه معينه يتم توصيفها بهذا الشكل. و باستعمال XML ممكن للروبوتات التي تقوم بفهرسه مواقع انترنت ان تفهم المحتوي الموجود ضمن الصفحات. و بالتالي فعندما تبحث عن تذكره سفر بسعر معين مثلا، فان الروبوتات لا تقوم فقط بالعثور علي التذكره باروع الاسعار، و لكنها تعثر كذلك علي اروع سعر لغرفه فندق، او سياره مستاجرة. و من التطبيقات الاخري مثلا هى انك اذا عرضت سيرتك الذاتيه علي الروبوت فانة يقترح عليك اروع و ظيفه تناسب مؤهلاتك. او اذا عرضت علي الروبوت ملفك الصحى فانة يقترح عليك الفيتامينات التي يجب عليك تناولها، او النوادى الصحيه التي يمكنك الانضمام اليها. و بالطبع فاننا لا نعتقد ان XML هى الحل السحري، و لكنها ممكن ان تؤدى الي زياده نجاعه عمليات البحث اذا ما اقترنت بالتقنيات الاخري المذكوره فموضوعنا هذا.


محركات البحث عربيا[عدل]

عربيا لا توجد محركات بحث كثيره تعتمد علي نفسها، ممكن حصرها ف2 او 3 فقط اذ ان اغلب محركات البحث العربيه تعتمد علي محركات بحث اجنبيه ذلك لعدم قدره الشركات العربيه علي الاستثمار فهذا المجال و تبقي اغلب محركات البحث التي تعتمد علي نفسها كليا ضعيفه لضعف التجهيزات اذ تكون غالبا من اجتهاد افراد علي سرفرات عامة.



 

  • اسماء محركات البحث
  • أسماء محركات البحث
  • محركات البحث
  • مواقع البحث
  • أسماء قواعد البيانات العالمية
  • اشهر مواقع واسماءها
  • محرك البحث
  • محركات البحث العالمية
  • مواقع بحث


اسماء محركات البحث , اشهر مواقع البحث العالمية