اسماء محركات البحث , اشهر مواقع البحث العالمية

محرك البحث (الباحوث) هو برنامج حاسوبى مصمم للمساعدة فالعثور على مستندات مخزنه على شبكات معلوماتيةالشبكه العنكبوتيه العالمية (بالانجليزية: World Wide Web)) او على حاسوب شخصي. بنيت محركات البحث الاولي اعتمادا على التقنيات المستعملة فادارة المكتبات الكلاسيكية. حيث يتم بناء فهارس للمستندات تشكل قاعده للبيانات تفيد فالبحث عن اي معلومة.

محركات البحث الاكثر استخداما و نسبة السيطره على محركات البحث فاوخر 2023
يسمح محرك البحث للمستخدم ان يطلب المحتوي الذي يقابل معايير محدده (والقاعده بها تلك التي تحتوى على كلمه او عبارة ما ) و يستدعى قائمة بالمراجع توافق تلك المعايير. تستعمل محركات البحث مؤشرات/فهارس/مسارد منتظمه التحديث لتشتغل بسرعه و فعالية.
تعرض النتائج على شكل قائمة بعناوين المستندات التي توافق الطلب. يرفق بالعناوين فالغالب مختصر عن المستند المشار الية او مقتطف منه للداله على موافقتة للبحث. ترتب عناصر قائمة البحث على حسب معايير خاصة (قد تختلف من محرك لاخر)، من اهمها مدي موافقه جميع عنصر للطلب.
عند الحديث عن محركات البحث فغالبا ما يقصد محركات البحث على شبكه الانترنت و محركات الويب بالخصوص. محركات البحث فالويب تبحث عن المعلومات على الشبكه العنكبوتيه العالمية، و منها يستخدم على نطاق ضيق يشمل البحث داخل الشبكات المحليه للمؤسسات اي انترانت (بالانجليزية: Intranet). اما محركات البحث الشخصيه فتبحث فالحواسيب الشخصيه الفردية.
بعض محركات البحث كذلك تحفر فالبيانات المتاحه على المجموعات الاخبارية، و قواعد البيانات الضخمة، او ادله مواقع الوب كدموز دوت اورج.
محتويات [اخف]
1 تاريخ
2 اشهر محركات البحث
3 كيف تعمل محركات البحث
4 محركات البحث على الشبكه الانترنت
5 مشاكل تقنيات البحث
5.1 عدم طرح الاسئله الصحيحة
5.2 فجوه المفردات
5.3 الموازنه بين الكم و النوع
5.4 غموض الكلمات
5.5 الاسماء و نوعياتها
6 المعالجه الطبيعية للغة
6.1 دراسه الجمل
6.2 ازاله الالتباس: اختيار المعني الصحيح
6.3 التصنيف التلقائي
6.4 زياده دقه الاستعلامات
6.5 ربط المفاهيم
7 الصورة الحالية
7.1 ايكساليد Exalead
7.2 انفراسيرتش Infrasearch
7.3 غوغل
7.4 اسك Ask
7.5 اوبن كولا OpenCola
7.6 اوتونومى Autonomy
7.7 بريموس Primus
8 المستقبل
8.1 تطبيقات مستقبلية
8.2 محركات البحث عربيا
9 انظر ايضا
10 ارتباطات خارجية
تاريخ[عدل]
اول محرك بحث كان و اندكس (بالانجليزية: Wandex) [بحاجة لمصدر]، و هو فهرس جمعة متجول و ب و هو زاحف عنكبوتى (بالانجليزية: web crawler) طورة ما ثيو جراى فمعهد ما ساشوستس للتكنولوجيا MIT ف1993. و يعد اليوب (بالانجليزية: Aliweb) محرك بحث احدث مبكر جدا جدا و ربما ظهر ف1993 و يعمل حتي اليوم. و اول محرك بحث قائم على الزاحف العنكبوتى للنصوص الكاملة كان و بكراولر (بالانجليزية: WebCrawler)، و الذي خرج للوجود ف1994. و على عكس سابقيه، فقد ترك المستخدمين يبحثون عن اي كلمه على اي صفحة و يب، و هو ما صار القاعده لكل محركات البحث الكبري منذ هذا الوقت. كان هو كذلك الاول فمعرفه الجمهور فيه على نطاق و اسع. ف1994 ايضا جاء لايكوس (بالانجليزية: Lycos) (الذى بدا فجامعة كارنيجى ميلون (بالانجليزية: Carnegie Mellon University)) و صار مشروعا تجاريا كبيرا.
بعد هذا بقليل، ظهر الكثير من محركات البحث و تزاحمت على الشعبية. و كان من ضمنها اكسايت (بالانجليزية: Excite)، انفوسيك (بالانجليزية: Infoseek)، و انكتومى (بالانجليزية: Inktomi)، و نورثرن لايت (بالانجليزية: Northern Light)، و التافيستا (بالانجليزية: Alta Vista). و فبعض الحالات تنافست مع الادله ذات الشعبية كياهو! (بالانجليزية: !Yahoo). فيما بعد، ادمجت الادله او اضافت اليها تقنيه محرك البحث من اجل اداء اكبر للوظائف.
عرفت محركات البحث كذلك بكونها بعض المع النجوم فنوبه الاستثمار فالانترنت التي و قعت فاواخر التسعينات. دخلت عده شركات السوق فمشهد كبير، مسجله مكاسب قياسيه اثناء طرح اسهمها العام الافتتاحي. و ربما سحب البعض محركاتهم البحثيه العامة، و هم يسوقون نسخا للشركات فقط، كنورثرن لايت التي كانت من ال8 او 9 محركات بحث المبكره بعد ان جاء لايكوس (بالانجليزية: Lycos).
قبل مجيء الانترنت، كانت هنالك بواحيث لموافيق (بروتوكولات)او استخدامات اخرى، كمحرك بحث اركى لمواقع اف‌.تي.‌بى المجهوله (بالانجليزية: anonymous FTP) و محرك بحث ڤيرونيكا لبروتوكول جوفر.
وستاتى بعض محركات البحث الثانية =منها اية ناين.كوم a9.com (امازون.كوم)، اسك چيڤيز/تيوما (بالانجليزية: Ask Jeeves/Teoma)، جيجابلاست، سناپ (بالانجليزية: Snap)، و الهاللو (بالانجليزية: Walhello)، كازاز (بالانجليزية: Kazazz)، و وايسنت (بالانجليزية: WiseNut). و بعض احدث اخر محركات البحث، و التي تبحث فقط نوعياتا محدده من المحتوي هي پلازو Plazoo (لمردود الخلاصات RSS feeds)، و جوهوك GoHook (لملفات پى دى اف PDF بشكل اساسي). و من اشهر المحركات ايضا: Yooci و ThroughSearch
اشهر محركات البحث[عدل]
جوجل (بالانجليزية: Google)
ياهو (بالانجليزية: Yahoo!)
بينج (بالانجليزية: Bing)
لايف سيرش (بالانجليزية: LiveSearch)
دك دك غو (بالانجليزية: DuckDuckGo)
كيف تعمل محركات البحث[عدل]
تعمل محركات البحث عن طريق تخزين المعلومات عن عدد كبير من صفحات الوب، و التي تستعيدها من الشبكه العالمية و ورلد و ايد و ب نفسها. تستعاد هذي الصفحات بواسطه زاحف و ب (يعرف احيانا كذلك ب ’عنكبوت‘) – و هو مستعرض و ب الى يتبع جميع رابط يراه. بعد هذا يجرى تحليل جميع صفحة لتحديد كيف ينبغى فهرستها (علي سبيل المثال، تستخلص العبارات من العناوين، رؤوس الموضوعات، او حقول خاصة تعرف ب ميتا تاجز). تخزن البيانات عن صفحات الوب فقاعده بيانات فهرسيه للاستعمال فعمليات البحث طلبا للمعلومات لاحقا. بعض محركات البحث، كجوجل، تخزن جميع او بعض الصفحة المصدر (وتشير لها ب مخبوءة) و بالمثل معلومات عن صفحات الوب، بينما بعضها تخزن جميع كلمه من جميع صفحة تجدها، كالتاڤيستا. هذي الصفحة المخبوءه تمسك بنص البحث الفعلى بما انه هو الذي تمت فهرستة فعليا، لذلك فقد تكون مفيدة جدا جدا عندما يصبح محتوي الصفحة الحاليه ربما جري تجديدة و لم تعد الفاظ البحث فيه. قد تعتبر هذي المشكلة شكلا خفيفا من تعفن الروابط، و تزيد معالجه جوجل لها من امكانيه الاستعمال بارضاء توقعات المستخدم بان ترد الفاظ البحث فصفحات الوب العائده فالرد. و هو ما يرضى ’مبدا مفاجاه اخف من مفاجاة‘ بما ان المستخدم يتوقع بشكل طبيعي الفاظ البحث فالنتيجة العائده له. و هذي الصله بالبحث تجعل هذي الصفحات المخبوءه مفيدة جدا، حتي اكثر من و اقع انها ربما تحتوى على بيانات قد لم تعد متاحه فموضع اخر.
عندما يتوجة مستعمل لمحرك البحث و يجرى عملية بحث طلبا للمعلومات، كما هو سائد باعطاء عبارات مفتاحية، يفتش المحرك فالفهرس و يقدم قائمة بصفحات الوب الاروع توافقا تبعا لمعاييره، فالمعتاد مع ملخص قصير يحتوى على عنوان الوثيقه و احيانا اجزاء من النص. معظم محركات البحث تدعم استعمال الاصطلاحات البولينيه (نسبة للجبر البولينى و هو نوع من المتغيرات المنطقية): AND و OR و NOT لمزيد من تحديد طلب المعلومات. و هنالك خدمه و ظيفيه متقدمه هي البحث بالتقارب، و التي تسمح لك بتحديد المسافه بين العبارات المفتاحية، باستعمال الفاظ كNEAR، NOT NEAR، FOLLOWED BY، NOT FOLLOWED BY، SENTENCE، FAR.
يعتمد مدي فوائد محرك بحث على مدي صله النتائج التي يرد بها. فبينما ربما تكون هنالك ملايين صفحات الوب التي تحتوى على كلمه او عبارة محددة، ربما تكون بعض اوثق صلة، او اروج، او معتمدة اكثر من غيرها. معظم محركات البحث توظف اساليب لوضع مراتب النتائج لتقدم اروع النتائج اولا. الطريقة التي يقرر فيها محرك بحث اي الصفحات هي الاروع توافقا، و ما النظام الذي يجب ان تخرج فيه النتائج، تختلف بشكل شاسع من محرك لاخر. الاساليب كذلك تتغير عبر الزمن بتغير استعمال انترنت و تكنيكات حديثة تتطور.
معظم محركات البحث هي مضاربات تجاريه يدعمها عائد اعلانى و ، بالنتيجة، يوظف البعض الممارسه المثيره للجدل بالسماح للمعلنين بدفع النقود ليرفعوا لهم قوائهم فمراتب نتائج البحث.
الاغلبيه الكاسحه من محركات البحث تديرها شركات خاصة تستعمل خوارزميات ملكها و قواعد بيانات مغلقة، و اكثرها رواجا حاليا هي جوجل و باحث اماسان و ياهو. توجد تقنيه محركات بحث مفتوحه المصدر كاتشتيدج، نتش، سيناز، ايجوثور و اوبنافتياس، و لكن ليس هنالك خادم بحث و ورلد و ايد و ب مشاع يستعمل هذي التقنية.
جاء تطور محرك بحث الوب من تطور محركات البحث على شبكات الاجهزة و الشبكات الداخلية.
محركات البحث على الشبكه الانترنت[عدل]
يمكننا القول بان الشبكه و مواقعها لن تكون ذات فوائد كبار بالنسبة لنا لو لم تكن محركات البحث على انترنت موجودة. فالبدء كانت محركات البحث عبارة عن ادلاء تقوم بفهرسه مواقع الانترنت الجديدة. و ربما كان هذا فعالا عندما كان حجم انترنت يقدر بملايين الصفحات. بعدها تطورت انترنت، و انضم اليها الملايين من مؤسسات الاعمال، و المؤسسات الحكومية، و بلايين الصفحات من ادله استعمال المنتجات، و المعلومات الخاصة بالمستثمرين، و غير هذا من المعلومات التي تقوم بتسيير عجله اقتصاد انترنت. و مع ذلك النمو اصبح من الضروري، بل و من الحتمى اضافه محرك بحث فعال الى كافه مواقع انترنت، يقوم بفهرسه و تصنيف المعلومات الموجوده ضمن هذي المواقع كى تتمكن من خدمه زوارها بشكل فعال. و اليوم، و بعد ان اصبحت محركات البحث جزءا رئيسيا فحضارتنا الانترنتية، فان هنالك العشرات من الشركات العامله فمجال انتاج برمجيات، و تقنيات، و اساليب بحث حديثة موجهه نحو انترنت و انترانت. و بسبب الدور المتزايد الذي تلعبة التجاره و الاعمال الالكترونيه فاقتصاد اليوم، فان الحافز المادى على الاقل موجود. و لكن رغم النجاح الذي تدعى الشركات المنتجه لتقنيات البحث تحقيقه، فان المستخدمين لا زالوا يشكون من افتقار محركات البحث الى الدقه المطلوبة، و تلبيه النتائج التي يتم تحصيلها لمتطلبات المستخدمين
مشاكل تقنيات البحث[عدل]
ان مفتاح النجاح فالحصول على نتائج بحث جيدة، تكمن فنوعيه الاستفسارات، او الاسئلة، او الكلمات او العبارات المفتاحيه التي نقوم بادخالها فمحركات البحث. لكن المشكلة الرئيسية هنا تكمن فان الغالبيه العظمي من المستخدمين لا يقومون عاده بادخال الاستفسارات او العبارات المفتاحيه الصحيحة، و التي تؤدى الى الحصول على النتائج المطلوبة، و سنستعرض فيما يلى المشاكل الشائعه فعالم البحث عن المعلومات، و الطرق التي يحاول فيها الباحثون معالجه هذي المشكلات.
عدم طرح الاسئله الصحيحة[عدل]
من الحقائق الغريبة التي يؤكدها خبراء المعلومات هي ان المستخدمين نادرا ما يقومون بطرح الاسئله التي تعبر عما يريدونة فعلا. و الاسباب =الرئيس فذلك هو الافتقار الى الفهم الصحيح للمقال قيد البحث، و بالتالي عدم استعمال العبارات المفتاحيه الصحيحة، و التي تؤدى الى تكوين استعلامات و اسئله صحيحة. فالمشكلة الرئيسية هنا اذا، هي مساعدة المستخدمين على طرح الاسئله و تكوين الاستعلامات الصحيحة. و من مظاهر هذي المشكلة كذلك هي صغر حجم الاستعلامات التي يصبحها المستخدم عاده للاستفسار عن مقال معين. فاذا كان مستعمل ما يريد معلومات عن “السفر” مثلا، فانه يبدا بادخال كلمه عامة فمحرك البحث، و من ثم، و اعتمادا على النتائج التي يحصل عليها، يقوم بتضييق نطاق بحثة الى ان يصل الى ما يريده. و الاسباب =فان الكثير من مستعملى انترنت يستخدمون ذلك الاسلوب يكمن فانهم لا يعرفون حقا الحجم المهول للمعلومات الموجوده فقواعد البيانات الخاصة بمحركات البحث، و التي تفوق عاده ما ممكن لاى انسان التعامل معه.
فجوه المفردات[عدل]
تتميز معظم اللغات الطبيعية بتنوع المفردات التي تتناول نفس المعنى، فمثلا ( السحاب، الغمام، المزن، العارض.. و غيرها) تدور حول نفس المعني سحاب، و بينما يدرك الانسان تطابق هذي المفردات فالمعني تعجز محركات البحث التقليديه عن استيعاب جميع المرادفات الممكنة، فتفتقر نتائجها الى كثير من الوثائق ذات العلاقه بمقال البحث لكنها لم تستعمل نفس مفردات المستخدم، و تسمي هذي المشكلة فجوه المفردات.
الموازنه بين الكم و النوع[عدل]
عند التعامل مع تقنيات البحث فلا بد من الموازنه بين الكم و النوع، او ما يدعوة الخبراء بالدقه و القدره على الاسترجاع. و هي علاقه عكسيه تماما، فكلما تم تضييق نطاق البحث سعيا عن نتائج اكثر دقة، كلما قل مقدار البيانات الذي ممكن استرجاعه. و لذا فان هنالك حاجة لوجود محركات بحث تقدم دقه عاليه دون التضحيه بمقدار النتائج “الدقيقة” التي نسترجعها.
غموض الكلمات[عدل]
معظم العبارات تحمل اكثر من معنى، و معظم محركات البحث المستخدمة اليوم تقوم بمطابقه العبارات و ليس معانيها، و لذا فان نتائج عمليات البحث التي نحصل عليها، تحتوى غالبا على العبارات المفتاحيه الصحيحة، و لكنها ذات المعني الخاطئ. فاذا جربت مثلا ان تبحث عن معني كلمه “جافا” مثلا، و هي احدي لغات البرمجه الشائعه الاستخدام، فانك ستحصل العديد من النتائج المتعلقه بالجفاف، او باسم جزيره اندونيسيه تحمل الاسم نفسه، اضافه الى معلومات عن لغه البرمجه لانة يبحث عن البنيه الصرفيه و الشكلية للكلمه و ليس المعنى.
الاسماء و نوعياتها[عدل]
وماذا عن البحث فالاسماء، اي البحث عن معلومات عن الاشخاص و الاماكن، و ما الى ذلك. خصوصا و ان الكتاب يغيرون عاده الكيفية التي يقومون فيها بكتابة الاسماء. و اذا ما تحدثنا مثلا عن اسماء الشركات، فانها تتغير باستمرار نتيجة عملية الاندماج و الضم، مما يجعل عملية البحث صعبة. و ربما يقول البعض انه ممكن التغلب على هذي المشكلة نوعا ما باستعمال برمجيات الفهرسة، و لكن المشكلة هي ان المعلومات فعالمنا تتغير باستمرار مما يجعل الفهرسه اليدويه صعبة. و ماذا عن الفهرسه الالية؟ الاجابه هي انه لا توجد بعد التقنيه التي يمكنها القيام بذلك بدقة، بحيث ممكن التمييز مثلا بين موضوع كامل عن شخص معين، و موضوع احدث يذكر اسم الشخص بشكل عابر.
المعالجه الطبيعية للغة[عدل]
يجمع العاملون فمجال محركات البحث بان الحل لكافه هذي المشاكل يكمن فتصميم محركات البحث، و برمجيات البحث عموما، بحيث تستفيد من برمجيات المعالجه الطبيعية للغه Natural Language Processingعموما، و المعالجه الطبيعية للمعني Natural Meaning Processing، و الاستفاده من قواعد اللغة. النقطه الرئيسية هنا هي ان اللغه عموما مبنيه على اساس قواعد ذات اساس شبية بالمعادلات الرياضية، كما ان كلمات اللغه و كلماتها تكون مبنيه حسب هيكليه معينة, فلكل جمله مبتدا و خبر، او فعل و فاعل و مفعول به، كما ان العبارات تاتى عاده من جذور و اصول. و هذي الهيكليه المبنيه ضمن اللغه تتناسب و طبيعه عمل برمجيات الحاسوب، و التي تحتاج الى هيكليه معينة تنفذ على اساسها عملياتها. اما المعالجه الطبيعية للمعني فهي اكثر صعوبة، فكلمه ك“راحة” ممكن لها ان تعني عده اشياء، كالارتياح بعد التعب، او الراحه الابديه و التي تعني الموت، او راحه اليد. و لهذا فان برمجيات البحث يجب ان تتمكن من فهم الكلمه ضمن سياق النص، و دور الكلمه فهذا السياق. و لكن حتي ذلك الاسلوب لا يفلح دوما ففهم المعنى. جرب ان تقرا ديوانا شعريا جيدا، و ستجد ان هناك العديد من العبارات الصعبة، و التي ربما يحاول البعض فهمها من السياق، و لكننا عندما نعجز عن هذا فاننا نتجة الى القاموس. و ذلك اسلوب ممكن لبرمجيات الحاسوب اتباعه، اي الاعتماد على قاموس او فهرس بالعبارات و الكلمات الشائعه الاستخدام، و البحث فالسياق. و فيما يلى بعض مفاهيم البحث التي تعتمد على المعالجه الطبيعية للغة؛
دراسه الجمل[عدل]
تتميز الجمل بانها ذات هيكليه محدده و واضحة، مما يساعد ففهم المعني بشكل سريع. و من اثناء تحديد نوع الجملة، ممكن لبرمجيات البحث ان تقوم بعملها بشكل اكثر دقة. و لعمل هذا فان هذي البرمجيات يجب ان تعتمد على كميات كبار من المصادر و المراجع اللغوية، كالمكانز، و التي تحتوى على كلمات و جمل ذات علاقات محدده مسبقا. و باستعمال هذي المكانز ممكن لبرمجيات البحث ان تفهم بشكل اروع طبيعه العلاقه بين العبارات المختلفة و مواقعها الصحيحة ضمن الجمل. و رغم الفوائد العظيمه للمكانز، فان مدي فعاليتها يعتمد على تحديثها باستمرار، و الا فانها تفقد فاعليتها تدريجيا. و باستعمال المكانز، و تصريف الجمل و اعرابها ممكن الحصول على نظم بحث قويه يمكنها فهم كلمات البحث و معاني العبارات ضمن السياق بشكل افضل.
ازاله الالتباس: اختيار المعني الصحيح[عدل]
اوضحنا فالنقطه اعلاة كيف ممكن للمكانز و نظم تصريف و اعراب الجمل ان تسهم بشكل اروع ففهم المعني من اثناء السياق. و هذي التقنيه مفيدة اذا كنا نبحث ضمن نصف معين، و لكنها ليست مفيدة عند ادخال الاستفسارات و الاستعلامات ضمن محركات البحث، حيث تتكون هذي عاده من عدد محدود من الكلمات، و بالتالي فان حجم النص غير كاف لتحليل معني الكلمات. و الحل لهذه المشكلة و اضح الى درجه الاحراج و يتمثل فسؤال المستخدم عن المعني الذي يقصده؛ فعندما يدخل المستخدم كلمه “راحة” مثلا ضمن مربع الاستعلام، فان محرك البحث يسالة عن المعني المقصود، او المعني المراد البحث عنه، قبل الشروع بعملية البحث. و توجد اليوم الكثير من محركات البحث التي تستعمل قواميس مضمنه تقوم بتقديم قوائم بالمعاني المختلفة التي تمثلها الكلمه الواحده قبل الشروع فعملية البحث. و من هذي المحركات هنالك LexiGuide من شركة LexiQuest، و Oingo، و Simplifind على موقع Simpli.com.
التصنيف التلقائي[عدل]
هذا الاسلوب هو الاقدم، حيث يتم تصنيف الوثائق حسب تصنيفات و فروع معينة، و من بعدها البحث بشكل منفصل ضمن جميع تصنيف عن المعلومات المطلوبة. فمثلا، عند البحث عن كلمه “نواة” فان بحثك ربما يقودك الى تصنيف يتعلق بعلوم الزراعة، و نوعيات الحبوب، و ما الى ذلك، و لكنة فالوقت نفسة ربما يقودك الى تصنيف يقع ضمن علوم الفيزياء النووية. و الحل هنا يكمن فتصنيف الوثائق المتعلقه بانويه الحبوب و المزروعات فقسم الزراعه مثلا، و الوثائق المتعلقه بانويه الذرات فقسم الفيزياء الذرية. و لكن ماذا لو كانت لدينا و ثيقه تتعلق بتاثير التجارب النوويه على انويه الحبوب و المزروعات؟ هل يجب عندها وضع الوثيقه فالقسمين، ام ما هو الحل؟ و هنا تنشا لدينا مشكلة المعني المزدوج. و من هنا تاتى اهمية التصنيف التلقائي، حيث يتم استعمال علوم النحو من تصريف و اعراب، و استعمال المكانز و القواميس، بحيث يتمكن النظام من “فهم” المقالات الرئيسه فو ثيقه ما . و يتم هذا باستعمال اساليب احصائيه تقوم بدراسه تكرار العبارات ضمن و ثيقه ما ، و من بعدها تحديد السياق، و الذي يساعد فعملية البحث. و كمثال على هذا لناخذ كلمة، او اسم ك“فهد” او “ليث” و هي اسماء عربية دارجة. و لنفترض اننا كتبنا موضوعا فمجلتنا عن شخص اسمه “فهد”، و لنفترض ان محرك بحث اراد تصنيف مقالنا هذا. فهذه الحال، و اذا كان محرك البحث يستعمل اسلوب التصنيف التلقائي، فانه سيقوم من اثناء دراسه النص و نوعيه العبارات الموجوده به و علاقاتها و تكرارها، بتحديد ان الموضوع ينتمى الى تصنيف علوم الحاسوب و الانترنت و ليس الحيوانات و الوحوش البرية. و تتبع برمجيات التصنيف التلقائى قواعد معينة يحددها المبرمجون، او ممكن للاله نفسها ان تتعلم ذاتيا كيف تقوم بتصنيف الكلمات. او ممكن استعمال الاسلوبين، بحيث يتم تصنيف الوثائق التي تتبع نمطا معينا بشكل تلقائي، فحين يتم تحويل تلك التي يستحيل تصنيفها الى عامل بشرى كى يقوم بذلك.
زياده دقه الاستعلامات[عدل]
من يستخدم محركات البحث باستمرار يعلم انه من المحتوم الحصول على مئات الالوف من النتائج على الاقل عند البحث عن مقال معين بشكل عام. اما عند تضييق نطاق البحث، فاننا نحصل على مقدار اقل من النتائج الاكثر دقة. و لزياده دقه الاستعلامات، فان بعض محركات البحث يقوم بتعديل الاستعلام، و هذا بتقديم معان مرادفه لعبارات البحث الى المستخدم، لمساعدتة على تحديد مقال بحثة بدقه اكبر. ففى كهذه النظم، و اذا كان مقال استعلامك هو “الرياضة” مثلا، فان النظام يقدم لك عددا من البدائل التي تساعد فتحديد مقال البحث ك“التربيه البدنية”، “اللياقه البدنية” او “اللياقة” و غير هذا من المرادفات التي تساعد على توجية العملية بحيث يحصل المستخدم على اكبر كم من النتائج الدقيقه التي تعبر عن مقال البحث.
ربط المفاهيم[عدل]
اذا جربت اليوم ان تبحث عن العبارة “اسطوانات الليزر” (وهي العبارة العاميه و القديمة للاقراص المدمجة) فانك لن تحصل على العديد من النتائج المفيدة من محركات البحث، حيث ان عبارة “الاقراص المدمجة” هي الكلمه الشائعه و المستخدمة فالغالبيه العظمي من المطبوعات. و لهذا فان الكثير من محركات البحث هذي الايام تستعمل اسلوب الربط بين المفاهيم، بحيث انك اذا قمت بكتابة العبارة “اقراص الليزر” فانك ستحصل على معلومات عن “الاقراص المدمجة”. و يعتمد ذلك الاسلوب على تحديد العلاقه بين العبارات و الكلمات فقاعده البيانات بشكل مسبق، كما انه مفيد عند البحث فو ثائق متعدده اللغات، فالبحث عن كلمه “اقراص الليزر” ممكن ان يعطى نتائج لوثائق باللغه الانجليزيه عن “Compact Disks” او CDs و ما الى ذلك، و ذلك اسلوب مفيد جدا جدا فعالم انترنتى لم تعد به اللغه الانجليزيه هي السائدة.
الصورة الحالية[عدل]
انظر الى اي موقع للتجاره الالكترونية، و ستجد انه غير ذا فوائد تذكر اذا لم يكن محرك البحث المستخدم فيه قادرا على نقلك الى صفحة المنتج، او المنتجات، التي تريدها اثناء اسرع وقت ممكن. و لذا نجد ان بوابات التجاره و الاعمال الالكترونيه العالمية كEbay و امازون تعتبر برمجيات البحث احد اهم موجوداتها و تسعي باستمرار الى تحديثها. و ربما قامت شركة Ebay قبل سنوات بشراء نظام بحث متقدم من شركة Fast Search & Transfer النرويجية، و التي كانت تنتج تقنيه بحث حديثة تقوم بتقديم اخر المعلومات للباحثين عن نتائج المزادات و الاسعار المتداولة. كما ان امازون و مواقع كMarthastewar.com تقوم بالتعامل مع شركة Google و AskJeeves بحيث يتم ربط المستخدمين بالبضائع التي يريدون شرائها من اثناء كتابة سؤال اعتيادى ضمن مربع الاستعلام. و تقول الخبيره ما رثا فراي، و هي باحثه فشؤون التجاره الالكترونيه فمجموعة باتريشيا سيبولد، “يمكن القول بان الاسباب =الرئيس ففشل معظم مواقع التجاره الالكترونية، يعود الى اعتمادها لتقنيات بحث ضعيفة.” كما اكتشفت مؤسسة ميديا ميتريكس للابحاث بان 80% من مستعملى انترنت، يتوقفون عن استعمال موقع ما اذا لم تعمل و ظيفه البحث المضمنه به بالشكل الصحيح. و من هنا كان السباق بين عدد من الشركات لتطوير تقنيات بحث متقدمة، ممكن للبشر الاعتياديين التعامل معها، و الحصول على النتائج التي يريدونها تماما. و سنستعرض فيما يلى عددا من الشركات العالمية التي ابتكرت تقنيات ممكن لها ان تغير و جة انترنت الى الابد.
ايكساليد Exalead[عدل]
ايكساليد (Exalead) محرك بحث فرنسي متخصص فالتقنيات الحديته للبحث : نوعيه نتائج البحث, تصنيف النتائج, صور تمهيديه لكل صفحة.(Exalead)
انفراسيرتش Infrasearch[عدل]
تجمع هذي الشركة ما بين تقنيات البحث المتقدمه التي تحدثنا عنها فالصفحات السابقة، و بين تقنيات برمجيات مشاركه الملفات، و هي ما يطلق عليه البعض برمجيات الند الى الند، او ما يعرف بالانجليزيه باسم P2P، (انظر مقالنا فهذا العدد و المتعلق بهذا الموضوع). و ربما قامت شركة صن ما يكروسيستمز العملاقه مؤخرا بشراء هذي الشركة الشابه بمؤسسيها (المراهقين الثلاث) و طاقم عملها الذي يتكون من 15 مبرمجا. و تعد هذي التقنية، اذا ما كتب لها النجاح فمختبرات صن فان تقنيه انفراسيرتش تعد بالسيطره على عالم البحث عبر انترنت. و تعمل تقنيه انفراسيرتش بالشكل الاتي؛ يقوم المستخدم بتنزيل برنامج صغير الحجم على جهازه، و مشاركه دليل معين، او عده ادله على جهازه، يريد ان ممكن المستخدمين الاخرين من البحث فيها. و ذلك البرنامج شبية ببرنامج نابستر، و لكن قدراتة لا تقتصر على ملفات MP3 فقط، بل تتعداها لتشمل كل نوعيات الملفات، فاذا كنت تبحث عن الحل لمساله رياضيه معينة مثلا، و كان احد الطلبه ربما قام بحل هذي المساله او المعادلة، و وضع الحل ضمن ملف على جهازه، فانه يمكنك عند البحث باستعمال انفراسيرتش ان تعثر على ذلك الملف و حل المعادلة، اذا كان ذلك المستخدم ربما اختار مشاركتة مع الغير عبر الشبكة. و لا تتوقف قدرات انفراسيرتش هنا، فاذا كنت تريد شراء سيارة معينة، فان برنامج انفراسيرتش ياخذك الى دليل على موقع الشركة، و من بعدها توجيهك الى القسم الخاص بالسيارة التي تريدها، و الحصول على احدث المعلومات عن هذي السيارة، بما فذلك صورة لاحدث موديل لها قام احد المستخدمين بالتقاطها و وضعها على جهازة ليشاركها مع الغير. كما ممكن للوكيل مثلا ان يشارك ملفا على جهازة يحتوى على عقد البيع و اجراءات التسجيل و ما الى ذلك. و بما ان برنامج انفراسيرتش مجاني، فقد كان المخطط الاصلي للشركة هو جعل المؤسسات التجارية، التي تختار استعمال البرنامج فعملياتها، تقوم بدفع مقابل ما دى بسيط جدا جدا مقابل جميع عملية بحث تقوم اجهزة انفراسيرتش المزوده بتوجيهها الى المؤسسة التجارية. و ذلك يعني ان عوائد الشركة تعتمد على عدد الاشخاص الذين يقومون بالبحث فشبكتها. و اضافه الى ذلك، فان انفراسيرتش كانت تخطط للتعاون مع محركات البحث الشائعه الاستخدام، و هذا لجعل نتائج بحثها “طازجة” و جديدة باكبر قدر ممكن، حيث ان نتائج البحث التي نحصل عليها عاده من هذي المحركات تعتمد على مدي نشاط الروبوتات التي تقوم بفهرسه مواقع انترنت، و هي عاده متاخره حوالى 24 ساعة عما نشر على الشبكة. اما باستعمال تقنيه انفراسيرتش فان النتائج تكون طازجه بالدقيقه و الثانية. و كما قلنا اعلاه، فان انفراسيرتش الان ملك لصن ما يكروسيتمز، و نرجو ان نري منتجها عما قريب على انترنت.
غوغل[عدل]
بدا محرك البحث ذلك Google.com كمشروع لرساله دكتوراه حول تقنيات الذكاء الاصطناعى و المعالجه الطبيعية للغه فجامعة ستانفورد فالولايات المتحدة، و تحول اليوم الى بوابه انترنت عالمية كبري تخدم البحث ب 66 لغه (منها العربية)، تقوم بمعالجه 120 مليون طلب بحث يوميا (حسب احصائيات مؤسسة ميديا ميتركس للابحاث)، كما ان الموقع اصبح مؤخرا ضمن اكبر 15 موقعا فالولايات المتحدة. و لا يتوقف الامر هنا، حيث ان عوائدة تصل الى 50 مليون دولار سنويا، و يتوقع البعض ان يصل حجم هذي العوائد فالمستقبل القريب الى مليار دولار امريكي حسب مجلة بيزنس و يك الامريكية. و المستخدم لهذا الموقع يعرف تمام المعرفه مدي دقتة فتقديم النتائج المطلوبة، و من المره الاولى، كما انه لا يتطلب خبره كبري من المستخدم فصياغه الاسئله و الاستعلامات. و يعتمد ذلك الموقع تقنيات احصائيه و رياضيه متقدمه تقوم بدراسه الوثائق المفهرسة، و تكرار العبارات ضمن جميع و ثيقة، و بالتالي الحكم على موضوعها و علاقتها بعبارة البحث التي يقوم المستخدم باستعمالها. و مهما كانت الوصفة السحريه التي يستعملها موقع غوغل فانه يعتبر الاروع بين كافه مواقع البحث المستخدمة اليوم.
اسك Ask[عدل]
موقع Ask.com يستعمل اللغه الطبيعية فالبحث و يعتمد قاعده بيانات و تقنيات تمكن المستخدم من توجية سؤال البحث “باللغه الانجليزية” بلغه سهلة (وعاميه ايضا) لتقوم قاعده البيانات بالمطابقه بين العبارات المفتاحيه فالسؤال، و بين ما هو موجود فقاعده بياناتها. و رغم هذا فان محرك “اسك” يعتمد جزئيا على التدخل البشرى لتصنيف المعلومات و فهرستها اذا لم تكن موجوده فقاعده البيانات. فعند حصول حدث اخبارى ما مثلا، فان “اسك”لن يتمكن من التعامل مع اي سؤال يتعلق بهذا الحدث الا اذا قام مدراء قواعد البيانات بتحديث النظام.
وقد قامت الشركة المسئوله عن الموقع بطرح نظام مستقل، ممكن للمؤسسات العامله فمجالات التجاره و الاعمال الالكترونيه تضمينة فمواقعها بحيث ممكن لعملائها توجية اسئله و استفسارات باللغه الطبيعية، و الحصول على اجوبه لها دون اي تدخل بشري.
اوبن كولا OpenCola[عدل]
نعود هنا الى شركة ثانية =تستعمل تقنيات مشاركه الملفات، و المعالجه الطبيعية للغة، اضافه الى اسلوب المجتمعات الخبيره Expert Communities، لخدمه عملية البحث. و تنتج هذي الشركة برنامجا صغيرا مجانيا يقوم المستخدم بتنزيلة و تثبيته على جهازه، و من بعدها ممكن له سحب و اسقاط ملف ما (سواء نص، او موسيقى، او صورة، او اي نسق كان) ضمن ذلك البرنامج، و الذي يقوم بالبحث ضمن اجهزة كمبيوتر ثانية =مشاركه فالشبكة، عن ملفات مشابهة. فاذا كنتم مثلي، من هواه جمع اللوحات الالكترونيه للمدرسة الانطباعيه او التكعيبية، و كانت لديكم صورة تمثل احدي هذي المدارس الفنية، فيمكن وضع هذي الصورة ضمن البرنامج، و الذي يبحث بعدين فاجهزة الكومبيوتر المشاركه ضمن الشبكه ليحصل على ملفات مماثلة. و ماذا عن فكرة المجتمعات الخبيرة؟ تهدف اوبن كولا الى تشجيع المشاركين فشبكتها على مشاركه اجهزتهم مع اشخاص يشابهونهم فالاهتمامات، فاذا كان لدى مجلد على جهازى يحتوى على لوحات الكترونيه للمدرسة التكعيبيه مثلا، فاننى اقوم بمشاركتها ضمن موقع اوبن كولا و ضمن تصنيف خاص بهذه النوعيه من اللوحات. كما ان اوبن كولا تستعمل روبوتات موزعة، او عناصر الية، تعتمد اسلوب البحث فالعناصر البرمجية. و ممكن للمستخدمين تحسين دقه النتائج التي يحصلون عليها بتدريب هذي الروبوتات الباحثة، و التي تتعلم من اثناء التجربة.
اوتونومى Autonomy[عدل]
تعتمد البرمجيات التي تستعملها هذي الشركة Autonomy.com على تقنيه المطابقه ما بين انساق النص و تكرار الكلمات و الكلمات، و هذا لتحديد المفاهيم الاساسيه المميزه لوثيقه ما ، و تشفيرها ضمن هذي الوثيقة، و من بعدها البحث عن و ثائق تحتوى على مفاهيم مشابهه فنصوص اخرى. و باستعمال ذلك الاسلوب ممكن للباحث ان يقوم بكتابة جمل تصف ما يبحث عنه بلغه سهلة، و البحث على ذلك الاساس. كما ان محرك بحث اوتونومى يمكنة ان يتعلم ما يريدة المستخدم، بناء على نوعيه المواد التي يقراها او يستعرضها ذلك المستخدم.
بريموس Primus[عدل]
تركز برمجيات البحث الخاصة بهذه الشركة على المواد التي تتعامل مع خدمه الزبائن، او المواد الموجوده ضمن نماذج الكترونية، و هي على ذلك الاساس مكمله لما تقوم فيه شركة اوتونومي. و تسمح هذي البرمجيات للمستخدمين بان يقوموا بتوجية اسئله الى قاعده البيانات باستعمال اللغه الطبيعية. و يقوم النظام بجمع نتائج البحث، و تقديمها للمستخدمين الذين يقومون بطرح اسئله مشابهة.
المستقبل[عدل]
يوجد على انترنت اليوم بلايين الصفحات، و حسب المصادر المتوفره فانه ربما تم حتي اليوم فهرسه ما يزيد قليلا على البليون صفحة. و تتسابق الشركات التي تقوم بفهرسه هذي الصفحات فاتاحتها لمستخدمى انترنت، و الحفاظ على سرعه الاستجابه التي يحصل عليها المستخدم. و اضافه الى السرعه فان على قواعد البيانات هذي ان تثبت و جودها بتقديم اجوبه “طازجة”، و متناسقة، و ذات علاقه بما يبحث عنه المستخدم. كما ان عجله الابتكار لا تتوقف فمجال البحث، فموقع www.hotlinks.com يتيح للمستخدمين امكانيه حفظ مفضلاتهم Favorites ضمن دليل على انترنت، و هذا كى تكون هذي المفضلات متاحه للمستخدم اينما كان، و ممكن للمستخدمين ان يختاروا مشاركه مفضلاتهم مع مستعملى انترنت الاخرين، و تمكين زوار الموقع من البحث على انترنت من اثناء البحث فمفضلات الاخرين، و بالتالي الحصول على معلومات راي مستعملون اخرون انها مفيدة لدرجه وضع المواقع التي تحتويها ضمن مفضلاتهم. كما ان هنالك مواقع للبحث كwww.expertcentral.com و التي تقدم للباحثين اجابات متخصصة. و اضافه الى هذا فهنالك الكثير من محركات البحث التي تعتمد تقنيات الشبكات العبنوته Neural Networks، و محركات البحث التي ممكن تثبيتها على اجهزة المستخدمين، و فهرسه محتويات اقراصهم الصلبة. و نظرا للاهمية المتواصله لمحركات البحث، فان التقنيات الحديثة ستواصل ظهورها، و ستواصل التقنيه تطورها لتقديم نتائج اروع للمستخدمين. و بظهور هذي التقنيات فان بعضها سيفشل و بعضها سينجح، و ستصبح التقنيات الناجحه جزءا من محركات البحث المستخدمة اليوم.
تطبيقات مستقبلية[عدل]
اذا لم تكن تريد انفاق الملايين فابتكار تقنيات للذكاء الاصطناعى و المعالجه الطبيعية للغة، فان الحل الاسهل هو استعمال الميزات التي تقدمها لغه XML لجعل عملية البحث اكثر دقة. فهذه اللغه كما هو معروف تعتمد على توصيف الوثائق و البيانات عند نشرها على الشبكة. فالمادة المتعلقه بالاسعار مثلا يتم توصيفها بعلامات تدل على انها تمثل السعر، و المادة التي تصف ابعاد بضاعه معينة يتم توصيفها بهذا الشكل. و باستعمال XML ممكن للروبوتات التي تقوم بفهرسه مواقع انترنت ان تفهم المحتوي الموجود ضمن الصفحات. و بالتالي فعندما تبحث عن تذكره سفر بسعر معين مثلا، فان الروبوتات لا تقوم فقط بالعثور على التذكره باروع الاسعار، و لكنها تعثر كذلك على اروع سعر لغرفه فندق، او سيارة مستاجرة. و من التطبيقات الثانية =مثلا هي انك اذا عرضت سيرتك الذاتيه على الروبوت فانه يقترح عليك اروع و ظيفه تناسب مؤهلاتك. او اذا عرضت على الروبوت ملفك الصحي فانه يقترح عليك الفيتامينات التي يجب عليك تناولها، او النوادى الصحية التي يمكنك الانضمام اليها. و بالطبع فاننا لا نعتقد ان XML هي الحل السحري، و لكنها ممكن ان تؤدى الى زياده نجاعه عمليات البحث اذا ما اقترنت بالتقنيات الثانية =المذكوره فموضوعنا هذا.
محركات البحث عربيا[عدل]
عربيا لا توجد محركات بحث عديدة تعتمد على نفسها، ممكن حصرها ف2 او 3 فقط اذ ان اغلب محركات البحث العربية تعتمد على محركات بحث اجنبية ذلك لعدم قدره الشركات العربية على الاستثمار فهذا المجال و تبقي اغلب محركات البحث التي تعتمد على نفسها كليا ضعيفه لضعف التجهيزات اذ تكون غالبا من اجتهاد افراد على سرفرات عامة.



13304 اسماء محركات البحث - اشهر مواقع البحث العالمية سحر فتحي

 

  • اسماء محركات البحث
  • أسماء محركات البحث
  • محركات البحث
  • مواقع البحث
  • أسماء قواعد البيانات العالمية
  • اشهر مواقع واسماءها
  • محرك البحث
  • مواقع بحث