يوم 24 أكتوبر 2020 السبت 11:39 مساءً

اسماء محركات البحث , اشهر مواقع البحث العالمية

آخر تحديث ب17 يناير 2020 الجمعة 8:41 صباحا بواسطة سحر فتحي

محرك البحث الباحوث هو برنامج حاسوبي مصمم للمساعدة بالعثور على مستندات مخزنة على شبكات معلوماتيةالشبكة العنكبوتية العالمية بالانجليزية: World Wide Web) او على حاسوب شخصي. بنيت محركات البحث الاولى اعتمادا على التقنيات المستعملة بادارة المكتبات الكلاسيكية. حيث يتم بناء فهارس للمستندات تشكل قاعدة للبيانات تفيد بالبحث عن اي معلومة.

محركات البحث الاكثر استخداما و نسبة السيطرة على محركات البحث باوخر 2020

يسمح محرك البحث للمستخدم ان يطلب المحتوى الذي يقابل معايير محددة والقاعدة بها تلك التي تحتوي على كلمة او عبارة ما و يستدعي قائمة بالمراجع توافق تلك المعايير. تستعمل محركات البحث مؤشرات/فهارس/مسارد منتظمة التحديث لتشتغل بسرعة و فعالية.

تعرض النتائج على شكل قائمة بعناوين المستندات التي توافق الطلب. يرفق بالعناوين بالغالب مختصر عن المستند المشار اليه او مقتطف منه للدالة على موافقته للبحث. ترتب عناصر قائمة البحث على حسب معايير خاصة ربما تختلف من محرك لاخر)، من اهمها مدى موافقة كل عنصر للطلب.

عند الحديث عن محركات البحث فغالبا ما يقصد محركات البحث على شبكة الانترنت و محركات الويب بالخصوص. محركات البحث بالويب تبحث عن المعلومات على الشبكة العنكبوتية العالمية، و منها يستخدم على نطاق ضيق يشمل البحث داخل الشبكات المحلية للمؤسسات اي انترانت بالانجليزية: Intranet). اما محركات البحث الشخصية فتبحث بالحواسيب الشخصية الفردية.

بعض محركات البحث كذلك تحفر بالبيانات المتاحة على المجموعات الاخبارية، و قواعد البيانات الضخمة، او ادلة مواقع الوب مثل دموز دوت اورج.

محتويات [اخف]
1 تاريخ

2 اشهر محركات البحث

3 كيف تعمل محركات البحث

4 محركات البحث على الشبكة الانترنت

5 مشاكل تقنيات البحث

5.1 عدم طرح الاسئلة الصحيحة

5.2 فجوة المفردات

5.3 الموازنة بين الكم و النوع

5.4 غموض الكلمات

5.5 الاسماء و نوعياتها

6 المعالجة الطبيعية للغة

6.1 دراسة الجمل

6.2 ازالة الالتباس: اختيار المعنى الصحيح

6.3 التصنيف التلقائي

6.4 زيادة دقة الاستعلامات

6.5 ربط المفاهيم

7 الصورة الحالية

7.1 ايكساليد Exalead

7.2 انفراسيرتش Infrasearch

7.3 غوغل

7.4 اسك Ask

7.5 اوبن كولا OpenCola

7.6 اوتونومي Autonomy

7.7 بريموس Primus

8 المستقبل

8.1 تطبيقات مستقبلية

8.2 محركات البحث عربيا

9 انظر ايضا

10 ارتباطات خارجية

تاريخ[عدل]
اول محرك بحث كان و اندكس بالانجليزية: Wandex [بحاجة لمصدر]، و هو فهرس جمعه متجول و ب و هو زاحف عنكبوتي بالانجليزية: web crawler طوره ما ثيو جراي بمعهد ما ساشوستس للتكنولوجيا MIT ب1993. و يعد اليوب بالانجليزية: Aliweb محرك بحث احدث مبكر جدا جدا و ربما ظهر ب1993 و يعمل حتى اليوم. و اول محرك بحث قائم على الزاحف العنكبوتي للنصوص الكاملة كان و بكراولر بالانجليزية: WebCrawler)، و الذي خرج للوجود ب1994. و على عكس سابقيه، فقد ترك المستخدمين يبحثون عن اي كلمة على اي صفحة و يب، و هو ما صار القاعدة لكل محركات البحث الكبرى منذ هذا الوقت. كان هو كذلك الاول بمعرفة الجمهور فيه على نطاق و اسع. ب1994 ايضا جاء لايكوس بالانجليزية: Lycos الذي بدا بجامعة كارنيجي ميلون بالانجليزية: Carnegie Mellon University) و صار مشروعا تجاريا كبيرا.

بعد هذا بقليل، ظهر الكثير من محركات البحث و تزاحمت على الشعبية. و كان من ضمنها اكسايت بالانجليزية: Excite)، انفوسيك بالانجليزية: Infoseek)، و انكتومي بالانجليزية: Inktomi)، و نورثرن لايت بالانجليزية: Northern Light)، و التافيستا بالانجليزية: Alta Vista). و ببعض الحالات تنافست مع الادلة ذات الشعبية مثل ياهو بالانجليزية: Yahoo). فيما بعد، ادمجت الادلة او اضافت اليها تقنية محرك البحث من اجل اداء اكبر للوظائف.

عرفت محركات البحث كذلك بكونها بعض المع النجوم بنوبة الاستثمار بالانترنت التي و قعت باواخر التسعينات. دخلت عدة شركات السوق بمشهد كبير، مسجلة مكاسب قياسية اثناء طرح اسهمها العام الافتتاحي. و ربما سحب البعض محركاتهم البحثية العامة، و هم يسوقون نسخا للشركات فقط، مثل نورثرن لايت التي كانت من ال8 او 9 محركات بحث المبكرة بعد ان جاء لايكوس بالانجليزية: Lycos).

قبل مجيء الانترنت، كانت هنالك بواحيث لموافيق بروتوكولات)او استخدامات اخرى، مثل محرك بحث اركي لمواقع اف‌.تي.‌بي المجهولة بالانجليزية: anonymous FTP و محرك بحث ڤيرونيكا لبروتوكول جوفر.

وستاتي بعض محركات البحث الثانية =منها ايه ناين.كوم a9.com امازون.كوم)، اسك چيڤيز/تيوما بالانجليزية: Ask Jeeves/Teoma)، جيجابلاست، سناپ بالانجليزية: Snap)، و الهاللو بالانجليزية: Walhello)، كازاز بالانجليزية: Kazazz)، و وايسنت بالانجليزية: WiseNut). و بعض احدث اخر محركات البحث، و التي تبحث فقط نوعياتا محددة من المحتوى هي پلازو Plazoo لمردود الخلاصات RSS feeds)، و جوهوك GoHook لملفات پي دي اف PDF بشكل اساسي). و من اشهر المحركات ايضا: Yooci و ThroughSearch

اشهر محركات البحث[عدل]
جوجل بالانجليزية: Google)

ياهو بالانجليزية: Yahoo!)

بينج بالانجليزية: Bing)

لايف سيرش بالانجليزية: LiveSearch)

دك دك غو بالانجليزية: DuckDuckGo)

كيف تعمل محركات البحث[عدل]
تعمل محركات البحث عن طريق تخزين المعلومات عن عدد كبير من صفحات الوب، و التي تستعيدها من الشبكة العالمية و ورلد و ايد و ب نفسها. تستعاد هذي الصفحات بواسطة زاحف و ب يعرف احيانا كذلك ب عنكبوت‘ و هو مستعرض و ب الى يتبع كل رابط يراه. بعد هذا يجري تحليل كل صفحة لتحديد كيف ينبغي فهرستها على سبيل المثال، تستخلص العبارات من العناوين، رؤوس الموضوعات، او حقول خاصة تعرف ب ميتا تاجز). تخزن البيانات عن صفحات الوب بقاعدة بيانات فهرسية للاستعمال بعمليات البحث طلبا للمعلومات لاحقا. بعض محركات البحث، مثل جوجل، تخزن كل او بعض الصفحة المصدر وتشير لها ب مخبوءة و بالمثل معلومات عن صفحات الوب، بينما بعضها تخزن كل كلمة من كل صفحة تجدها، مثل التاڤيستا. هذي الصفحة المخبوءة تمسك بنص البحث الفعلي بما انه هو الذي تمت فهرسته فعليا، لذلك فقد تكون مفيدة جدا جدا عندما يصبح محتوى الصفحة الحالية ربما جرى تجديدة و لم تعد الفاظ البحث فيه. قد تعتبر هذي المشكلة شكلا خفيفا من تعفن الروابط، و تزيد معالجة جوجل لها من امكانية الاستعمال بارضاء توقعات المستخدم بان ترد الفاظ البحث بصفحات الوب العائدة بالرد. و هو ما يرضي مبدا مفاجاة اخف من مفاجاة‘ بما ان المستخدم يتوقع بشكل طبيعي الفاظ البحث بالنتيجة العائدة له. و هذي الصلة بالبحث تجعل هذي الصفحات المخبوءة مفيدة جدا، حتى اكثر من و اقع انها ربما تحتوي على بيانات قد لم تعد متاحة بموضع اخر.

عندما يتوجه مستعمل لمحرك البحث و يجري عملية بحث طلبا للمعلومات، كما هو سائد باعطاء عبارات مفتاحية، يفتش المحرك بالفهرس و يقدم قائمة بصفحات الوب الاروع توافقا تبعا لمعاييره، بالمعتاد مع ملخص قصير يحتوي على عنوان الوثيقة و احيانا اجزاء من النص. معظم محركات البحث تدعم استعمال الاصطلاحات البولينية نسبة للجبر البوليني و هو نوع من المتغيرات المنطقية): AND و OR و NOT لمزيد من تحديد طلب المعلومات. و هنالك خدمة و ظيفية متقدمة هي البحث بالتقارب، و التي تسمح لك بتحديد المسافة بين العبارات المفتاحية، باستعمال الفاظ مثل NEAR، NOT NEAR، FOLLOWED BY، NOT FOLLOWED BY، SENTENCE، FAR.

يعتمد مدى فوائد محرك بحث على مدى صلة النتائج التي يرد بها. فبينما ربما تكون هنالك ملايين صفحات الوب التي تحتوي على كلمة او عبارة محددة، ربما تكون بعض اوثق صلة، او اروج، او معتمدة اكثر من غيرها. معظم محركات البحث توظف اساليب لوضع مراتب النتائج لتقدم اروع النتائج اولا. الطريقة التي يقرر فيها محرك بحث اي الصفحات هي الاروع توافقا، و ما النظام الذي يجب ان تخرج فيه النتائج، تختلف بشكل شاسع من محرك لاخر. الاساليب كذلك تتغير عبر الزمن بتغير استعمال انترنت و تكنيكات حديثة تتطور.

معظم محركات البحث هي مضاربات تجارية يدعمها عائد اعلاني و ، بالنتيجة، يوظف البعض الممارسة المثيرة للجدل بالسماح للمعلنين بدفع النقود ليرفعوا لهم قوائهم بمراتب نتائج البحث.

الاغلبية الكاسحة من محركات البحث تديرها شركات خاصة تستعمل خوارزميات ملكها و قواعد بيانات مغلقة، و اكثرها رواجا حاليا هي جوجل و باحث اماسان و ياهو. توجد تقنية محركات بحث مفتوحة المصدر مثل اتشتيدج، نتش، سيناز، ايجوثور و اوبنافتياس، و لكن ليس هنالك خادم بحث و ورلد و ايد و ب مشاع يستعمل هذي التقنية.

جاء تطور محرك بحث الوب من تطور محركات البحث على شبكات الاجهزة و الشبكات الداخلية.

محركات البحث على الشبكة الانترنت[عدل]
يمكننا القول بان الشبكة و مواقعها لن تكون ذات فوائد كبار بالنسبة لنا لو لم تكن محركات البحث على انترنت موجودة. بالبدء كانت محركات البحث عبارة عن ادلاء تقوم بفهرسة مواقع الانترنت الجديدة. و ربما كان هذا فعالا عندما كان حجم انترنت يقدر بملايين الصفحات. بعدها تطورت انترنت، و انضم اليها الملايين من مؤسسات الاعمال، و المؤسسات الحكومية، و بلايين الصفحات من ادلة استعمال المنتجات، و المعلومات الخاصة بالمستثمرين، و غير هذا من المعلومات التي تقوم بتسيير عجلة اقتصاد انترنت. و مع ذلك النمو اصبح من الضروري، بل و من الحتمي اضافة محرك بحث فعال الى كافة مواقع انترنت، يقوم بفهرسة و تصنيف المعلومات الموجودة ضمن هذي المواقع كي تتمكن من خدمة زوارها بشكل فعال. و اليوم، و بعد ان اصبحت محركات البحث جزءا رئيسيا بحضارتنا الانترنتية، فان هنالك العشرات من الشركات العاملة بمجال انتاج برمجيات، و تقنيات، و اساليب بحث حديثة موجهة نحو انترنت و انترانت. و بسبب الدور المتزايد الذي تلعبه التجارة و الاعمال الالكترونية باقتصاد اليوم، فان الحافز المادي على الاقل موجود. و لكن رغم النجاح الذي تدعي الشركات المنتجة لتقنيات البحث تحقيقه، فان المستخدمين لا زالوا يشكون من افتقار محركات البحث الى الدقة المطلوبة، و تلبية النتائج التي يتم تحصيلها لمتطلبات المستخدمين

مشاكل تقنيات البحث[عدل]
ان مفتاح النجاح بالحصول على نتائج بحث جيدة، تكمن بنوعية الاستفسارات، او الاسئلة، او الكلمات او العبارات المفتاحية التي نقوم بادخالها بمحركات البحث. لكن المشكلة الرئيسية هنا تكمن بان الغالبية العظمى من المستخدمين لا يقومون عادة بادخال الاستفسارات او العبارات المفتاحية الصحيحة، و التي تؤدي الى الحصول على النتائج المطلوبة، و سنستعرض فيما يلي المشاكل الشائعة بعالم البحث عن المعلومات، و الطرق التي يحاول فيها الباحثون معالجة هذي المشكلات.

عدم طرح الاسئلة الصحيحة[عدل]
من الحقائق الغريبة التي يؤكدها خبراء المعلومات هي ان المستخدمين نادرا ما يقومون بطرح الاسئلة التي تعبر عما يريدونه فعلا. و الاسباب =الرئيس بذلك هو الافتقار الى الفهم الصحيح للمقال قيد البحث، و بالتالي عدم استعمال العبارات المفتاحية الصحيحة، و التي تؤدي الى تكوين استعلامات و اسئلة صحيحة. فالمشكلة الرئيسية هنا اذا، هي مساعدة المستخدمين على طرح الاسئلة و تكوين الاستعلامات الصحيحة. و من مظاهر هذي المشكلة كذلك هي صغر حجم الاستعلامات التي يصبحها المستخدم عادة للاستفسار عن مقال معين. فاذا كان مستعمل ما يريد معلومات عن “السفر” مثلا، فانه يبدا بادخال كلمة عامة بمحرك البحث، و من ثم، و اعتمادا على النتائج التي يحصل عليها، يقوم بتضييق نطاق بحثه الى ان يصل الى ما يريده. و الاسباب =بان الكثير من مستعملي انترنت يستخدمون ذلك الاسلوب يكمن بانهم لا يعرفون حقا الحجم المهول للمعلومات الموجودة بقواعد البيانات الخاصة بمحركات البحث، و التي تفوق عادة ما ممكن لاي انسان التعامل معه.

فجوة المفردات[عدل]
تتميز معظم اللغات الطبيعية بتنوع المفردات التي تتناول نفس المعنى، فمثلا السحاب، الغمام، المزن، العارض.. و غيرها تدور حول نفس المعنى سحاب، و بينما يدرك الانسان تطابق هذي المفردات بالمعنى تعجز محركات البحث التقليدية عن استيعاب كل المرادفات الممكنة، فتفتقر نتائجها الى كثير من الوثائق ذات العلاقة بمقال البحث لكنها لم تستعمل نفس مفردات المستخدم، و تسمى هذي المشكلة فجوة المفردات.

الموازنة بين الكم و النوع[عدل]
عند التعامل مع تقنيات البحث فلا بد من الموازنة بين الكم و النوع، او ما يدعوه الخبراء بالدقة و القدرة على الاسترجاع. و هي علاقة عكسية تماما، فكلما تم تضييق نطاق البحث سعيا عن نتائج اكثر دقة، كلما قل مقدار البيانات الذي ممكن استرجاعه. و لذا فان هنالك حاجة لوجود محركات بحث تقدم دقة عالية دون التضحية بمقدار النتائج “الدقيقة” التي نسترجعها.

غموض الكلمات[عدل]
معظم العبارات تحمل اكثر من معنى، و معظم محركات البحث المستخدمة اليوم تقوم بمطابقة العبارات و ليس معانيها، و لذا فان نتائج عمليات البحث التي نحصل عليها، تحتوي غالبا على العبارات المفتاحية الصحيحة، و لكنها ذات المعنى الخاطئ. فاذا جربت مثلا ان تبحث عن معنى كلمة “جافا” مثلا، و هي احدى لغات البرمجة الشائعة الاستخدام، فانك ستحصل العديد من النتائج المتعلقة بالجفاف، او باسم جزيرة اندونيسية تحمل الاسم نفسه، اضافة الى معلومات عن لغة البرمجة لانه يبحث عن البنية الصرفية و الشكليه للكلمة و ليس المعنى.

الاسماء و نوعياتها[عدل]
وماذا عن البحث بالاسماء، اي البحث عن معلومات عن الاشخاص و الاماكن، و ما الى ذلك. خصوصا و ان الكتاب يغيرون عادة الكيفية التي يقومون فيها بكتابة الاسماء. و اذا ما تحدثنا مثلا عن اسماء الشركات، فانها تتغير باستمرار نتيجة عملية الاندماج و الضم، مما يجعل عملية البحث صعبة. و ربما يقول البعض انه ممكن التغلب على هذي المشكلة نوعا ما باستعمال برمجيات الفهرسة، و لكن المشكلة هي ان المعلومات بعالمنا تتغير باستمرار مما يجعل الفهرسة اليدوية صعبة. و ماذا عن الفهرسة الالية الاجابة هي انه لا توجد بعد التقنية التي يمكنها القيام بذلك بدقة، بحيث ممكن التمييز مثلا بين موضوع كامل عن شخص معين، و موضوع احدث يذكر اسم الشخص بشكل عابر.

المعالجة الطبيعية للغة[عدل]
يجمع العاملون بمجال محركات البحث بان الحل لكافة هذي المشاكل يكمن بتصميم محركات البحث، و برمجيات البحث عموما، بحيث تستفيد من برمجيات المعالجة الطبيعية للغة Natural Language Processingعموما، و المعالجة الطبيعية للمعنى Natural Meaning Processing، و الاستفادة من قواعد اللغة. النقطة الرئيسية هنا هي ان اللغة عموما مبنية على اساس قواعد ذات اساس شبيه بالمعادلات الرياضية، كما ان كلمات اللغة و كلماتها تكون مبنية حسب هيكلية معينة, فلكل جملة مبتدا و خبر، او فعل و فاعل و مفعول به، كما ان العبارات تاتي عادة من جذور و اصول. و هذي الهيكلية المبنية ضمن اللغة تتناسب و طبيعة عمل برمجيات الحاسوب، و التي تحتاج الى هيكلية معينة تنفذ على اساسها عملياتها. اما المعالجة الطبيعية للمعنى فهي اكثر صعوبة، فكلمة مثل “راحة” ممكن لها ان تعني عدة اشياء، كالارتياح بعد التعب، او الراحة الابدية و التي تعني الموت، او راحة اليد. و لهذا فان برمجيات البحث يجب ان تتمكن من فهم الكلمة ضمن سياق النص، و دور الكلمة بهذا السياق. و لكن حتى ذلك الاسلوب لا يفلح دوما بفهم المعنى. جرب ان تقرا ديوانا شعريا جيدا، و ستجد ان هناك العديد من العبارات الصعبة، و التي ربما يحاول البعض فهمها من السياق، و لكننا عندما نعجز عن هذا فاننا نتجه الى القاموس. و ذلك اسلوب ممكن لبرمجيات الحاسوب اتباعه، اي الاعتماد على قاموس او فهرس بالعبارات و الكلمات الشائعة الاستخدام، و البحث بالسياق. و فيما يلي بعض مفاهيم البحث التي تعتمد على المعالجة الطبيعية للغة؛

دراسة الجمل[عدل]
تتميز الجمل بانها ذات هيكلية محددة و واضحة، مما يساعد بفهم المعنى بشكل سريع. و من اثناء تحديد نوع الجملة، ممكن لبرمجيات البحث ان تقوم بعملها بشكل اكثر دقة. و لعمل هذا فان هذي البرمجيات يجب ان تعتمد على كميات كبار من المصادر و المراجع اللغوية، كالمكانز، و التي تحتوي على كلمات و جمل ذات علاقات محددة مسبقا. و باستعمال هذي المكانز ممكن لبرمجيات البحث ان تفهم بشكل اروع طبيعة العلاقة بين العبارات المختلفة و مواقعها الصحيحة ضمن الجمل. و رغم الفوائد العظيمة للمكانز، فان مدى فعاليتها يعتمد على تحديثها باستمرار، و الا فانها تفقد فاعليتها تدريجيا. و باستعمال المكانز، و تصريف الجمل و اعرابها ممكن الحصول على نظم بحث قوية يمكنها فهم كلمات البحث و معاني العبارات ضمن السياق بشكل افضل.

ازالة الالتباس: اختيار المعنى الصحيح[عدل]
اوضحنا بالنقطة اعلاه كيف ممكن للمكانز و نظم تصريف و اعراب الجمل ان تسهم بشكل اروع بفهم المعنى من اثناء السياق. و هذي التقنية مفيدة اذا كنا نبحث ضمن نصف معين، و لكنها ليست مفيدة عند ادخال الاستفسارات و الاستعلامات ضمن محركات البحث، حيث تتكون هذي عادة من عدد محدود من الكلمات، و بالتالي فان حجم النص غير كاف لتحليل معنى الكلمات. و الحل لهذه المشكلة و اضح الى درجة الاحراج و يتمثل بسؤال المستخدم عن المعنى الذي يقصده؛ فعندما يدخل المستخدم كلمة “راحة” مثلا ضمن مربع الاستعلام، فان محرك البحث يساله عن المعنى المقصود، او المعنى المراد البحث عنه، قبل الشروع بعملية البحث. و توجد اليوم الكثير من محركات البحث التي تستعمل قواميس مضمنة تقوم بتقديم قوائم بالمعاني المختلفة التي تمثلها الكلمة الواحدة قبل الشروع بعملية البحث. و من هذي المحركات هنالك LexiGuide من شركة LexiQuest، و Oingo، و Simplifind على موقع Simpli.com.

التصنيف التلقائي[عدل]
هذا الاسلوب هو الاقدم، حيث يتم تصنيف الوثائق حسب تصنيفات و فروع معينة، و من بعدها البحث بشكل منفصل ضمن كل تصنيف عن المعلومات المطلوبة. فمثلا، عند البحث عن كلمة “نواة” فان بحثك ربما يقودك الى تصنيف يتعلق بعلوم الزراعة، و نوعيات الحبوب، و ما الى ذلك، و لكنه بالوقت نفسه ربما يقودك الى تصنيف يقع ضمن علوم الفيزياء النووية. و الحل هنا يكمن بتصنيف الوثائق المتعلقة بانوية الحبوب و المزروعات بقسم الزراعة مثلا، و الوثائق المتعلقة بانوية الذرات بقسم الفيزياء الذرية. و لكن ماذا لو كانت لدينا و ثيقة تتعلق بتاثير التجارب النووية على انوية الحبوب و المزروعات هل يجب عندها وضع الوثيقة بالقسمين، ام ما هو الحل و هنا تنشا لدينا مشكلة المعنى المزدوج. و من هنا تاتي اهمية التصنيف التلقائي، حيث يتم استعمال علوم النحو من تصريف و اعراب، و استعمال المكانز و القواميس، بحيث يتمكن النظام من “فهم” المقالات الرئيسة بو ثيقة ما . و يتم هذا باستعمال اساليب احصائية تقوم بدراسة تكرار العبارات ضمن و ثيقة ما ، و من بعدها تحديد السياق، و الذي يساعد بعملية البحث. و كمثال على هذا لناخذ كلمة، او اسم مثل “فهد” او “ليث” و هي اسماء عربية دارجة. و لنفترض اننا كتبنا موضوعا بمجلتنا عن شخص اسمه “فهد”، و لنفترض ان محرك بحث اراد تصنيف مقالنا هذا. بهذه الحال، و اذا كان محرك البحث يستعمل اسلوب التصنيف التلقائي، فانه سيقوم من اثناء دراسة النص و نوعية العبارات الموجودة به و علاقاتها و تكرارها، بتحديد ان الموضوع ينتمي الى تصنيف علوم الحاسوب و الانترنت و ليس الحيوانات و الوحوش البرية. و تتبع برمجيات التصنيف التلقائي قواعد معينة يحددها المبرمجون، او ممكن للالة نفسها ان تتعلم ذاتيا كيف تقوم بتصنيف الكلمات. او ممكن استعمال الاسلوبين، بحيث يتم تصنيف الوثائق التي تتبع نمطا معينا بشكل تلقائي، بحين يتم تحويل تلك التي يستحيل تصنيفها الى عامل بشري كي يقوم بذلك.

زيادة دقة الاستعلامات[عدل]
من يستخدم محركات البحث باستمرار يعلم انه من المحتوم الحصول على مئات الالوف من النتائج على الاقل عند البحث عن مقال معين بشكل عام. اما عند تضييق نطاق البحث، فاننا نحصل على مقدار اقل من النتائج الاكثر دقة. و لزيادة دقة الاستعلامات، فان بعض محركات البحث يقوم بتعديل الاستعلام، و هذا بتقديم معان مرادفة لعبارات البحث الى المستخدم، لمساعدته على تحديد مقال بحثه بدقة اكبر. ففي مثل هذي النظم، و اذا كان مقال استعلامك هو “الرياضة” مثلا، فان النظام يقدم لك عددا من البدائل التي تساعد بتحديد مقال البحث مثل “التربية البدنية”، “اللياقة البدنية” او “اللياقة” و غير هذا من المرادفات التي تساعد على توجيه العملية بحيث يحصل المستخدم على اكبر كم من النتائج الدقائق التي تعبر عن مقال البحث.

ربط المفاهيم[عدل]
اذا جربت اليوم ان تبحث عن العبارة “اسطوانات الليزر” وهي العبارة العامية و القديمة للاقراص المدمجة فانك لن تحصل على العديد من النتائج المفيدة من محركات البحث، حيث ان عبارة “الاقراص المدمجة” هي الكلمة الشائعة و المستخدمة بالغالبية العظمى من المطبوعات. و لهذا فان الكثير من محركات البحث هذي الايام تستعمل اسلوب الربط بين المفاهيم، بحيث انك اذا قمت بكتابة العبارة “اقراص الليزر” فانك ستحصل على معلومات عن “الاقراص المدمجة”. و يعتمد ذلك الاسلوب على تحديد العلاقة بين العبارات و الكلمات بقاعدة البيانات بشكل مسبق، كما انه مفيد عند البحث بو ثائق متعددة اللغات، فالبحث عن كلمة “اقراص الليزر” ممكن ان يعطي نتائج لوثائق باللغة الانجليزية عن “Compact Disks” او CDs و ما الى ذلك، و ذلك اسلوب مفيد جدا جدا بعالم انترنتي لم تعد به اللغة الانجليزية هي السائدة.

الصورة الحالية[عدل]
انظر الى اي موقع للتجارة الالكترونية، و ستجد انه غير ذا فوائد تذكر اذا لم يكن محرك البحث المستخدم فيه قادرا على نقلك الى صفحة المنتج، او المنتجات، التي تريدها اثناء اسرع وقت ممكن. و لذا نجد ان بوابات التجارة و الاعمال الالكترونية العالمية مثل Ebay و امازون تعتبر برمجيات البحث احد اهم موجوداتها و تسعى باستمرار الى تحديثها. و ربما قامت شركة Ebay قبل سنوات بشراء نظام بحث متقدم من شركة Fast Search & Transfer النرويجية، و التي كانت تنتج تقنية بحث حديثة تقوم بتقديم اخر المعلومات للباحثين عن نتائج المزادات و الاسعار المتداولة. كما ان امازون و مواقع مثل Marthastewar.com تقوم بالتعامل مع شركة Google و AskJeeves بحيث يتم ربط المستخدمين بالبضائع التي يريدون شرائها من اثناء كتابة سؤال اعتيادي ضمن مربع الاستعلام. و تقول الخبيرة ما رثا فراي، و هي باحثة بشؤون التجارة الالكترونية بمجموعة باتريشيا سيبولد، “يمكن القول بان الاسباب =الرئيس بفشل معظم مواقع التجارة الالكترونية، يعود الى اعتمادها لتقنيات بحث ضعيفة.” كما اكتشفت مؤسسة ميديا ميتريكس للابحاث بان 80 من مستعملي انترنت، يتوقفون عن استعمال موقع ما اذا لم تعمل و ظيفة البحث المضمنة به بالشكل الصحيح. و من هنا كان السباق بين عدد من الشركات لتطوير تقنيات بحث متقدمة، ممكن للبشر الاعتياديين التعامل معها، و الحصول على النتائج التي يريدونها تماما. و سنستعرض فيما يلي عددا من الشركات العالمية التي ابتكرت تقنيات ممكن لها ان تغير وجه انترنت الى الابد.

ايكساليد Exalead[عدل]
ايكساليد Exalead محرك بحث فرنسي متخصص بالتقنيات الحديتة للبحث نوعية نتائج البحث, تصنيف النتائج, صور تمهيدية لكل صفحة.(Exalead)

انفراسيرتش Infrasearch[عدل]
تجمع هذي الشركة ما بين تقنيات البحث المتقدمة التي تحدثنا عنها بالصفحات السابقة، و بين تقنيات برمجيات مشاركة الملفات، و هي ما يطلق عليه البعض برمجيات الند الى الند، او ما يعرف بالانجليزية باسم P2P، انظر مقالنا بهذا العدد و المتعلق بهذا الموضوع). و ربما قامت شركة صن ما يكروسيستمز العملاقة مؤخرا بشراء هذي الشركة الشابة بمؤسسيها المراهقين الثلاث و طاقم عملها الذي يتكون من 15 مبرمجا. و تعد هذي التقنية، اذا ما كتب لها النجاح بمختبرات صن فان تقنية انفراسيرتش تعد بالسيطرة على عالم البحث عبر انترنت. و تعمل تقنية انفراسيرتش بالشكل الاتي؛ يقوم المستخدم بتنزيل برنامج صغير الحجم على جهازه، و مشاركة دليل معين، او عدة ادلة على جهازه، يريد ان ممكن المستخدمين الاخرين من البحث فيها. و ذلك البرنامج شبيه ببرنامج نابستر، و لكن قدراته لا تقتصر على ملفات MP3 فقط، بل تتعداها لتشمل جميع نوعيات الملفات، فاذا كنت تبحث عن الحل لمسالة رياضية معينة مثلا، و كان احد الطلبة ربما قام بحل هذي المسالة او المعادلة، و وضع الحل ضمن ملف على جهازه، فانه يمكنك عند البحث باستعمال انفراسيرتش ان تعثر على ذلك الملف و حل المعادلة، اذا كان ذلك المستخدم ربما اختار مشاركته مع الغير عبر الشبكة. و لا تتوقف قدرات انفراسيرتش هنا، فاذا كنت تريد شراء سيارة معينة، فان برنامج انفراسيرتش ياخذك الى دليل على موقع الشركة، و من بعدها توجيهك الى القسم الخاص بالسيارة التي تريدها، و الحصول على احدث المعلومات عن هذي السيارة، بما بذلك صورة لاحدث موديل لها قام احد المستخدمين بالتقاطها و وضعها على جهازه ليشاركها مع الغير. كما ممكن للوكيل مثلا ان يشارك ملفا على جهازه يحتوي على عقد البيع و اجراءات التسجيل و ما الى ذلك. و بما ان برنامج انفراسيرتش مجاني، فقد كان المخطط الاصلي للشركة هو جعل المؤسسات التجارية، التي تختار استعمال البرنامج بعملياتها، تقوم بدفع مقابل ما دي بسيط جدا جدا مقابل كل عملية بحث تقوم اجهزة انفراسيرتش المزودة بتوجيهها الى المؤسسة التجارية. و ذلك يعني ان عوائد الشركة تعتمد على عدد الاشخاص الذين يقومون بالبحث بشبكتها. و اضافة الى ذلك، فان انفراسيرتش كانت تخطط للتعاون مع محركات البحث الشائعة الاستخدام، و هذا لجعل نتائج بحثها “طازجة” و جديدة باكبر قدر ممكن، حيث ان نتائج البحث التي نحصل عليها عادة من هذي المحركات تعتمد على مدى نشاط الروبوتات التي تقوم بفهرسة مواقع انترنت، و هي عادة متاخرة حوالي 24 ساعة عما نشر على الشبكة. اما باستعمال تقنية انفراسيرتش فان النتائج تكون طازجة بالدقائق و الثانية. و كما قلنا اعلاه، فان انفراسيرتش الان ملك لصن ما يكروسيتمز، و نرجو ان نرى منتجها عما قريب على انترنت.

غوغل[عدل]
بدا محرك البحث ذلك Google.com كمشروع لرسالة دكتوراة حول تقنيات الذكاء الاصطناعي و المعالجة الطبيعية للغة بجامعة ستانفورد بالولايات المتحدة، و تحول اليوم الى بوابة انترنت عالمية كبرى تخدم البحث ب 66 لغة منها العربية)، تقوم بمعالجة 120 مليون طلب بحث يوميا حسب احصائيات مؤسسة ميديا ميتركس للابحاث)، كما ان الموقع اصبح مؤخرا ضمن اكبر 15 موقعا بالولايات المتحدة. و لا يتوقف الامر هنا، حيث ان عوائده تصل الى 50 مليون دولار سنويا، و يتوقع البعض ان يصل حجم هذي العوائد بالمستقبل القريب الى مليار دولار امريكي حسب مجلة بيزنس و يك الامريكية. و المستخدم لهذا الموقع يعرف تمام المعرفة مدى دقته بتقديم النتائج المطلوبة، و من المرة الاولى، كما انه لا يتطلب خبرة كبرى من المستخدم بصياغة الاسئلة و الاستعلامات. و يعتمد ذلك الموقع تقنيات احصائية و رياضية متقدمة تقوم بدراسة الوثائق المفهرسة، و تكرار العبارات ضمن كل و ثيقة، و بالتالي الحكم على موضوعها و علاقتها بعبارة البحث التي يقوم المستخدم باستعمالها. و مهما كانت الوصفة السحرية التي يستعملها موقع غوغل فانه يعتبر الاروع بين كافة مواقع البحث المستخدمة اليوم.

اسك Ask[عدل]
موقع Ask.com يستعمل اللغة الطبيعية بالبحث و يعتمد قاعدة بيانات و تقنيات تمكن المستخدم من توجيه سؤال البحث “باللغة الانجليزية” بلغة سهلة وعامية كذلك لتقوم قاعدة البيانات بالمطابقة بين العبارات المفتاحية بالسؤال، و بين ما هو موجود بقاعدة بياناتها. و رغم هذا فان محرك “اسك” يعتمد جزئيا على التدخل البشري لتصنيف المعلومات و فهرستها اذا لم تكن موجودة بقاعدة البيانات. فعند حصول حدث اخباري ما مثلا، فان “اسك”لن يتمكن من التعامل مع اي سؤال يتعلق بهذا الحدث الا اذا قام مدراء قواعد البيانات بتحديث النظام.

وقد قامت الشركة المسئولة عن الموقع بطرح نظام مستقل، ممكن للمؤسسات العاملة بمجالات التجارة و الاعمال الالكترونية تضمينه بمواقعها بحيث ممكن لعملائها توجيه اسئلة و استفسارات باللغة الطبيعية، و الحصول على اجوبة لها دون اي تدخل بشري.

اوبن كولا OpenCola[عدل]
نعود هنا الى شركة ثانية =تستعمل تقنيات مشاركة الملفات، و المعالجة الطبيعية للغة، اضافة الى اسلوب المجتمعات الخبيرة Expert Communities، لخدمة عملية البحث. و تنتج هذي الشركة برنامجا صغيرا مجانيا يقوم المستخدم بتنزيله و تثبيته على جهازه، و من بعدها ممكن له سحب و اسقاط ملف ما سواء نص، او موسيقى، او صورة، او اي نسق كان ضمن ذلك البرنامج، و الذي يقوم بالبحث ضمن اجهزة كمبيوتر ثانية =مشاركة بالشبكة، عن ملفات مشابهة. فاذا كنتم مثلي، من هواة جمع اللوحات الالكترونية للمدرسة الانطباعية او التكعيبية، و كانت لديكم صورة تمثل احدى هذي المدارس الفنية، فيمكن وضع هذي الصورة ضمن البرنامج، و الذي يبحث بعدين باجهزة الكومبيوتر المشاركة ضمن الشبكة ليحصل على ملفات مماثلة. و ماذا عن فكرة المجتمعات الخبيرة تهدف اوبن كولا الى تشجيع المشاركين بشبكتها على مشاركة اجهزتهم مع اشخاص يشابهونهم بالاهتمامات، فاذا كان لدي مجلد على جهازي يحتوي على لوحات الكترونية للمدرسة التكعيبية مثلا، فانني اقوم بمشاركتها ضمن موقع اوبن كولا و ضمن تصنيف خاص بهذه النوعية من اللوحات. كما ان اوبن كولا تستعمل روبوتات موزعة، او عناصر الية، تعتمد اسلوب البحث بالعناصر البرمجية. و ممكن للمستخدمين تحسين دقة النتائج التي يحصلون عليها بتدريب هذي الروبوتات الباحثة، و التي تتعلم من اثناء التجربة.

اوتونومي Autonomy[عدل]
تعتمد البرمجيات التي تستعملها هذي الشركة Autonomy.com على تقنية المطابقة ما بين انساق النص و تكرار الكلمات و الكلمات، و هذا لتحديد المفاهيم الاساسية المميزة لوثيقة ما ، و تشفيرها ضمن هذي الوثيقة، و من بعدها البحث عن و ثائق تحتوي على مفاهيم مشابهة بنصوص اخرى. و باستعمال ذلك الاسلوب ممكن للباحث ان يقوم بكتابة جمل تصف ما يبحث عنه بلغة سهلة، و البحث على ذلك الاساس. كما ان محرك بحث اوتونومي يمكنه ان يتعلم ما يريده المستخدم، بناء على نوعية المواد التي يقراها او يستعرضها ذلك المستخدم.

بريموس Primus[عدل]
تركز برمجيات البحث الخاصة بهذه الشركة على المواد التي تتعامل مع خدمة الزبائن، او المواد الموجودة ضمن نماذج الكترونية، و هي على ذلك الاساس مكملة لما تقوم فيه شركة اوتونومي. و تسمح هذي البرمجيات للمستخدمين بان يقوموا بتوجيه اسئلة الى قاعدة البيانات باستعمال اللغة الطبيعية. و يقوم النظام بجمع نتائج البحث، و تقديمها للمستخدمين الذين يقومون بطرح اسئلة مشابهة.

المستقبل[عدل]
يوجد على انترنت اليوم بلايين الصفحات، و حسب المصادر المتوفرة فانه ربما تم حتى اليوم فهرسة ما يزيد قليلا على البليون صفحة. و تتسابق الشركات التي تقوم بفهرسة هذي الصفحات باتاحتها لمستخدمي انترنت، و الحفاظ على سرعة الاستجابة التي يحصل عليها المستخدم. و اضافة الى السرعة فان على قواعد البيانات هذي ان تثبت و جودها بتقديم اجوبة “طازجة”، و متناسقة، و ذات علاقة بما يبحث عنه المستخدم. كما ان عجلة الابتكار لا تتوقف بمجال البحث، فموقع www.hotlinks.com يتيح للمستخدمين امكانية حفظ مفضلاتهم Favorites ضمن دليل على انترنت، و هذا كي تكون هذي المفضلات متاحة للمستخدم اينما كان، و ممكن للمستخدمين ان يختاروا مشاركة مفضلاتهم مع مستعملي انترنت الاخرين، و تمكين زوار الموقع من البحث على انترنت من اثناء البحث بمفضلات الاخرين، و بالتالي الحصول على معلومات راى مستعملون اخرون انها مفيدة لدرجة وضع المواقع التي تحتويها ضمن مفضلاتهم. كما ان هنالك مواقع للبحث مثل www.expertcentral.com و التي تقدم للباحثين اجابات متخصصة. و اضافة الى هذا فهنالك الكثير من محركات البحث التي تعتمد تقنيات الشبكات العبنوتة Neural Networks، و محركات البحث التي ممكن تثبيتها على اجهزة المستخدمين، و فهرسة محتويات اقراصهم الصلبة. و نظرا للاهمية المتواصلة لمحركات البحث، فان التقنيات الحديثة ستواصل ظهورها، و ستواصل التقنية تطورها لتقديم نتائج اروع للمستخدمين. و بظهور هذي التقنيات فان بعضها سيفشل و بعضها سينجح، و ستصبح التقنيات الناجحة جزءا من محركات البحث المستخدمة اليوم.

تطبيقات مستقبلية[عدل]
اذا لم تكن تريد انفاق الملايين بابتكار تقنيات للذكاء الاصطناعي و المعالجة الطبيعية للغة، فان الحل الاسهل هو استعمال الميزات التي تقدمها لغة XML لجعل عملية البحث اكثر دقة. فهذه اللغة كما هو معروف تعتمد على توصيف الوثائق و البيانات عند نشرها على الشبكة. فالمادة المتعلقة بالاسعار مثلا يتم توصيفها بعلامات تدل على انها تمثل السعر، و المادة التي تصف ابعاد بضاعة معينة يتم توصيفها بهذا الشكل. و باستعمال XML ممكن للروبوتات التي تقوم بفهرسة مواقع انترنت ان تفهم المحتوى الموجود ضمن الصفحات. و بالتالي فعندما تبحث عن تذكرة سفر بسعر معين مثلا، فان الروبوتات لا تقوم فقط بالعثور على التذكرة باروع الاسعار، و لكنها تعثر كذلك على اروع سعر لغرفة فندق، او سيارة مستاجرة. و من التطبيقات الثانية =مثلا هي انك اذا عرضت سيرتك الذاتية على الروبوت فانه يقترح عليك اروع و ظيفة تناسب مؤهلاتك. او اذا عرضت على الروبوت ملفك الصحي فانه يقترح عليك الفيتامينات التي يجب عليك تناولها، او النوادي الصحية التي يمكنك الانضمام اليها. و بالطبع فاننا لا نعتقد ان XML هي الحل السحري، و لكنها ممكن ان تؤدي الى زيادة نجاعة عمليات البحث اذا ما اقترنت بالتقنيات الثانية =المذكورة بموضوعنا هذا.

محركات البحث عربيا[عدل]
عربيا لا توجد محركات بحث عديدة تعتمد على نفسها، ممكن حصرها ب2 او 3 فقط اذ ان اغلب محركات البحث العربية تعتمد على محركات بحث اجنبية ذلك لعدم قدرة الشركات العربية على الاستثمار بهذا المجال و تبقى اغلب محركات البحث التي تعتمد على نفسها كليا ضعيفة لضعف التجهيزات اذ تكون غالبا من اجتهاد افراد على سرفرات عامة.

pictures صورة

 

  • اسماء محركات البحث
  • أسماء قواعد البيانات العالمية
  • اشهر مواقع واسماءها

655 مشاهدة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني.