يوم 7 يوليو 2020 الثلاثاء 9:08 مساءً

اسماء محركات البحث , اشهر مواقع البحث العالمية

محرك البحث الباحوث هو برنامج حاسوبى مصمم للمساعدة في العثور على مستندات مخزنه على شبكات معلوماتيةالشبكه العنكبوتيه العالمية بالانجليزية: World Wide Web) او على حاسوب شخصي. بنيت محركات البحث الاولي اعتمادا على التقنيات المستعملة في ادارة المكتبات الكلاسيكية. حيث يتم بناء فهارس للمستندات تشكل قاعده للبيانات تفيد في البحث عن اي معلومة.

محركات البحث الاكثر استخداما و نسبة السيطره على محركات البحث في اوخر 2020
يسمح محرك البحث للمستخدم ان يطلب المحتوي الذى يقابل معايير محدده والقاعده فيها تلك التي تحتوى على كلمه او عبارة ما و يستدعى قائمة بالمراجع توافق تلك المعايير. تستعمل محركات البحث مؤشرات/فهارس/مسارد منتظمه التحديث لتشتغل بسرعه و فعالية.
تعرض النتائج على مظهر قائمة بعناوين المستندات التي توافق الطلب. يرفق بالعناوين في الغالب مختصر عن المستند المشار الية او مقتطف منه للداله على موافقتة للبحث. ترتب عناصر قائمة البحث على حسب معايير خاصة ربما تختلف من محرك لاخر)، من اهمها مدي موافقه كل عنصر للطلب.
عند الحديث عن محركات البحث فغالبا ما يقصد محركات البحث على شبكه الانترنت و محركات الويب بالخصوص. محركات البحث في الويب تبحث عن المعلومات على الشبكه العنكبوتيه العالمية، و منها يستخدم على نطاق ضيق يشمل البحث داخل الشبكات المحليه للمؤسسات اي انترانت بالانجليزية: Intranet). اما محركات البحث الشخصيه فتبحث في الحواسيب الشخصيه الفردية.
بعض محركات البحث ايضا تحفر في البيانات المتاحه على المجموعات الاخبارية، و قواعد البيانات الضخمة، او ادله مواقع الوب كدموز دوت اورج.
محتويات [اخف] 1 تاريخ
2 اشهر محركات البحث
3 كيف تعمل محركات البحث
4 محركات البحث على الشبكه الانترنت
5 مشاكل تقنيات البحث
5.1 عدم طرح الاسئله الصحيحة
5.2 فجوه المفردات
5.3 الموازنه بين الكم و النوع
5.4 غموض الكلمات
5.5 الاسماء و نوعياتها
6 المعالجه الطبيعية للغة
6.1 دراسه الجمل
6.2 ازاله الالتباس: اختيار المعنى الصحيح
6.3 التصنيف التلقائي
6.4 زياده دقه الاستعلامات
6.5 ربط المفاهيم
7 الصورة الحالية
7.1 ايكساليد Exalead
7.2 انفراسيرتش Infrasearch
7.3 غوغل
7.4 اسك Ask
7.5 اوبن كولا OpenCola
7.6 اوتونومى Autonomy
7.7 بريموس Primus
8 المستقبل
8.1 تطبيقات مستقبلية
8.2 محركات البحث عربيا
9 انظر ايضا
10 ارتباطات خارجية
تاريخ[عدل] اول محرك بحث كان و اندكس بالانجليزية: Wandex [بحاجة لمصدر]، و هو فهرس جمعة متجول و ب و هو زاحف عنكبوتى بالانجليزية: web crawler طورة ما ثيو جراى في معهد ما ساشوستس للتكنولوجيا MIT في 1993. و يعد اليوب بالانجليزية: Aliweb محرك بحث احدث مبكر جدا جدا و ربما ظهر في 1993 و يعمل حتى اليوم. و اول محرك بحث قائم على الزاحف العنكبوتى للنصوص الكاملة كان و بكراولر بالانجليزية: WebCrawler)، و الذى خرج للوجود في 1994. و على عكس سابقيه، فقد ترك المستخدمين يبحثون عن اي كلمه على اي صفحة و يب، و هو ما اصبح القاعده لكل محركات البحث الكبري منذ هذا الوقت. كان هو ايضا الاول في معرفه الجمهور به على نطاق و اسع. في 1994 كذلك جاء لايكوس بالانجليزية: Lycos الذى بدا في جامعة كارنيجى ميلون بالانجليزية: Carnegie Mellon University) و اصبح مشروعا تجاريا كبيرا.
بعد هذا بقليل، ظهر الكثير من محركات البحث و تزاحمت على الشعبية. و كان من ضمنها اكسايت بالانجليزية: Excite)، انفوسيك بالانجليزية: Infoseek)، و انكتومى بالانجليزية: Inktomi)، و نورثرن لايت بالانجليزية: Northern Light)، و التافيستا بالانجليزية: Alta Vista). و في بعض الحالات تنافست مع الادله ذات الشعبية كياهو بالانجليزية: Yahoo). فيما بعد، ادمجت الادله او اضافت اليها تقنيه محرك البحث من اجل اداء اكبر للوظائف.
عرفت محركات البحث ايضا بكونها بعض المع النجوم في نوبه الاستثمار في الانترنت التي و قعت في اواخر التسعينات. دخلت عده شركات السوق في مشهد كبير، مسجله مكاسب قياسيه اثناء طرح اسهمها العام الافتتاحي. و ربما سحب البعض محركاتهم البحثيه العامة، و هم يسوقون نسخا للشركات فقط، كنورثرن لايت التي كانت من ال8 او 9 محركات بحث المبكره بعد ان جاء لايكوس بالانجليزية: Lycos).
قبل مجيء الانترنت، كانت هنالك بواحيث لموافيق بروتوكولات)او استخدامات اخرى، كمحرك بحث اركى لمواقع اف‌.تي.‌بى المجهوله بالانجليزية: anonymous FTP و محرك بحث ڤيرونيكا لبروتوكول جوفر.
وستاتى بعض محركات البحث الاخرى= منها اية ناين.كوم a9.com امازون.كوم)، اسك چيڤيز/تيوما بالانجليزية: Ask Jeeves/Teoma)، جيجابلاست، سناپ بالانجليزية: Snap)، و الهاللو بالانجليزية: Walhello)، كازاز بالانجليزية: Kazazz)، و وايسنت بالانجليزية: WiseNut). و بعض احدث اخر محركات البحث، و التي تبحث فقط نوعياتا محدده من المحتوي هي پلازو Plazoo لمردود الخلاصات RSS feeds)، و جوهوك GoHook لملفات پى دى اف PDF بشكل اساسي). و من اشهر المحركات ايضا: Yooci و ThroughSearch
اشهر محركات البحث[عدل] جوجل بالانجليزية: Google)
ياهو بالانجليزية: Yahoo!)
بينج بالانجليزية: Bing)
لايف سيرش بالانجليزية: LiveSearch)
دك دك غو بالانجليزية: DuckDuckGo)
كيف تعمل محركات البحث[عدل] تعمل محركات البحث عن طريق تخزين المعلومات عن عدد كبير من صفحات الوب، و التي تستعيدها من الشبكه العالمية و ورلد و ايد و ب نفسها. تستعاد هذه الصفحات بواسطه زاحف و ب يعرف احيانا ايضا ب عنكبوت‘ و هو مستعرض و ب الى يتبع كل رابط يراه. بعد هذا يجرى تحليل كل صفحة لتحديد كيف ينبغى فهرستها على سبيل المثال، تستخلص العبارات من العناوين، رؤوس الموضوعات، او حقول خاصة تعرف ب ميتا تاجز). تخزن البيانات عن صفحات الوب في قاعده بيانات فهرسيه للاستعمال في عمليات البحث طلبا للمعلومات لاحقا. بعض محركات البحث، كجوجل، تخزن كل او بعض الصفحة المصدر وتشير لها ب مخبوءة و بالمثل معلومات عن صفحات الوب، بينما بعضها تخزن كل كلمه من كل صفحة تجدها، كالتاڤيستا. هذه الصفحة المخبوءه تمسك بنص البحث الفعلى بما انه هو الذى تمت فهرستة فعليا، لذا فقد تكون=مفيدة جدا جدا عندما يصير محتوي الصفحة الحاليه ربما جري تجديدة و لم تعد الفاظ البحث فيه. قد تعتبر هذه المشكلة شكلا خفيفا من تعفن الروابط، و تزيد معالجه جوجل لها من امكانيه الاستعمال بارضاء توقعات المستخدم بان ترد الفاظ البحث في صفحات الوب العائده في الرد. و هو ما يرضى مبدا مفاجاه اخف من مفاجاة‘ بما ان المستخدم يتوقع بشكل طبيعي الفاظ البحث في النتيجة العائده له. و هذه الصله بالبحث تجعل هذه الصفحات المخبوءه مفيدة جدا، حتى اكثر من و اقع انها ربما تحتوى على بيانات قد لم تعد متاحه في موضع اخر.
عندما يتوجة مستعمل لمحرك البحث و يجرى عملية بحث طلبا للمعلومات، كما هو سائد باعطاء عبارات مفتاحية، يفتش المحرك في الفهرس و يقدم قائمة بصفحات الوب الاروع توافقا تبعا لمعاييره، في المعتاد مع ملخص قصير يحتوى على عنوان الوثيقه و احيانا اجزاء من النص. معظم محركات البحث تدعم استعمال الاصطلاحات البولينيه نسبة للجبر البولينى و هو نوع من المتغيرات المنطقية): AND و OR و NOT لمزيد من تحديد طلب المعلومات. و هنالك خدمه و ظيفيه متقدمه هي البحث بالتقارب، و التي تسمح لك بتحديد المسافه بين العبارات المفتاحية، باستعمال الفاظ كNEAR، NOT NEAR، FOLLOWED BY، NOT FOLLOWED BY، SENTENCE، FAR.
يعتمد مدي فوائد محرك بحث على مدي صله النتائج التي يرد بها. فبينما ربما تكون=هنالك ملايين صفحات الوب التي تحتوى على كلمه او عبارة محددة، ربما تكون=بعض اوثق صلة، او اروج، او معتمدة اكثر من غيرها. معظم محركات البحث توظف اساليب لوضع مراتب النتائج لتقدم اروع النتائج اولا. الطريقة التي يقرر بها محرك بحث اي الصفحات هي الاروع توافقا، و ما النظام الذى يجب ان تخرج به النتائج، تختلف بشكل شاسع من محرك لاخر. الاساليب ايضا تتغير عبر الزمن بتغير استعمال انترنت و تكنيكات حديثة تتطور.
معظم محركات البحث هي مضاربات تجاريه يدعمها عائد اعلانى و ، بالنتيجة، يوظف البعض الممارسه المثيره للجدل بالسماح للمعلنين بدفع النقود ليرفعوا لهم قوائهم في مراتب نتائج البحث.
الاغلبيه الكاسحه من محركات البحث تديرها شركات خاصة تستعمل خوارزميات ملكها و قواعد بيانات مغلقة، و اكثرها رواجا حاليا هي جوجل و باحث اماسان و ياهو. توجد تقنيه محركات بحث مفتوحه المصدر كاتشتيدج، نتش، سيناز، ايجوثور و اوبنافتياس، و لكن ليس هنالك خادم بحث و ورلد و ايد و ب مشاع يستعمل هذه التقنية.
جاء تطور محرك بحث الوب من تطور محركات البحث على شبكات الاجهزة و الشبكات الداخلية.
محركات البحث على الشبكه الانترنت[عدل] يمكننا القول بان الشبكه و مواقعها لن تكون=ذات فوائد كبار بالنسبة لنا لو لم تكن محركات البحث على انترنت موجودة. في البدء كانت محركات البحث عبارة عن ادلاء تقوم بفهرسه مواقع الانترنت الجديدة. و ربما كان هذا فعالا عندما كان حجم انترنت يقدر بملايين الصفحات. ثم تطورت انترنت، و انضم اليها الملايين من مؤسسات الاعمال، و المؤسسات الحكومية، و بلايين الصفحات من ادله استعمال المنتجات، و المعلومات الخاصة بالمستثمرين، و غير هذا من المعلومات التي تقوم بتسيير عجله اقتصاد انترنت. و مع ذلك النمو صار من الضروري، بل و من الحتمى اضافه محرك بحث فعال الى كافه مواقع انترنت، يقوم بفهرسه و تصنيف المعلومات الموجوده ضمن هذه المواقع كى تتمكن من خدمه زوارها بشكل فعال. و اليوم، و بعد ان اصبحت محركات البحث جزءا رئيسيا في حضارتنا الانترنتية، فان هنالك العشرات من الشركات العامله في مجال انتاج برمجيات، و تقنيات، و اساليب بحث حديثة موجهه نحو انترنت و انترانت. و بسبب الدور المتزايد الذى تلعبة التجاره و الاعمال الالكترونيه في اقتصاد اليوم، فان الحافز المادى على الاقل موجود. و لكن رغم النجاح الذى تدعى الشركات المنتجه لتقنيات البحث تحقيقه، فان المستخدمين لا زالوا يشكون من افتقار محركات البحث الى الدقه المطلوبة، و تلبيه النتائج التي يتم تحصيلها لمتطلبات المستخدمين
مشاكل تقنيات البحث[عدل] ان مفتاح النجاح في الحصول على نتائج بحث جيدة، تكمن في نوعيه الاستفسارات، او الاسئلة، او الكلمات او العبارات المفتاحيه التي نقوم بادخالها في محركات البحث. لكن المشكلة الاساسية هنا تكمن في ان الغالبيه العظمي من المستخدمين لا يقومون عاده بادخال الاستفسارات او العبارات المفتاحيه الصحيحة، و التي تؤدى الى الحصول على النتائج المطلوبة، و سنستعرض فيما يلى المشاكل الشائعه في عالم البحث عن المعلومات، و الطرق التي يحاول بها الباحثون معالجه هذه المشكلات.
عدم طرح الاسئله الصحيحة[عدل] من الحقائق الغريبة التي يؤكدها خبراء المعلومات هي ان المستخدمين نادرا ما يقومون بطرح الاسئله التي تعبر عما يريدونة فعلا. و السبب= الرئيس في هذا هو الافتقار الى الفهم الصحيح للمقال قيد البحث، و بالتالي عدم استعمال العبارات المفتاحيه الصحيحة، و التي تؤدى الى تكوين استعلامات و اسئله صحيحة. فالمشكلة الاساسية هنا اذا، هي مساعدة المستخدمين على طرح الاسئله و تكوين الاستعلامات الصحيحة. و من اشكال هذه المشكلة ايضا هي صغر حجم الاستعلامات التي يكونها المستخدم عاده للاستفسار عن مقال معين. فاذا كان مستعمل ما يريد معلومات عن “السفر” مثلا، فانه يبدا بادخال كلمه عامة في محرك البحث، و من ثم، و اعتمادا على النتائج التي يحصل عليها، يقوم بتضييق نطاق بحثة الى ان يصل الى ما يريده. و السبب= في ان الكثير من مستعملى انترنت يستخدمون ذلك الاسلوب يكمن في انهم لا يعرفون حقا الحجم المهول للمعلومات الموجوده في قواعد البيانات الخاصة بمحركات البحث، و التي تفوق عاده ما ممكن لاى انسان التعامل معه.
فجوه المفردات[عدل] تتميز معظم اللغات الطبيعية بتنوع المفردات التي تتناول نفس المعنى، فمثلا السحاب، الغمام، المزن، العارض.. و غيرها تدور حول نفس المعنى سحاب، و بينما يدرك الانسان تطابق هذه المفردات في المعنى تعجز محركات البحث التقليديه عن استيعاب كل المرادفات الممكنة، فتفتقر نتائجها الى كثير من الوثائق ذات العلاقه بمقال البحث لكنها لم تستعمل نفس مفردات المستخدم، و تسمي هذه المشكلة فجوه المفردات.
الموازنه بين الكم و النوع[عدل] عند التعامل مع تقنيات البحث فلا بد من الموازنه بين الكم و النوع، او ما يدعوة الخبراء بالدقه و القدره على الاسترجاع. و هي علاقه عكسيه تماما، فكلما تم تضييق نطاق البحث سعيا عن نتائج اكثر دقة، كلما قل مقدار البيانات الذى ممكن استرجاعه. و لذلك فان هنالك حاجة لوجود محركات بحث تقدم دقه عاليه دون التضحيه بمقدار النتائج “الدقيقة” التي نسترجعها.
غموض الكلمات[عدل] معظم العبارات تحمل اكثر من معنى، و معظم محركات البحث المستخدمة اليوم تقوم بمطابقه العبارات و ليس معانيها، و لذلك فان نتائج عمليات البحث التي نحصل عليها، تحتوى غالبا على العبارات المفتاحيه الصحيحة، و لكنها ذات المعنى الخاطئ. فاذا جربت مثلا ان تبحث عن معنى كلمه “جافا” مثلا، و هي احدي لغات البرمجه الشائعه الاستخدام، فانك ستحصل العديد من النتائج المتعلقه بالجفاف، او باسم جزيره اندونيسيه تحمل الاسم نفسه، اضافه الى معلومات عن لغه البرمجه لانة يبحث عن البنيه الصرفيه و الشكلية للكلمه و ليس المعنى.
الاسماء و نوعياتها[عدل] وماذا عن البحث في الاسماء، اي البحث عن معلومات عن الاشخاص و الاماكن، و ما الى ذلك. خصوصا وان الكتاب يغيرون عاده الكيفية التي يقومون بها بكتابة الاسماء. و اذا ما تحدثنا مثلا عن اسماء الشركات، فانها تتغير باستمرار نتيجة عملية الاندماج و الضم، مما يجعل عملية البحث صعبة. و ربما يقول البعض انه ممكن التغلب على هذه المشكلة نوعا ما باستعمال برمجيات الفهرسة، و لكن المشكلة هي ان المعلومات في عالمنا تتغير باستمرار مما يجعل الفهرسه اليدويه صعبة. و ماذا عن الفهرسه الالية الاجابه هي انه لا توجد بعد التقنيه التي يمكنها القيام بذلك بدقة، بحيث ممكن التمييز مثلا بين موضوع كامل عن شخص معين، و موضوع احدث يذكر اسم الشخص بشكل عابر.
المعالجه الطبيعية للغة[عدل] يجمع العاملون في مجال محركات البحث بان الحل لكافه هذه المشاكل يكمن في تصميم محركات البحث، و برمجيات البحث عموما، بحيث تستفيد من برمجيات المعالجه الطبيعية للغه Natural Language Processingعموما، و المعالجه الطبيعية للمعنى Natural Meaning Processing، و الاستفاده من قواعد اللغة. النقطه الاساسية هنا هي ان اللغه عموما مبنيه على اساس قواعد ذات اساس شبية بالمعادلات الرياضية، كما ان كلمات اللغه و كلماتها تكون=مبنيه حسب هيكليه معينة, فلكل جمله مبتدا و خبر، او فعل و فاعل و مفعول به، كما ان العبارات تاتى عاده من جذور و اصول. و هذه الهيكليه المبنيه ضمن اللغه تتناسب و طبيعه عمل برمجيات الحاسوب، و التي تحتاج الى هيكليه معينة تنفذ على اساسها عملياتها. اما المعالجه الطبيعية للمعنى فهي اكثر صعوبة، فكلمه ك“راحة” ممكن لها ان تعني عده اشياء، كالارتياح بعد التعب، او الراحه الابديه و التي تعني الموت، او راحه اليد. و لهذا فان برمجيات البحث يجب ان تتمكن من فهم الكلمه ضمن سياق النص، و دور الكلمه في ذلك السياق. و لكن حتى ذلك الاسلوب لا يفلح دوما في فهم المعنى. جرب ان تقرا ديوانا شعريا جيدا، و ستجد ان هناك العديد من العبارات الصعبة، و التي ربما يحاول البعض فهمها من السياق، و لكننا عندما نعجز عن هذا فاننا نتجة الى القاموس. و ذلك اسلوب ممكن لبرمجيات الحاسوب اتباعه، اي الاعتماد على قاموس او فهرس بالعبارات و الكلمات الشائعه الاستخدام، و البحث في السياق. و فيما يلى بعض مفاهيم البحث التي تعتمد على المعالجه الطبيعية للغة؛
دراسه الجمل[عدل] تتميز الجمل بانها ذات هيكليه محدده و واضحة، مما يساعد في فهم المعنى بشكل سريع. و من اثناء تحديد نوع الجملة، ممكن لبرمجيات البحث ان تقوم بعملها بشكل اكثر دقة. و لعمل هذا فان هذه البرمجيات يجب ان تعتمد على كميات كبار من المصادر و المراجع اللغوية، كالمكانز، و التي تحتوى على كلمات و جمل ذات علاقات محدده مسبقا. و باستعمال هذه المكانز ممكن لبرمجيات البحث ان تفهم بشكل اروع طبيعه العلاقه بين العبارات المختلفة و مواقعها الصحيحة ضمن الجمل. و رغم الفوائد العظيمه للمكانز، فان مدي فعاليتها يعتمد على تحديثها باستمرار، و الا فانها تفقد فاعليتها تدريجيا. و باستعمال المكانز، و تصريف الجمل و اعرابها ممكن الحصول على نظم بحث قويه يمكنها فهم كلمات البحث و معاني العبارات ضمن السياق بشكل افضل.
ازاله الالتباس: اختيار المعنى الصحيح[عدل] اوضحنا في النقطه اعلاة كيف ممكن للمكانز و نظم تصريف و اعراب الجمل ان تسهم بشكل اروع في فهم المعنى من اثناء السياق. و هذه التقنيه مفيدة اذا كنا نبحث ضمن نص معين، و لكنها ليست مفيدة عند ادخال الاستفسارات و الاستعلامات ضمن محركات البحث، حيث تتكون هذه عاده من عدد محدود من الكلمات، و بالتالي فان حجم النص غير كاف لتحليل معنى الكلمات. و الحل لهذه المشكلة و اضح الى درجه الاحراج و يتمثل في سؤال المستخدم عن المعنى الذى يقصده؛ فعندما يدخل المستخدم كلمه “راحة” مثلا ضمن مربع الاستعلام، فان محرك البحث يسالة عن المعنى المقصود، او المعنى المراد البحث عنه، قبل الشروع بعملية البحث. و توجد اليوم الكثير من محركات البحث التي تستعمل قواميس مضمنه تقوم بتقديم قوائم بالمعاني المختلفة التي تمثلها الكلمه الواحده قبل الشروع في عملية البحث. و من هذه المحركات هنالك LexiGuide من شركة LexiQuest، و Oingo، و Simplifind على موقع Simpli.com.
التصنيف التلقائي[عدل] هذا الاسلوب هو الاقدم، حيث يتم تصنيف الوثائق حسب تصنيفات و فروع معينة، و من ثم البحث بشكل منفصل ضمن كل تصنيف عن المعلومات المطلوبة. فمثلا، عند البحث عن كلمه “نواة” فان بحثك ربما يقودك الى تصنيف يتعلق بعلوم الزراعة، و نوعيات الحبوب، و ما الى ذلك، و لكنة في الوقت نفسة ربما يقودك الى تصنيف يقع ضمن علوم الفيزياء النووية. و الحل هنا يكمن في تصنيف الوثائق المتعلقه بانويه الحبوب و المزروعات في قسم الزراعه مثلا، و الوثائق المتعلقه بانويه الذرات في قسم الفيزياء الذرية. و لكن ماذا لو كانت لدينا و ثيقه تتعلق بتاثير التجارب النوويه على انويه الحبوب و المزروعات هل يجب عندها وضع الوثيقه في القسمين، ام ما هو الحل و هنا تنشا لدينا مشكلة المعنى المزدوج. و من هنا تاتى اهمية التصنيف التلقائي، حيث يتم استعمال علوم النحو من تصريف و اعراب، و استعمال المكانز و القواميس، بحيث يتمكن النظام من “فهم” المقالات الرئيسه في و ثيقه ما . و يتم هذا باستعمال اساليب احصائيه تقوم بدراسه تكرار العبارات ضمن و ثيقه ما ، و من ثم تحديد السياق، و الذى يساعد في عملية البحث. و كمثال على هذا لناخذ كلمة، او اسم ك“فهد” او “ليث” و هي اسماء عربية دارجة. و لنفترض اننا كتبنا موضوعا في مجلتنا عن شخص اسمه “فهد”، و لنفترض ان محرك بحث اراد تصنيف مقالنا هذا. في هذه الحال، و اذا كان محرك البحث يستعمل اسلوب التصنيف التلقائي، فانه سيقوم من اثناء دراسه النص و نوعيه العبارات الموجوده فيه و علاقاتها و تكرارها، بتحديد ان الموضوع ينتمى الى تصنيف علوم الحاسوب و الانترنت و ليس الحيوانات و الوحوش البرية. و تتبع برمجيات التصنيف التلقائى قواعد معينة يحددها المبرمجون، او ممكن للاله نفسها ان تتعلم ذاتيا كيف تقوم بتصنيف الكلمات. او ممكن استعمال الاسلوبين، بحيث يتم تصنيف الوثائق التي تتبع نمطا معينا بشكل تلقائي، في حين يتم تحويل تلك التي يستحيل تصنيفها الى عامل بشرى كى يقوم بذلك.
زياده دقه الاستعلامات[عدل] من يستخدم محركات البحث باستمرار يعلم انه من المحتوم الحصول على مئات الالوف من النتائج على الاقل عند البحث عن مقال معين بشكل عام. اما عند تضييق نطاق البحث، فاننا نحصل على مقدار اقل من النتائج الاكثر دقة. و لزياده دقه الاستعلامات، فان بعض محركات البحث يقوم بتعديل الاستعلام، و هذا بتقديم معان مرادفه لعبارات البحث الى المستخدم، لمساعدتة على تحديد مقال بحثة بدقه اكبر. ففى كهذه النظم، و اذا كان مقال استعلامك هو “الرياضة” مثلا، فان النظام يقدم لك عددا من البدائل التي تساعد في تحديد مقال البحث ك“التربيه البدنية”، “اللياقه البدنية” او “اللياقة” و غير هذا من المرادفات التي تساعد على توجية العملية بحيث يحصل المستخدم على اكبر كم من النتائج الدقيقه التي تعبر عن مقال البحث.
ربط المفاهيم[عدل] اذا جربت اليوم ان تبحث عن العبارة “اسطوانات الليزر” وهي العبارة العاميه و القديمة للاقراص المدمجة فانك لن تحصل على العديد من النتائج المفيدة من محركات البحث، حيث ان عبارة “الاقراص المدمجة” هي الكلمه الشائعه و المستخدمة في الغالبيه العظمي من المطبوعات. و لهذا فان الكثير من محركات البحث هذه الايام تستعمل اسلوب الربط بين المفاهيم، بحيث انك اذا قمت بكتابة العبارة “اقراص الليزر” فانك ستحصل على معلومات عن “الاقراص المدمجة”. و يعتمد ذلك الاسلوب على تحديد العلاقه بين العبارات و الكلمات في قاعده البيانات بشكل مسبق، كما انه مفيد عند البحث في و ثائق متعدده اللغات، فالبحث عن كلمه “اقراص الليزر” ممكن ان يعطى نتائج لوثائق باللغه الانجليزية عن “Compact Disks” او CDs و ما الى ذلك، و ذلك اسلوب مفيد جدا جدا في عالم انترنتى لم تعد فيه اللغه الانجليزية هي السائدة.
الصورة الحالية[عدل] انظر الى اي موقع للتجاره الالكترونية، و ستجد انه غير ذا فوائد تذكر اذا لم يكن محرك البحث المستخدم به قادرا على نقلك الى صفحة المنتج، او المنتجات، التي تريدها اثناء اسرع وقت ممكن. و لذلك نجد ان بوابات التجاره و الاعمال الالكترونيه العالمية كEbay و امازون تعتبر برمجيات البحث احد اهم موجوداتها و تسعي باستمرار الى تحديثها. و ربما قامت شركة Ebay قبل سنوات بشراء نظام بحث متقدم من شركة Fast Search & Transfer النرويجية، و التي كانت تنتج تقنيه بحث حديثة تقوم بتقديم اخر المعلومات للباحثين عن نتائج المزادات و الاسعار المتداولة. كما ان امازون و مواقع كMarthastewar.com تقوم بالتعامل مع شركة Google و AskJeeves بحيث يتم ربط المستخدمين بالبضائع التي يريدون شرائها من اثناء كتابة سؤال اعتيادى ضمن مربع الاستعلام. و تقول الخبيره ما رثا فراي، و هي باحثه في شؤون التجاره الالكترونيه في مجموعة باتريشيا سيبولد، “ممكن القول بان السبب= الرئيس في فشل معظم مواقع التجاره الالكترونية، يعود الى اعتمادها لتقنيات بحث ضعيفة.” كما اكتشفت مؤسسة ميديا ميتريكس للابحاث بان 80 من مستعملى انترنت، يتوقفون عن استعمال موقع ما اذا لم تعمل و ظيفه البحث المضمنه فيه بالشكل الصحيح. و من هنا كان السباق بين عدد من الشركات لتطوير تقنيات بحث متقدمة، ممكن للبشر الاعتياديين التعامل معها، و الحصول على النتائج التي يريدونها تماما. و سنستعرض فيما يلى عددا من الشركات العالمية التي ابتكرت تقنيات ممكن لها ان تغير و جة انترنت الى الابد.
ايكساليد Exalead[عدل] ايكساليد Exalead محرك بحث فرنسي متخصص في التقنيات الحديته للبحث نوعيه نتائج البحث, تصنيف النتائج, صور تمهيديه لكل صفحة.(Exalead)
انفراسيرتش Infrasearch[عدل] تجمع هذه الشركة ما بين تقنيات البحث المتقدمه التي تحدثنا عنها في الصفحات السابقة، و بين تقنيات برمجيات مشاركه الملفات، و هي ما يطلق عليه البعض برمجيات الند الى الند، او ما يعرف بالانجليزية باسم P2P، انظر مقالنا في ذلك العدد و المتعلق بهذا الموضوع). و ربما قامت شركة صن ما يكروسيستمز العملاقه مؤخرا بشراء هذه الشركة الشابه بمؤسسيها المراهقين الثلاث و طاقم عملها الذى يتكون من 15 مبرمجا. و تعد هذه التقنية، اذا ما كتب لها النجاح في مختبرات صن فان تقنيه انفراسيرتش تعد بالسيطره على عالم البحث عبر انترنت. و تعمل تقنيه انفراسيرتش بالشكل الاتي؛ يقوم المستخدم بتنزيل برنامج صغير الحجم على جهازه، و مشاركه دليل معين، او عده ادله على جهازه، يريد ان ممكن المستخدمين الاخرين من البحث فيها. و ذلك البرنامج شبية ببرنامج نابستر، و لكن قدراتة لا تقتصر على ملفات MP3 فقط، بل تتعداها لتشمل كل نوعيات الملفات، فاذا كنت تبحث عن الحل لمساله رياضيه معينة مثلا، و كان احد الطلبه ربما قام بحل هذه المساله او المعادلة، و وضع الحل ضمن ملف على جهازه، فانه يمكنك عند البحث باستعمال انفراسيرتش ان تعثر على ذلك الملف و حل المعادلة، اذا كان ذلك المستخدم ربما اختار مشاركتة مع الغير عبر الشبكة. و لا تتوقف قدرات انفراسيرتش هنا، فاذا كنت تريد شراء سيارة معينة، فان برنامج انفراسيرتش ياخذك الى دليل على موقع الشركة، و من ثم توجيهك الى القسم الخاص بالسيارة التي تريدها، و الحصول على احدث المعلومات عن هذه السيارة، بما في هذا صورة لاحدث موديل لها قام احد المستخدمين بالتقاطها و وضعها على جهازة ليشاركها مع الغير. كما ممكن للوكيل مثلا ان يشارك ملفا على جهازة يحتوى على عقد البيع و اجراءات التسجيل و ما الى ذلك. و بما ان برنامج انفراسيرتش مجاني، فقد كان المخطط الاصلي للشركة هو جعل المؤسسات التجارية، التي تختار استعمال البرنامج في عملياتها، تقوم بدفع مقابل ما دى بسيط جدا جدا مقابل كل عملية بحث تقوم اجهزة انفراسيرتش المزوده بتوجيهها الى المؤسسة التجارية. و ذلك يعني ان عوائد الشركة تعتمد على عدد الاشخاص الذين يقومون بالبحث في شبكتها. و اضافه الى ذلك، فان انفراسيرتش كانت تخطط للتعاون مع محركات البحث الشائعه الاستخدام، و هذا لجعل نتائج بحثها “طازجة” و جديدة باكبر قدر ممكن، حيث ان نتائج البحث التي نحصل عليها عاده من هذه المحركات تعتمد على مدي نشاط الروبوتات التي تقوم بفهرسه مواقع انترنت، و هي عاده متاخره حوالى 24 ساعة عما نشر على الشبكة. اما باستعمال تقنيه انفراسيرتش فان النتائج تكون=طازجه بالدقيقه و الثانية. و كما قلنا اعلاه، فان انفراسيرتش الان ملك لصن ما يكروسيتمز، و نرج وان نري منتجها عما قريب على انترنت.
غوغل[عدل] بدا محرك البحث ذلك Google.com كمشروع لرساله دكتوراه حول تقنيات الذكاء الاصطناعى و المعالجه الطبيعية للغه في جامعة ستانفورد في الولايات المتحدة، و تحول اليوم الى بوابه انترنت عالمية كبري تخدم البحث ب 66 لغه منها العربية)، تقوم بمعالجه 120 مليون طلب بحث يوميا حسب احصائيات مؤسسة ميديا ميتركس للابحاث)، كما ان الموقع صار مؤخرا ضمن اكبر 15 موقعا في الولايات المتحدة. و لا يتوقف الامر هنا، حيث ان عوائدة تصل الى 50 مليون دولار سنويا، و يتوقع البعض ان يصل حجم هذه العوائد في المستقبل القريب الى مليار دولار امريكي حسب مجلة بيزنس و يك الامريكية. و المستخدم لهذا الموقع يعرف تمام المعرفه مدي دقتة في تقديم النتائج المطلوبة، و من المره الاولى، كما انه لا يتطلب خبره كبري من المستخدم في صياغه الاسئله و الاستعلامات. و يعتمد ذلك الموقع تقنيات احصائيه و رياضيه متقدمه تقوم بدراسه الوثائق المفهرسة، و تكرار العبارات ضمن كل و ثيقة، و بالتالي الحكم على موضوعها و علاقتها بعبارة البحث التي يقوم المستخدم باستعمالها. و مهما كانت الوصفة السحريه التي يستعملها موقع غوغل فانه يعتبر الاروع بين كافه مواقع البحث المستخدمة اليوم.
اسك Ask[عدل] موقع Ask.com يستعمل اللغه الطبيعية في البحث و يعتمد قاعده بيانات و تقنيات تمكن المستخدم من توجية سؤال البحث “باللغه الانجليزية” بلغه سهلة وعاميه ايضا لتقوم قاعده البيانات بالمطابقه بين العبارات المفتاحيه في السؤال، و بين ما هو موجود في قاعده بياناتها. و رغم هذا فان محرك “اسك” يعتمد جزئيا على التدخل البشرى لتصنيف المعلومات و فهرستها اذا لم تكن موجوده في قاعده البيانات. فعند حصول حدث اخبارى ما مثلا، فان “اسك”لن يتمكن من التعامل مع اي سؤال يتعلق بهذا الحدث الا اذا قام مدراء قواعد البيانات بتحديث النظام.
وقد قامت الشركة المسئوله عن الموقع بطرح نظام مستقل، ممكن للمؤسسات العامله في مجالات التجاره و الاعمال الالكترونيه تضمينة في مواقعها بحيث ممكن لعملائها توجية اسئله و استفسارات باللغه الطبيعية، و الحصول على اجوبه لها دون اي تدخل بشري.
اوبن كولا OpenCola[عدل] نعود هنا الى شركة اخرى= تستعمل تقنيات مشاركه الملفات، و المعالجه الطبيعية للغة، اضافه الى اسلوب المجتمعات الخبيره Expert Communities، لخدمه عملية البحث. و تنتج هذه الشركة برنامجا صغيرا مجانيا يقوم المستخدم بتنزيلة و تثبيته على جهازه، و من ثم ممكن له سحب و اسقاط ملف ما سواء نص، او موسيقى، او صورة، او اي نسق كان ضمن ذلك البرنامج، و الذى يقوم بالبحث ضمن اجهزة كمبيوتر اخرى= مشاركه في الشبكة، عن ملفات مشابهة. فاذا كنتم مثلي، من هواه جمع اللوحات الالكترونيه للمدرسة الانطباعيه او التكعيبية، و كانت لديكم صورة تمثل احدي هذه المدارس الفنية، فممكن وضع هذه الصورة ضمن البرنامج، و الذى يبحث بعدها في اجهزة الكومبيوتر المشاركه ضمن الشبكه ليحصل على ملفات مماثلة. و ماذا عن فكرة المجتمعات الخبيرة تهدف اوبن كولا الى تشجيع المشاركين في شبكتها على مشاركه اجهزتهم مع اشخاص يشابهونهم في الاهتمامات، فاذا كان لدى مجلد على جهازى يحتوى على لوحات الكترونيه للمدرسة التكعيبيه مثلا، فاننى اقوم بمشاركتها ضمن موقع اوبن كولا و ضمن تصنيف خاص بهذه النوعيه من اللوحات. كما ان اوبن كولا تستعمل روبوتات موزعة، او عناصر الية، تعتمد اسلوب البحث في العناصر البرمجية. و ممكن للمستخدمين تحسين دقه النتائج التي يحصلون عليها بتدريب هذه الروبوتات الباحثة، و التي تتعلم من اثناء التجربة.
اوتونومى Autonomy[عدل] تعتمد البرمجيات التي تستعملها هذه الشركة Autonomy.com على تقنيه المطابقه ما بين انساق النص و تكرار الكلمات و الكلمات، و هذا لتحديد المفاهيم الرئيسيه المميزه لوثيقه ما ، و تشفيرها ضمن هذه الوثيقة، و من ثم البحث عن و ثائق تحتوى على مفاهيم مشابهه في نصوص اخرى. و باستعمال ذلك الاسلوب ممكن للباحث ان يقوم بكتابة جمل تصف ما يبحث عنه بلغه سهلة، و البحث على ذلك الاساس. كما ان محرك بحث اوتونومى يمكنة ان يتعلم ما يريدة المستخدم، بناء على نوعيه المواد التي يقراها او يستعرضها ذلك المستخدم.
بريموس Primus[عدل] تركز برمجيات البحث الخاصة بهذه الشركة على المواد التي تتعامل مع خدمه الزبائن، او المواد الموجوده ضمن نماذج الكترونية، و هي على ذلك الاساس مكمله لما تقوم به شركة اوتونومي. و تسمح هذه البرمجيات للمستخدمين بان يقوموا بتوجية اسئله الى قاعده البيانات باستعمال اللغه الطبيعية. و يقوم النظام بجمع نتائج البحث، و تقديمها للمستخدمين الذين يقومون بطرح اسئله مشابهة.
المستقبل[عدل] يوجد على انترنت اليوم بلايين الصفحات، و حسب المصادر المتوفره فانه ربما تم حتى اليوم فهرسه ما يزيد قليلا على البليون صفحة. و تتسابق الشركات التي تقوم بفهرسه هذه الصفحات في اتاحتها لمستخدمى انترنت، و الحفاظ على سرعه الاستجابه التي يحصل عليها المستخدم. و اضافه الى السرعه فان على قواعد البيانات هذه ان تثبت و جودها بتقديم اجوبه “طازجة”، و متناسقة، و ذات علاقه بما يبحث عنه المستخدم. كما ان عجله الابتكار لا تتوقف في مجال البحث، فموقع www.hotlinks.com يتيح للمستخدمين امكانيه حفظ مفضلاتهم Favorites ضمن دليل على انترنت، و هذا كى تكون=هذه المفضلات متاحه للمستخدم اينما كان، و ممكن للمستخدمين ان يختاروا مشاركه مفضلاتهم مع مستعملى انترنت الاخرين، و تمكين زوار الموقع من البحث على انترنت من اثناء البحث في مفضلات الاخرين، و بالتالي الحصول على معلومات راي مستعملون اخرون انها مفيدة لدرجه وضع المواقع التي تحتويها ضمن مفضلاتهم. كما ان هنالك مواقع للبحث كwww.expertcentral.com و التي تقدم للباحثين اجابات متخصصة. و اضافه الى هذا فهنالك الكثير من محركات البحث التي تعتمد تقنيات الشبكات العصبيه Neural Networks، و محركات البحث التي ممكن تثبيتها على اجهزة المستخدمين، و فهرسه محتويات اقراصهم الصلبة. و نظرا للاهمية المتواصله لمحركات البحث، فان التقنيات الحديثة ستواصل ظهورها، و ستواصل التقنيه تطورها لتقديم نتائج اروع للمستخدمين. و بظهور هذه التقنيات فان بعضها سيفشل و بعضها سينجح، و ستكون التقنيات الناجحه جزءا من محركات البحث المستخدمة اليوم.
تطبيقات مستقبلية[عدل] اذا لم تكن تريد انفاق الملايين في ابتكار تقنيات للذكاء الاصطناعى و المعالجه الطبيعية للغة، فان الحل الاسهل هو استعمال الميزات التي تقدمها لغه XML لجعل عملية البحث اكثر دقة. فهذه اللغه كما هو معروف تعتمد على توصيف الوثائق و البيانات عند نشرها على الشبكة. فالمادة المتعلقه بالاسعار مثلا يتم توصيفها بعلامات تدل على انها تمثل السعر، و المادة التي تصف ابعاد بضاعه معينة يتم توصيفها بهذا الشكل. و باستعمال XML ممكن للروبوتات التي تقوم بفهرسه مواقع انترنت ان تفهم المحتوي الموجود ضمن الصفحات. و بالتالي فعندما تبحث عن تذكره سفر بسعر معين مثلا، فان الروبوتات لا تقوم فقط بالعثور على التذكره باروع الاسعار، و لكنها تعثر ايضا على اروع سعر لغرفه فندق، او سيارة مستاجرة. و من التطبيقات الاخرى= مثلا هي انك اذا عرضت سيرتك الذاتيه على الروبوت فانه يقترح عليك اروع و ظيفه تناسب مؤهلاتك. او اذا عرضت على الروبوت ملفك الصحي فانه يقترح عليك الفيتامينات التي يجب عليك تناولها، او النوادى الصحية التي يمكنك الانضمام اليها. و بالطبع فاننا لا نعتقد ان XML هي الحل السحري، و لكنها ممكن ان تؤدى الى زياده نجاعه عمليات البحث اذا ما اقترنت بالتقنيات الاخرى= المذكوره في موضوعنا هذا.
محركات البحث عربيا[عدل] عربيا لا توجد محركات بحث كثيرة تعتمد على نفسها، ممكن حصرها في 2 او 3 فقط اذ ان اغلب محركات البحث العربية تعتمد على محركات بحث اجنبية ذلك لعدم قدره الشركات العربية على الاستثمار في ذلك المجال و تبقي اغلب محركات البحث التي تعتمد على نفسها كليا ضعيفه لضعف التجهيزات اذ تكون=غالبا من اجتهاد افراد على سرفرات عامة.

pictures صورة

 

  • أسماء قواعد البيانات العالمية
  • اسماء محركات البحث

354 مشاهدة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني.