ألفا للمعلوميات - مواضيع و دروس تقنية حصرية ألفا للمعلوميات - مواضيع و دروس تقنية حصرية

مقالة: كيف يعمل محرك البحث جوجل؟

السلام عليكم ورحمة الله وبركاته، لا يمكن أن يمر يوم من دون أن نجري بحث في محرك البحث الشهير "جوجل" حول موضوع معين وفي طرفة عين يعطيك مجموعة كبيرة جدا من النتائج حول الموضوع ! وهنا نتساؤل: كيف تعمل محركات البحث؟ خاصة جوجل! فوجب علينا أن نوقف السير الآن، ونأخذ بضعة دقائق للاستراحة والتأمل في آلية عمل هذا المحرك الضخم!
أولا وقبل كل شيء، فجوجل تعتمد على ما يسمى ببرنامج Googlebot :

 حيث أن هذا البرنامج الزاحف، يقوم بالتنقيب عن الصفحات على الويب، وهو عبارة عن برنامج صغير وظيفته أرشفة صفحات المواقع في محرك البحث، بمعنى تحميل محتوى هاته الصفحات.
 
حتى لا تختلط المفاهيم ويكون كل شيء واضح، ف Googlebot ليس برنامجا واحدا، بل هو عبارة عن العديد منالعناكب (spiders) ، والتي تقوم بالزحف وإجراء حوالي 300 اتصال بصفحات المواقع، حيث يستطيع العنكبوت الواحد، الزحف على أكثر من 100 صفحة خلال ثانية واحدة!
 
عندما يزور برنامج Googleot صفحة معينة، فإنه يقوم بتحليل بنية الصفحة من حيث قياس جودة المحتوى، وطريقة كتابة العنوان، وأكواد الH1 إلخ.. إلى جانب أنه يقوم بتتبع الروابط التي تشير إليها تدوينتك لذلك يفضل وضع دائما  rel=nofollow عند أي رابط يشير إلى خارج موقعك، وبالتالي فإن البرنامج يعمل على قياس جانبين في الصفحة:
الجانب الأول والذي يخص جودة محتواك، والجانب الثاني، والذي يخص الجانب التقني في التدوينة إن صح التعبير.

الترتيب عند محرك البحث جوجل:
 في سنة 1994 كان بعض المستخدمين يعتقد أن فهرسة البحث الشاملة ستتمكن من العثور على أي شيء بسهولة وأن افضل خدمة برنامج للإبحار على الأنترنت، ينبغي أن تجعل من السهل العثور على أي شيء تقريبا في هذا العالم الافتراضي، لكن الويب سيصبح مختلفا بعد أن يعرف أن فهرسة البحث الشاملة ليست العامل الوحيد في تحسين جودة نتيجة البحث، وهذا ما ركزت عليه جوجل خلال بدء مشوارها، فلو نظرنا من منظور آخر لهاته الشركة لوجدنا أنه رغم أنه قد كانت محركات بحث شهيرة آنذاك تضم الملايين من الصفحات المفهرسة، على رأسها Altavista فإن جوجل قد تفوقت عليها، حيث عملت الشركة على جعل نتيجة البحث أدق للمستعمل، حيث كان مبدؤ جوجل هو:
 10 صفحات دقيقة وتوفر للمستخدم ما يبحث عنه، أفضل من المئات من الصفحات الكثيرة وفي النهاية يبقى تائها بين المواقع ولا يجد ما يبحث عنه!
فالجودة هي من تحكم فإظهار  نتيجة البحث عن كلمات معينة.
فإن محركات البحث عموما تعتمد على عشرات العناصر: العنوان الإلكتروني (URL) - تاريخ إنشاء الموضوع أو تاريخ تحديثه - مكان وجود الكلمة المفتاحية في الموضوع (العنوان الرئيسي، العنوان الفرعي، تذييل...)- نسبة تكرار الكلمة المفتحية في الموضوع - بيانات التعريف  (Metadata)
 
أما محرك البحث جوجل فإنه يعتمد على خوارزميات جد متطورة ومعقدة إلى جانب عوامل أخرى لتحديد ماهية صفحات الويب التي ستظهر في رأس نتائج البحث.

ركزت جوجل على مبدأ مهم، والذي هو كالتالي:
 
إن مستخدم الويب ليس لديه الوقت ولا الصبر للبحث عن المعلومات ضمن العشر نتائج الأولى وبالتالي فجوجل يعمل على تدقيق نتائج البحث إلى أقصى حدود وتحسين تجربة المستخدم، بالاعتماد أساسا على خوارزميات والتي إن لم تكن تعرفها هي عبارة عن بعض المعادلات الرياضية المطبقة على صفحات الويب المتواجدة في فهرس المحرك بهدف الترتيب الذي يجب أن تظهر فيه نتائج البحث.
 
إن عناصر الصفحة التي تأخذ بها خوارزميات جوجل هيعنوان الموقع، إسم النطاق، سرعة الموقع، عنوان الصفحة أو الموضوع، المحتوى، شعبية الموقع، الروابط الخارجية  (Backlinks)
كما تختلف الخوارزميات حسب نوع طلبات البحث والمحتوى المطلوب من طرف المستخدم، فهنالك من يبحث عن صور، وهنالك من يبحث عن أخبار وهكذا..
ويعتمد محرك البحث على العديد من الخوارزميات أبرزها البيج رانك، والذي رغم انتهاء تحديثه لا زال يعتبر كمعيار أساسي لتقييم المواقع على الأنترنت، وفي بداية سنة 2011 طور مهندسو جوجل خوارزمية جديدة كلنا نعرفها والتي هي Panda و Penguin والتي ترتكز بالأساس على جودة الصفحات والمواقع المفهرسة.

تقنية البيج رانك Page rank:
 هو تقييم أو ترتيب محرك البحث سواء بينغ أو جوجل أو ياهوو.. لموقعك، كيف هذا؟ أنت عندما تبحث أخي الكريم في جوجل، فهنالك نتائج تظهر في الصفحة الأولى، وأخرى في الصفحة الثانية.. ما يمكنك أن تسنتجه هنا أخي الكريم أن البيج رانك يختلف باختلاف كل موقع وكل مدونة فهنالك مواقع أومدونات لها بيج رانك عال وقوي وهي التي تظهر بالصفحة الأولى بالطبع
وتنحصر قيمة البيج رانك بين 0 و 10، فالموقع صاحب بيج رانك 10 أفضل من موقع بيج رانك 9 والموقع صاحب بيج رانك 8 أفضل من الموقع ذو بيج رانك 7 أو 6 وهكذا دواليه..

 إلى جانب عملية أو تقنية التقييم هذه، فإن جوجل يختار فقط الصفحات التي تحتوي على الكلمات المطلوبة من طرف المستخدم، و الموجودة داخل نصوص الصفحة، أو في الروابط التي تشير إلى الصفحة.
وبعذ ذلك يتم إجراء تحليل لتطابق النص التشعبي لتحديد أي الصفحات أكثر صلة بالموضوع المبحوث عنه، حيث بمقدور جوجل وضع أكثر النتائج ارتباطا بالاستعلام وأكثرها وثوقية في تصدر النتائج.
الأمر الثاني الذي تتميز به هاته الخوارزمية هو تحليل الكلمات المتواجدة في الصفحة نفسها.
فإذا قام الشخص الباحث، بالبحث عن كلمتين أو أكثر سيقوم محرك البحث بعرض الصفحات التي تحتوي على هذه الكلمات، لكن النتائج الأولى ستكون فيها الكلمتان مكررتين ومتقاربتين، لذا ستكون النتائج الأولى أكثر دقة.

ويعتبر جوجل أن قيمة الصفحة أو الموقع عموما، مرتبط دائما بشعبيته أي بعدد الروابط التي تشير إليه   (Backlinks) لكن هنا لا نحرض على أن تكون الروابط كثيرة، وذات جودة سيئة، فالجودة أهم من الكثرة حسب نظر جوجل، فأن تكون لك 10 باكلينكات من مصادر موثوقة، ومن مواقع ذات نفس محتوى مدونتك، أفضل بكثير من أن تكون لك العديد من الروابط الخارجية لكن ذات جودة سيئة، وبالتالي لن تفيدك في أي شيء، بل ستضر موقعك.
 
ووجب عليك أن تعرف أخي الكريم، أن معيار تقييم الصفحة PageRank  يحسب عن طريق 500 متغير وأكثر من ملياري عبارة، يعمل على تطويرها عشرات المهندسين بشكل يومي (رسالة موجهة لعشاق الرياضيات.

إن خوارزمية الترتيب هي فقط مؤشر من بين العديد من العناصر التي تعتمد عليها جوجل في تكنولوجيا البحث على الويب.
وخلال عام 2007، قام المسؤول عن قسم جودة البحث Signhal بتطوير نظام لترتيب الصفحات يرتكز على أكثر من 200 نوع من المعلومات والتي هي إشارات داخل الصفحات: الكلمات، الروابط، الصور... والبعض يتم استخراجها من تاريخ المستخدمين أي متابعة بحثهم على المحرك جوجل من أحل معرفة اهتماماتهم بهدف تخصيص نتائج  البحث حسب رغبات المستخدم.
وبعد الحصول على العديد من الإشارات، يقوم فريق البحث بمعالجة هذه المعلومات عبر استعمال صيغ تسمى   Classificateurs
)
لتحديد المستخدم الذي يريد شراء منتج معين- لتحديد المستخدم الذي يبحث عن مكان، شركة.. إلخ(

خوارزمية  Panda :
 في الأشعر الأخيرة من سنة 2011 بدأ العديد من المشرفين على مواقع الويب يشتكون من غياب مواقعهم ضمن النتائج الأولى لمحرك البحث جوجل، والسبب الأول هو خوارزمية  Panda
فقد قام مات كاتس  Matt Cutts مدير قسم جودة البحث في شركة جوجل، والمسؤول عن تحسين نتائج البحث  SEO search engine optimization وحل مشاكلها بإجراء تحديث لخوارزمية جوجل خلال فبراير 2011.
 
لقد عمل مهندسيو جوجل منذ سنوات على إخراج هذه الخوارزمية الجديدة بهدف تحسين عملية فهرسة المواقع والتركيز على جودة المحتوى. فقاموا بتطوير نموذج لترتيب صفحات الويب يرتكز من جهة على الأهمية (الكلمات المفتاحية) وعلى شعبيتها (الروابط الداخلية Internal links) ومن جهة أخرى على مصداقية المواقع ومستوى خبرة صانع المحتوى: هل هو صاحب المقالة أم المحتوى منقول، عمق المواضيع المطروحة..

تحديث خوارزمية البحث:
تجري شركة جوجل العديد من التغييرات على الخوارزمية التي تعتمد عليها في تكنولوجيا البحث، بهدف تدقيق نتائج البحث وتطوير باقي خدمات الشركة. ففي كل سنة تقوم الشركة بتحديثات لخوارزمية البحث لتصل إلى حوالي 600 مرة ومع أن معظم هذه التغييرات طفيفة، تقوم شركة جوجل كل بضعة أشهر بتحديث جديد ضخم لخوارزمياتها.

كان هذا هو موضوع اليوم أخي الكريم، أتمنى أن أكون قد وفّيت في الشرح، وأوصلت لك القليل من الكثير، طبعًا أنا لم أذكر كل شيء حول محرك البحث، لأن ما خفي دائما كان أعظم، لهذا أدعوك إلى التوغل والبحث في هذا المجال كثيرا حتى ترقى بمستواك المعرفي في هذا المجال.

التعليقات



جميع الحقوق محفوظة 2017 لـ

ألفا للمعلوميات

سياسة الخصوصية