
محركات البحث هي قواعد بيانات قابلة للبحث في محتوى الويب، وهي مكونة من جزأين رئيسيين:
– فهرس البحث:
مكتبة رقمية للمعلومات حول صفحات الويب.
– خوارزميات البحث:
برنامج (برامج) كمبيوتر مكلف بمطابقة النتائج من فهرس البحث.
ما هو الهدف من محركات البحث؟
يهدف كل محرك بحث إلى توفير أفضل النتائج وأكثرها صلة بالمستخدمين، وهذه جزئيا هي الطريقة التي يكتسبون بها حصة في السوق.
كيف تجني محركات البحث المال؟
تحتوي محركات البحث على نوعين من نتائج البحث:
النتائج العضوية من فهرس البحث وهي لا يمكنك الدفع لتكون هنا، والنتائج المدفوعة من المعلنين وتعني يمكنك الدفع لتكون هنا.
وفي كل مرة ينقر فيها شخص ما على نتيجة بحث مدفوعة، يدفع المعلن لمحرك البحث، ويعرف هذا باسم إعلانات الدفع بالنقرة (PPC)، وهذا هو سبب أهمية حصة السوق، والمزيد من المستخدمين تعني المزيد من النقرات على الإعلانات والمزيد من الأرباح.
ما الذي يجعل الويب يعمل؟
صفحات الويب هي مستندات منسقة باستخدام HTML، وهي لغة برمجة ويب تسمح بالارتباطات التشعبية المضمنة التي تربط صفحة بأخرى، وهذا هو المفهوم الوحيد الأكثر أهمية لفهم كيفية عمل الويب.
وتتضمن صفحات الويب محتوى مثل النصوص والصور والنماذج ومقاطع الفيديو والارتباطات التشعبية والمزيد، وهذا المحتوى هو ما يبحث عنه المستخدمون، وتذهب إلى صفحة ويب للقراءة أو المشاهدة أو الاستماع أو تنفيذ مهام مثل شراء منتج أو الاشتراك في رسالة إخبارية، كما يمكنك التنقل باستخدام الروابط بين الصفحات.
هذه الإجراءات ممكنة بسبب المحتوى المبرمج في صفحة ويب، وتجعل طبيعة الويب من السهل التنقل عبر الصفحات، من صفحة إلى أخرى، بناء على ما تنوي القيام به.
ما هو الموقع الالكتروني؟
الموقع الالكتروني عبارة عن مجموعة من صفحات الويب التي توجد جميعها على نفس المجال وعادة ما تكون مملوكة ومدارة من قبل نفس المؤسسة، ويمكن الوصول إلى الصفحة من عنوان URL.
وعندما تنظر إلى عناوين URL الأخرى على الموقع الالكتروني هذا، ستلاحظ أنها تشترك في نفس المجال، على الرغم من اختلاف عنوان URL الكامل.
الفرق بين الروابط الداخلية والخارجية
تستخدم معظم المواقع الالكترونية روابط داخلية أكثر من الروابط الخارجية، وعادة ترتبط جميع الصفحات الموجودة على الموقع الالكتروني بصفحات أخرى على نفس الموقع الالكتروني الخاص بك، مما يؤدي إلى إنشاء شبكة مصغرة خاصة بها من المستندات المترابطة.
وتربط الروابط الداخلية الصفحات التي ترتبط ببعضها البعض وتوجد على نفس المجال، ولكن قوة الويب لها علاقة أكبر بالروابط الخارجية، والروابط الخارجية تبني اتصالات بصفحات الويب الموجودة وتعمل خارج حدود منظمة واحدة.
وهي تساعد في تشكيل جزء من شبكة مليارات الصفحات الموجودة على الويب.
وتختلف أسباب استخدام رابط خارجي، وقد تقوم بتضمين إحصائية في مقالة، وتريد الارتباط بمصدر البيانات على الكترونية أخرى، وهذا لا يضيف مصداقية إلى ما تنشره فحسب، بل يساهم أيضا في شبكة الويب الواسعة.
ماهي مهام محركات البحث؟
تؤدي محركات البحث 3 مهام رئيسية: زحف – الفهرسه – تقديم نتائج البحث.
الزحف هو عملية الوصول إلى صفحات الويب على الإنترنت، والفهرسة هي اشتقاق المعنى من محتوى صفحات الويب وبناء قاعدة بيانات علائقية بينها، ويعني تقديم نتائج البحث تفسير استعلام بحث المستخدم، ثم تقديم النتائج من الفهرس الذي يجيب على هذا الاستعلام على أفضل وجه.
آلية عمل الزحف
عناوين URL للزحف هي مهمة ينفذها برنامج كمبيوتر يعرف باسم الزاحف أو العنكبوت، وتتمثل مهمة الزاحف في زيارة صفحات الويب واستخراج محتوى HTML الذي يعثر عليه، وأحد الأشياء الأساسية التي يبحث عنها الزاحف هو الروابط.
وتحتوي كل صفحة ويب على معرف فريد واحد، عنوان URL الخاص بها، لذلك أدخل عنوان URL في شريط عنوان المتصفح، وستنتقل إلى صفحة الويب، وتتكون صفحات الويب نفسها من محتوى تم ترميزه بتنسيق HTML.
HTML هي لغة يمكن قراءتها آليا، لذلك يمكن لبرنامج خارجي مثل الزاحف زيارة عنوان URL واستخراج HTML والوصول إلى المحتوى بطريقة منظمة، والأهم من ذلك، يمكنه التمييز بين النص والارتباطات التشعبية.
وعندما تفحص برامج الزحف شفرة HTML لصفحة مثل هذه، والتي تحتوي على المقالة التي تقرأها، ستجد أن كل فقرة يقابلها جزء من التعليمات البرمجية يسمى عنصر الفقرة أو علامة p في البداية والنهاية.
ويحدد هذا كتلة من نص الفقرة – تفتح علامة p في البداية عنصر الفقرة، وتغلقه علامة p في النهاية، وعلى الرغم من أنك لا ترى هذا الرمز إلا إذا قمت بفحص الصفحة، إلا أن الزاحف يراها ويفهم أن هذه الصفحة تحتوي على محتوى نصي مصمم للزائرين لقراءته.
وتكون الروابط مرئية أيضا ويتم تفسيرها بواسطة برامج الزحف بسبب شفرة HTML الخاصة بها، وفيم يرتبط رمز المبرمجين بعنصر ربط في البداية والنهاية، وتتضمن الروابط أيضا “سمة” توفر وجهة الارتباط التشعبي و “نص رابط” نص الرابط هو النص المرتبط الذي يراه القراء، وغالبا ما يتم عرضه في المتصفحات باللون الأزرق مع تسطير.
إنها مهمة مباشرة للزاحف لمعالجة هذه الكتلة من HTML وفصل النص عن الرابط، ومع ذلك في صفحة ويب واحدة هناك أكثر بكثير من فقرة ورابط، ولرؤية هذا النوع من البيانات بنفسك، قم بزيارة أي صفحة ويب في متصفحك، وانقر بزر الماوس الأيمن في أي مكان على الشاشة، ثم انقر فوق “عرض المصدر” أو “عرض مصدر الصفحة”، في معظم الصفحات، ستجد مئات الأسطر من التعليمات البرمجية.
لكل صفحة ويب يواجهها الزاحف، سيقوم بتحليل HTML، مما يعني أنه يقسم HTML إلى الأجزاء المكونة له لمزيد من المعالجة، ويستخرج الزاحف جميع الروابط التي يعثر عليها في صفحة معينة، ثم يقوم بجدولتها للزحف إليها، ويبني نفسه حلقة تغذية مرتدة صغيرة:
عنوان URL للزحف → البحث عن روابط لعناوين URL → جدولة عناوين URL للزحف → عنوان URL للزحف
لذلك يمكنك منح الزاحف عنوان URL واحدا كمصدر لبدء الزحف منه، وسيستمر في العمل حتى يتوقف عن العثور على عناوين URL جديدة للزحف إليها – قد يكون هذا آلاف أو حتى ملايين عناوين URL لاحقا.
باختصار، الزحف هو طريقة للاكتشاف، تحدد محركات البحث ما هو موجود عن طريق إرسال برامج زحف الويب للعثور على صفحات الويب باستخدام الروابط كعلامات إرشادية للمكان التالي للبحث فيه.
هذا هو سبب أهمية الروابط الداخلية على الموقع الالكتروني الخاص بك، لأنها تسمح لبرامج زحف محركات البحث باكتشاف جميع الصفحات على موقعك، ومن خلال الروابط الخارجية، سيكتشفون مواقع الكترونية أخرى أثناء استكشافهم لشبكة الصفحات المترابطة التي تشكل الإنترنت.
آلية عمل الفهرسة
عندما تزحف محركات البحث إلى الويب، فإنها تنشئ مستودعات لصفحات الويب التي تجدها، والتي تستخدمها بعد ذلك لإنشاء فهرسها.
فكر في الفهرس الذي ستجده في الجزء الخلفي من كتاب مدرسي عندما كنت في المدرسة، إذا كنت ترغب في التعرف على البنية الخلوية، ويمكنك البحث في فهرس كتاب علم الأحياء والعثور على الصفحات حول هذا الموضوع. تعمل فهرسة صفحات الويب بشكل مشابه.
الفهرس مفيد لأنه يسمح بالبحث السريع، تحتاج محركات البحث مثل Google أيضا إلى طريقة سريعة لاسترداد المعلومات وتقديم نتائج البحث، لذا فإن الفهرسة أمر بالغ الأهمية.
وتأخذ محركات البحث كل صفحة ويب تزحف إليها وتحلل مستند HTML لفصل جميع الروابط، ويفعلون ذلك حتى يتمكنوا من تخزين عنوان URL المقصود الذي يشير إليه كل رابط، جنبا إلى جنب مع نص الرابط المستخدم.
وبالمثل، يأخذون كل محتوى النص الموجود ويقسمونه إلى مجموعة من تكرارات الكلمات.
وباستخدام هذه البيانات التي تم تحليلها، يقومون بإنشاء فهرس معكوس عن طريق تعيين عنوان URL لصفحة الويب مقابل كل كلمة من الكلمات الموجودة على الصفحة.
وبمجرد تخزين عنوان URL بهذه الطريقة ، تتم فهرسته، وهذا يعني أن لديها القدرة على أن تكون في مجموعة من نتائج البحث.
ولكل عنوان URL تمت فهرسته، تخزن محركات البحث أكبر عدد تراه مناسبا من علاقات الكلمات وعناوين URL هذه، إلى جانب البيانات الوصفية الأخرى المرتبطة التي جمعتها حول الصفحة. هذه هي البيانات التي يستخدمونها عند تحديد عناوين URL التي تظهر في نتائج البحث الخاصة بهم.
كيفية عرض نتائج البحث
يحدث الزحف والفهرسة تلقائيا وباستمرار، ويتم تحديث المؤشر في الوقت الحقيقي. يعمل جمع البيانات وتخزينها من تلقاء نفسه ، في الخلفية – غير متأثر بالباحثين الذين يكتبون الاستعلامات.
ومع ذلك ، فإن تقديم نتائج البحث مدفوع بالكامل بإدخال المستخدم من خلال استعلامات البحث الخاصة بهم، وإذا بحث شخص ما عن “أفضل خدمة بث تلفزيوني”، فإن محرك البحث يطابق كل كلمة مع المستندات في فهرسها.
ومجرد مطابقة الكلمات مع الصفحات المفهرسة ينتج عنه مليارات المستندات، لذلك يحتاجون إلى تحديد كيفية إظهار أفضل التطابقات أولا.
هذا هو المكان الذي يصبح فيه الأمر صعبا – ولماذا يعد تحسين محركات البحث مهما. كيف تقرر محركات البحث، من بين مليارات النتائج المحتملة، أي منها تظهر؟ يستخدمون خوارزمية الترتيب.
والخوارزميات هي مجموعة من القواعد التي تتبعها برامج الكمبيوتر لأداء عملية محددة، وخوارزمية الترتيب هي عدد كبير من الخوارزميات والعمليات، وكلها تعمل في انسجام تام.
تبحث خوارزمية الترتيب عن عوامل مثل هذه:
هل تظهر جميع الكلمات في استعلام البحث على الصفحة؟
هل تظهر مجموعات معينة من الكلمات على الصفحة (على سبيل المثال ، “الأفضل” و “البث”)؟
هل تظهر الكلمات في عنوان الصفحة؟
هل الكلمات موجودة في عنوان URL للصفحة؟
هذه أمثلة أساسية، وهناك المئات من العوامل الأخرى التي تأخذها خوارزمية الترتيب في الاعتبار عند تحديد النتائج التي يجب إظهارها، وهذه هي عوامل الترتيب.
السبب في أن Google أصبحت محرك البحث المهيمن في جميع أنحاء العالم بسيط – كانت خوارزمية الترتيب الخاصة بها أفضل من خوارزميات الترتيب لمنافسيها.
المعنى من التعقيد
محركات البحث هي هياكل معقدة للغاية تعالج كميات لا يمكن تصورها من البيانات كل يوم، يطبقون خوارزميات معقدة لفهم تلك البيانات وإرضاء الباحثين.
ويعمل الآلاف من أفضل مهندسي البرمجيات في العالم على المزيد من التحسينات والتحسينات الدقيقة، مما يجعل شركات مثل Google مسؤولة عن تطوير بعض أكثر التقنيات تطورا على هذا الكوكب.
وستستمر تقنيات مثل التعلم الآلي والذكاء الاصطناعي ومعالجة اللغة الطبيعية في التأثير بشكل أكبر على تسليم نتائج البحث، ولا تحتاج إلى فهم كل التعقيد ، ولكن من خلال تطبيق مجموعة من أفضل الممارسات الأساسية، ومن الممكن جعل الموقع الالكتروني الخاص بك قابلا للاكتشاف للكلمات والعبارات التي يبحث عنها عملاؤك.
حقائق أخرى عن محركات البحث
ليست هناك حاجة لتحديث محرك البحث يدويا حتى تحصل على أحدث النتائج في عمليات البحث الخاصة بك، وإذا كنت ترى نتائج قديمة حقا تشك في أنه يجب تحديثها ، فقد تحتاج فقط إلى مسح ذاكرة التخزين المؤقت للمتصفح.
لا تبحث محركات البحث في الويب بالكامل، فهناك أجزاء هائلة من الويب لا يمكن الزحف إليها بواسطة محرك بحث، وتعرف مجتمعة باسم الويب غير المرئي / العميق.
يعثر محرك البحث على صفحات الويب من تلقاء نفسه، لذلك لا تحتاج عادة إلى إخباره بفهرسة الموقع الالكتروني الخاص بك أو إضافة صفحة معينة إلى قاعدة البيانات الخاصة به، ومع ذلك، لأسباب متنوعة ربما لم يزحف محرك البحث إلى صفحة ويب معينة.
وتتضمن بعض محركات البحث أداة تتيح لك أن تطلب صراحة التحقق من الصفحة وإضافتها إلى الفهرس حتى يتمكن الآخرون من العثور عليها، وأداة فحص عنوان URL من Google هي أحد الأمثلة.
ويعد تحسين محركات البحث (SEO) هو شيء يمارسه كتاب محتوى الويب في محاولة للتنافس مع محتوى مماثل موجود من خلال محركات البحث، وتستخدم محركات البحث خوارزميات محددة لترتيب صفحات الويب، لذلك فإن أحد أهداف كاتب المحتوى عبر الإنترنت هو التأكد من أن الصفحة تعكس الموضوع بدقة.
ويتم ذلك عادة عن طريق استهداف كلمات رئيسية أو عبارات معينة، ولكنها لا تزال ذات صلة.
ونظرا لحقيقة أن محركات البحث تزحف إلى الويب بحثا عن البيانات، فغالبا ما يكون هدف مالكي الماوقع الالكترونية السعي للحصول على المزيد من الروابط الواردة حتى تعثر برامج الزحف على الصفحات بسرعة أكبر وتراقبها بحثا عن التغييرات في كثير من الأحيان.
كام يمكن لمتصفحات الويب توجيهك مباشرة إلى محرك بحث من شريط العناوين أعلى التطبيق، وبينما يتم استخدام أداة بحث واحدة فقط عبر هذه الطريقة، يمكنك دائما زيارة الموقع مباشرة بنفسك (على سبيل المثال، انتقل إلى الصفحة الرئيسية ل Startpage إذا كنت تريد استخدام هذا الموقع). بدلا من ذلك ، تتيح لك معظم المتصفحات اختيار محرك بحث مختلف لاستخدامه، على سبيل المثال ، يمكنك تغيير محرك البحث الافتراضي في Chrome.
أخيراً:
أسئلة شائعة:
- الفهرسة: يقوم المحرك بزيارة صفحات الويب المختلفة وفهرستها. يتم ذلك باستخدام الروبوتات المعروفة بـ “الزوائد” أو “الزوائد النشطة” التي تتبع روابط الصفحات وتقوم بتحليل المحتوى وفهرسته.
- تخزين البيانات: يتم تخزين المعلومات التي تم فهرستها في قواعد بيانات ضخمة.
- البحث وتقديم النتائج: عندما يقوم المستخدم بإدخال مصطلح البحث في محرك البحث، يقوم المحرك بتحليل الاستعلام والبحث في قاعدة البيانات لإيجاد الصفحات ذات الصلة. يتم تقديم النتائج وفقًا لأهمية الصفحات المحتملة والعوامل الأخرى مثل التنسيق والترتيب.