מנוע חיפוש, מערכת ממוחשבת שמאפשרת לאתר מידע דיגיטלי מסוגים שונים כגון אתרי אינטרנט, קבצים או רשומות המייצגות פריטים פיזיים.
מנוע חיפוש מקצר זמן חיפוש ועוזר להתמודד עם הצפת המידע ברשת. השימוש הנפוץ הוא חיפוש אתרים באינטרנט, אך מנועים פועלים גם במחשבים מקומיים ובארגונים. "אינדקס" הוא רשימה מסודרת של תכנים שהמנוע יוצר כדי למצוא מידע מהר יותר. "מטא-דטא" הוא מידע על המידע, כמו תאריכים או מחבר.
החיפוש יכול לכלול טקסט, תמונות וקבצי מולטימדיה. יש מנועים שמבצעים חיפוש לפי תוכן, ויש כאלה שמחפשים לפי תכונות או תיוגים. יש גם מנועים שמחפשים תמונות דומות או שירים שנשמעים כמו קטע שהוזן, דוגמה לשירותים כאלה נמצאת בגוגל ובשירותים נלווים.
עקרון הפעולה: המשתמש כותב שאילתה, מחרוזת מילים שמתארת את מה שהוא מחפש, והמנוע מופעל. המנוע סורק את האינדקס או את הקבצים, מריץ אלגוריתמים לסינון ולדירוג התוצאות, ואז מציג רשימה של תוצאות בסדר רלוונטיות.
נכון ל-2015, מנועי חיפוש לא תמיד מבינים הקשר מורחב. הם עשויים להחסיר מילים נרדפות או להחזיר תוצאות מעורבות אם השאילתה לא מדויקת. טכנולוגיות של רשת סמנטית עשויות לשפר זאת בעתיד.
המנוע הראשון היה "ארצ'י" (1990), למציאת קבצים על שרתי FTP. בשנות ה-90 נולדו גופר, Wandex ו-WebCrawler. WebCrawler (1994) היה הראשון שסרק טקסט מלא באתר. מאז הופיעו מנועים רבים, ולפי נתונים, מאז 2001 גוגל שולט בשוק החיפוש.
מנוע מודרני כולל שלושה חלקים עיקריים: שלב איתור הקבצים (סריקה), בניית אינדקס, ואיחזור התוצאות. יש מנועים שבונים אינדקס אוטומטית בעזרת רובוטים שנקראים "זחלנים" (Crawler), ויש כאלה שבהם האנשים מקטלגים ידנית. בחלק מהמקרים השיטה מעורבת.
האינדקס יכול להיות מפורט מאוד או פשוט. בשלב האיחזור המנוע מציג קישורים, שמות קבצים או קטעי טקסט כמקדמה.
קיימים מנועים כלליים ומנועים מיוחדים שמתמקדים בנושאים כמו בלוגים, תמונות או וידאו. חיפוש יכול להיות משולב בדפדפנים ולקבל תוצאות בלי להיכנס לאתר של המנוע.
מנועי חיפוש מנסים להתאים תוצאות למשתמש לפי היסטוריית החיפוש או עוגיות בדפדפן. משתמשים יכולים להירשם ולסנכרן חיפושים בין מכשירים. בגלל חשש לפרטיות, יש אפשרויות להסרת ההיסטוריה.
דף התוצאות מציג כותרת-קישור ותמצית מהדף. לעיתים מוצגים גם גודל העמוד, כתובת וקישור למטמון, העותק שמור על ידי המנוע. תוצאות ממומנות (פרסומות) והן נפרדות מתוצאות אורגניות.
בעלי אתרים רוצים מיקום גבוה בתוצאות. לכן קיימת תחרות על הדירוג, ונולדת פעילות של חברות קידום אתרים. מנועי החיפוש מנסים לזהות תרגילים לא הוגנים ולעיתים "מענישים" אתרים שעוברים על הכללים.
גמישות לשונית היא היכולת של המנוע להתעלם מהבדלים כמו כתיב מלא/חסר, יחיד/רבים או שגיאות כתיב קלות. לא כל המנועים מצוידים בכך במידה זהה. מנגנונים מסוימים מציעים תיקונים אוטומטיים (כמו "Did you mean").
מנועים מעריכים את חשיבות המילים בשאילתה כדי לקבוע רלוונטיות. שיטה נפוצה למדידה סטטיסטית של חשיבות מילה נקראת tf-idf.
משתמשים מפתחים נאמנות למנועי חיפוש בגלל השירותים הנוספים שהם מציעים, כמו דואר אלקטרוני, אחסון ענן, התראות ויוטיוב. שירותים מסונכרנים מחזקים את הקשר בין המשתמש למנוע.
מנוע-על (meta-search engine) שולח שאילתה למספר מנועים במקביל ומאגד תוצאות. יתרונו הוא טווח רחב יותר של תוצאות. החסרון הוא כמות גדולה של תוצאות לא-רלוונטיות וקושי לאחד דירוגים שונים.
מנועי חיפוש לשולחן העבודה (desktop search) עוזרים למצוא קבצים במחשב האישי. הם סורקים דיסק, יוצרים אינדקס ומאפשרים חיפוש מהיר. קיימות תוכנות חינמיות ומסחריות, שונות ביכולות, מהירות ובטיחות.
בעלי אתרים יכולים לבקש הצמדה (submission) של האתר כדי להירשם מהר יותר לאינדקס. כיום השירות חינמי. אפשר גם לחסום סריקה באמצעות מערכת הרשאות.
יש נוכלים שמבקשים תשלום שנתי עבור רישום למנועי חיפוש. זה ניצול של חוסר ידע, כי מנועי החיפוש לא גובים תשלום עבור רישום.
מנוע חיפוש הוא תוכנה שמוצאת מידע באינטרנט ובקבצים.
הוא עושה זאת על ידי סריקה ובניית רשימה של דפים. רשימה זו נקראת "אינדקס". זחלן (Crawler) הוא רובוט שמסתובב באתרים ואוסף מידע.
כשכותבים מילים בתיבת החיפוש, המנוע מוצא דפים מתאימים ומציג רשימה. כל תוצאה מראה כותרת וקצת טקסט להסביר למה היא קשורה.
דוגמאות: גוגל הוא מנוע חיפוש גדול. יש מנועים שמחפשים תמונות או וידאו.
המנוע הראשון נקרא "ארצ'י" והופיע ב-1990. WebCrawler ב-1994 סרק טקסט מלא. מאז גוגל הפכה לדומיננטית.
המנועים זוכרים חיפושים כדי להתאים תוצאות בעתיד. אפשר למחוק היסטוריה אם רוצים לשמור על הפרטיות.
בעלי אתרים רוצים להופיע בראש התוצאות. יש מי שמנסים להרוויח מזה בצורות לא נכונות, כמו לבקש דמי רישום. זה נוכלות, לא לשלם להם.
תגובות גולשים