חיפוש בגוגל לעומת צ'אטבוטים של בינה מלאכותית: כמה נקודות השוואה מבחינה מידענית

176

ההתפתחות המהירה של בינה מלאכותית יצרה מגוון כלים חדשים לחיפוש מידע, כאשר שני השחקנים המרכזיים הם מנוע החיפוש של גוגל וצ'אטבוטים כמו ChatGPT , כל אחד מהם מציע יתרונות ייחודיים.

חיפוש בגוגל
יתרון משמעותי מבחינת יכולת האיסוף וסריקת האתרים
מגוון רחב  יותר של מידע: גוגל סורק את האינטרנט כולו ומציע תוצאות רבות ומגוונות, כולל דפי אינטרנט, תמונות, סרטונים ועוד. זחלני גוגל (Crawlers) הם תוכנות אוטומטיות המטיילות ברחבי האינטרנט, בדומה לעכבישים ברשת. תפקידם העיקרי הוא לאתר דפי אינטרנט חדשים, לעדכן מידע קיים ולכלול אותו במאגר המידע העצום של גוגל.
למה זה חשוב?
עדכון מתמיד: בזכות הזחלנים(Crawler),  גוגל תמיד מעודכן במידע החדש ביותר באינטרנט.
רלוונטיות: הזחלנים (Crawler),  מסייעים לגוגל להציג תוצאות חיפוש רלוונטיות לשאילתות המשתמשים.
גילוי אתרים חדשים: זחלני גוגל מאפשרים לגלות אתרים חדשים ולהוסיפם למאגר המידע.


 למידע נוסף אודות זחלני הרשת
צוותי הפיתוח של גוגל כבר עובדים מעל 25 שנים בפיתוח ושכלול זחלני רשת (Crawler) ומדובר על אלפי מתכנתים !!
הזחלן (Crawler), אשר ידוע בשלל שמות נוספים כגון רובוט סריקה, בוט, סורק ועכביש רשת, הוא תוכנה המבצעת סריקה של רשת האינטרנט באופן אוטומטי.
הזחלנים של גוגל  (Crawler ) סורקים אינספור עמודים שונים מדי יום: הם נכנסים אל אתר אינטרנט, בודקים הם חלו בהם שינויים לעומת הסריקה הקודמת ומעדכנים באינדקס של גוגל את השינויים שהתבצעו, כגון קישורים או עמודי תוכן חדשים שהתווספו. הזחלנים סורקים את כל חלקי האתר,
הזחלן מתחיל את פעולתו ברשימת אתרים אותם עליו לבקר, אתרים אלו נקראים בשם "זרעים" (seeds), כאשר הזחלן מבקר באתרים אלו הוא מזהה את הקישורים שיש בדף אינטרנט מסוים ומצרף אותם לרשימת האתרים שבהם עליו לבקר. הכמות הרבה של האתרים בהם הזחלן מבקר מחייבת את התוכנה לדעת לסדר את האתרים בסדר עדיפויות.
האלגוריתם של גוגל לוקח בחשבון את המידע המעודכן שנקצר באמצעות  הזחלן (Crawler) כדי שכאשר גולש יכתוב שאילתת בשורת החיפוש – תוצגנה בפניו התוצאות הרלוונטיות והעדכניות ביותר.
 
 כלים לחידוד החיפוש במנוע החיפוש של גוגל
כלי חיפוש מתקדמים: גוגל מציע מגוון כלים לחידוד החיפוש, כמו מסננים, אופרטורים בוליאניים, וחיפוש מתקדם.
 
אודות גרסת מנוע החיפוש המורכב  והמתקדם של גוגל
כשאנו מדברים על חיפוש מורכב בגוגל , הכוונה היא לאותו מנגנון של חיפוש טבלאי המאפשר לנו להציב בו-זמנית  כמה וכמה מאפיינים בחיפוש במנוע החיפוש של גוגל.
המנגנון הטבלאי של גוגל , שהוסר מהדף החיפוש הרגיל שלהם ( מוסתר היטב)  מקל עלינו מאד ביצירת שאילתת חיפוש מורכבת , כלומר בקשת חיפוש שיש בה כמה וכמה מאפיינים שונים ,
להמשך המאמר
 
דירוג האתר על בסיס "סמכות אתר"
תוכנות מנוע החיפוש של גוגל מבוססות אלגוריתמים אשר מחלקות את אתרי האינטרנט והדפים  לפי דירוג, כאשר הדפים בעלי "הדירוג" (אשר נקבע לפי האלגוריתם) הגבוה יותר מאותרים מיידית וסימולטנית על ידי התוכנה.
למרות הכחשותיה של גוגל בעבר, מתברר כי היא כן מחשבת מדד פנימי הקרוי "SiteAuthority" המשקף את סמכותו וחשיבותו של אתר בהקשר לנושא מסוים. גילוי זה מדגיש את הצורך של בעלי אתרים להשקיע בבניית מוניטין ואמינות לאתר שלהם כדי לזכות בדירוג גבוה יותר.
מקור      
 
חסרונות-מנוע החיפוש של גוגל :
דורש מיומנות: כדי למצוא את המידע הרצוי, לעתים נדרשת ניסוח מדויק של השאילתה והבנה בסיסית של כללי החיפוש.
תוצאות רבות מדי: לעיתים קרובות, גוגל מציג מספר גדול של תוצאות, מה שעלול להקשות על מציאת התשובה המדויקת.
 
צ'אטבוטים של בינה מלאכותית
יתרונות:
שיחה טבעית: צ'אטבוטים מאפשרים שיחה טבעית עם המחשב, בדומה לשיחה עם אדם.
מספקים תשובות מנוסחות ומותאמות אישית
תשובות ישירות: הצ'אטבוט מספק תשובה ישירה לשאלה, ללא צורך בחיפוש ידני.
למידה מתמדת: צ'אטבוטים לומדים ומשתפרים עם הזמן, ומספקים תשובות מדויקות יותר ככל שהם נחשפים ליותר שאלות.
 
חסרונות:
מידע מוגבל: צ'אטבוטים מבוססים על בסיס הנתונים שלהם, ולכן יכולים לספק מידע מוגבל יותר מגוגל.
סיכון להטיה: צ'אטבוטים עלולים להיות מושפעים מהטיות בנתונים שעליהם הם מאומנים.
חוסר יכולת להבין הקשר: צ'אטבוטים עשויים להתקשות להבין שאלות מורכבות או הקשר רחב יותר.
לא תמיד מספקים מקורות לתשובותיהם !!

היחסרון המשותף גם לצ'אטבוטים של בינה מלאכותית וגם למנוע החיפוש של גוגל הוא ייצוג מאד שולי של הידע שמצטבר ברשתות חברתיות ( פייסבוק טוויטר , אינסטגרם)


 ראו גם :

האם ChatGPT תהיה Google החדשה? העתיד של חיפוש ואחזור מידע

פורסם בתאריך 13 בספטמבר 2024 מאת information-world (ד"ר יפה אהרוני)

· · · ·

כתוב תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *