נפגשתי היום עם מדען המחשבים ד"ר מורגן טומס , העוסק ביישום של תוכנת Google Translate בפרוייקטים באינטרנט , וממנו למדתי על השיפורים בתוכנת התרגום של גוגל .
בעשור הראשון לפעילותה התבססה תוכנת התרגום Google Translate על פעולה בטכנולוגיית תרגום מכונה סטטיסטי. כאשר נשלחת בקשת תרגום, המערכת סורקת מיליוני תרגומים אפשריים, ובוחרת מהם את התרגום הסביר ביותר מבחינה סטטיסטית. זאת בניגוד לגישה המסורתית בחקר התרגום והשפה, של ניתוח על בסיס חוקים לשוניים.
אלגוריתם חדש בשם Neural Machine Translation –NMT
החל מ2016 עברה מערכת הפיתוח של גוגל לשימוש בבינה מלאכותית ולמידה עמוקה.
המשמעות היא שמעתה התרגום לעברית באמצעות שירות Google Translate מתבצע באמצעות אלגוריתמים המבוססים על שימוש במילים מבוסס הקשר באופן טבעי , אלגוריתם שנקרא Neural Translation.
התוכנה של גוגל משתמשת במערכות שמדמות את מערכת העצבים כדי להתייחס למשפטים שלמים ולתרגם אותם לפי הקשרים רלוונטיים, במקום לתרגם רק מילים בודדות. התוצאה היא טקסטים קריאים וטבעיים גם בלשון מדוברת. התרגומים נעשו יותר מדויקים .
לצורך כך הקימה גוגל מאגר של עשרות מיליוני מסמכים בשפות שונות , כאשר אתם מריצים בקשת תרגום של קטע מסויים נערך חיפוש מבוסס הקשר בכל אחד מאגרי מסמכים אלו לצד בדיקת אפשרויית התרגום של כל מילה. המערכת בודקת בו זמנית את ההקשר הלשוני מול מאגר המסמכים לצד התרגום.
האלגוריתם החדש פעיל כבר בשמונה שפות קיימות, ויחד עם התמיכה בעברית וערבית יפעל עתה השירות גם בשפות הינדית, ויטנאמית ורוסית.
Google Translate – ללא חיבור לאינטרנט
בחודשים האחרונים החלו לקדם בגוגל את האפשרות להתקין אצלכם במחשב הנייד גם גרסה לא מקוונת של תוכנת התרגום. עבור כל שפה יידרש שטח איחסון של 35-40 מ"ב. כך שאם אתם נוסעים , לדוגמא , לויטנאם לצורך עבודה תוכל להתקין אצלכם את מסד הנתונים של השפה הויטנאנמית , האנגלית וגם העברית ואז תוכלו לתרגם גם במקומות שאין בהם חיבור לאינטרנט כי שם אתם צריכים לתקשר עם גורמים מקומיים.
גרסת האנדרואיד
גרסת האנדרואיד, כוללת כעת גוגל טרנסלייט תכונה בשם Tap to Translate ("לחץ לתרגום"), המתרגמת כל מילה או משפט המסומן בכל אפליקציה במכשיר – ולא רק בתוך אפליקציית התרגום עצמה. פשוט מסמנים את הטקסט, ולוחצים על אייקון התרגום המופיע בצדו העליון של המסך.