Google翻譯與人工智慧再進化　步步逼近人類口譯水準

2017/05/06 01:08

記者葉立斌／台北報導

Google有一項許多人使用的服務「Google翻譯」在十年前推出，如果你和我一樣，從Google翻譯剛推出時便已使用，或許記得初期的英翻中語意相當生硬、破碎，因此常有網友惡搞Google翻譯。但現在你一定察覺不一樣了，無論是翻譯內容或功能都更像人翻的，這全仰賴人工智慧的進步。

由於全球有超過50%的網頁為英文網頁,而全球只有約20%的人口使用英語，因此Google 翻譯服務有多達 95%的流量來自於美國以外的地區。現在更整合Gmail等多種應用程式，且使用者僅需在 Google 搜尋列鍵入或用語音聲控輸入想要翻譯的內容，例如「OK Google，將「狗」翻譯成法文」便可執行翻譯。所以翻譯內容的再進化是有必要的。

Google翻譯的過去

十年前Google推出翻譯服務，並以片語式機器翻譯Phrase-Based Machine Translation、PBMT作為主要運算方式，運作方式是將句子切割成單獨的字和詞組做獨立翻譯。從過去僅支援幾種語言，到現在可支援103種語言且每天翻譯超過1400億個單詞。另外，Google 翻譯產品經理 Julie Cattiau表示，台灣是成長最快的市場，Android 版年成長2倍，iOS版年成長60%。

Google翻譯的轉變契機

而從數年前，Google 採用遞歸神經網絡（Recurrent Neural Networks、NMT）將句子視為一個單位進行翻譯，取代過去的PBMT。NMT僅需要較少的系統架構設計，也就是較簡略。

為改善 NMT的翻譯品質,研究人員提出許多技術來解決。這當中包括透過模擬調校模型（external alignment model）處理罕見字詞、使用「注意」（attention）來對準輸入詞和輸出詞以及將詞拆解成更小的單元以應對罕見字詞等。從此之後，翻譯系統不再是片段式的翻譯，而是一次翻譯整個句子，所以語意更加流暢，且接近母語使用者說法。藉由具備多層「神經元」（neurons）的「深度神經網絡」（deep neural network)，讓系統學習識別句子中的模式和結構，最後翻譯出語法更趨近日常談話、更順暢且易於閱讀的結果。

目前此系統已導入共 41 組語言組合，包括英／中、英／泰、英／日，英／韓，英／俄羅斯等對譯。

Google翻譯的一大進展：即時鏡頭翻譯

另一種神經網絡應用的重點是大家常用的「即時鏡頭翻譯」（Word Lens）。Google 翻譯應用程式必須從鏡頭拍攝的圖片中找出目標文字，透過深度學習技術來辨識出每個文字，系統將在我們的字典中尋找並轉換出翻譯結果。

不過和人類一樣是需要訓練的，若訓練時僅以「乾淨」的字母作為範本，恐怕不適用。因為在現實世界中的字母可能會反射、有污垢、髒污以及因為各種因素受為了提供足夠的例子作為訓練素材，Google 翻譯用「假」字母來模擬各式反光、點來模仿現實生活中圖片呈現的情境，以訓練機器的演算法，並達到有效且密集的神經網絡訓練。