Google 即將更新翻譯系統,挑戰 Skype?
世界上有6000多種語言,科技巨頭們正試圖用新技術彌合人們之間的交流障礙。但是,機器翻譯的體驗真的很可怕。
上個月,微軟的Skype推出了“實時翻譯”功能。當英語和西班牙語用戶交流時,Skype會自動翻譯并通過語音廣播。
如今,類似的功能已經成為谷歌將要攻擊的城市:移動應用Google Translate將支持的語言數量增加90種,同時將支持“語音翻譯”——對個別語言用語音輸入A語言,應用將文本翻譯成B語言。
當然,這種翻譯效果并不如你所愿。即使是純文本版本的谷歌翻譯也經常伴隨著語法和詞序上的錯誤。Skype的實時翻譯也是如此。從宣傳片的使用演示來看,這個功能應該是和耳機配套的,整個過程似乎就是兩個運營商在用對講機。
包括谷歌翻譯的機器翻譯,局限性在于機器算法和語言文學性的差異。機器翻譯不能提供準確的翻譯。翻譯單詞往往忽略語境和語境,不遵循語法。機器翻譯還處于“詞典”階段。
機器翻譯算法以統計分析為基礎,注重翻譯效率而非準確性,但語言本身具有“人文性”,包括語法、語義和情感,這些都是算法無法翻譯的。
然而,人們仍然迫切需要翻譯的應用。谷歌翻譯的下載量已經超過1億,月活躍用戶達到5億。機器翻譯背后是一個巨大的市場。包括臉書和微軟在內的巨頭都在致力于翻譯機器項目。
可以預見,未來機器翻譯的準確率會有很大的提升,這就需要依靠龐大的數據庫,讓機器不斷學習,讓機器更好地理解人。
形式上,未來的翻譯會更加智能化,比如即時翻譯,類似于現在的人工同聲傳譯。雖然Skype的實時翻譯效率有待提高,但它提供了一個美好的前景。機器翻譯的最終任務是消除語言差異。
用數據和算法進行翻譯,可以使翻譯系統隨著數據的積累不斷學習和提高,但這里又出現了一個新的問題。如果數據庫積累了用戶的語言內容和習慣,必然會涉及隱私。
語言研究機構Hyperv<愛尬聊_百科詞條>oice Consortium表示,只有1%的用戶愿意貢獻自己的使用數據來幫助翻譯機器學習。大多數用戶希望翻譯機像Siri一樣,關閉數據,只為自己服務。
