3月29日,部分网友发现谷歌将旗下翻译软件的接口由海外转回国内,从而恢复了谷歌翻译app对大陆用户的支持。这是在2010年退出中国后,谷歌为数不多的几次向中文用户示好的行为之一,其背后目的可能是截留用户使用数据,获取一手的中文语料信息。不过,由于中美文化存在较大差异,而谷歌在中文信息处理方面尚存不足,谷歌翻译想要挑战中国市场还面临很多困难。
此前,国内用户只能通过网页版使用谷歌翻译,导致这一状况的原因是网页版谷歌翻译的服务器在国内,app的服务器在海外,而此番更新将app的服务器接口.com重新定向到国内的.cn。其实解决域名的路径障碍没什么技术含量,就是修改了几行代码,只要谷歌想更新随时都能解决这一问题。如此看来,解决国内用户的需求并非此次更新的第一要义,获取中文语料数据可能才是谷歌的真正目的。
正所谓山中方七日,世上已千年。谷歌主动放弃中国市场的几年,错失了一段宝贵的数据积累期。而中文与英文又处在完全不同的语言体系,就像 Google 官方说的,英汉互译是一种“非常困难的语言对”。这就谷歌迫切需要找到入口采集中文数据,此时仍在向大陆提供部分服务的谷歌翻译就成了最合适的选择。
虽然谷歌如意算盘打得响,但是谷歌翻译app能否担起重任还是个未知数。特别是在中文语义庞杂、方言俚语众多、网络热词频出的情况下,谷歌翻译app分外水土不服。例如,北京话“麻溜儿的”本意是催促他人动作快点,却被谷歌译为毒品Hemp(大麻);流行语“关闭朋友圈”,谷歌译成了Close a circle of friends(关闭一圈朋友);而谷歌翻译对网络热词“逃离北上广”的理解更是驴唇不对马嘴:Escape from the north wide(从北面宽处逃跑)。看来中国文化无论雅俗,对谷歌都是盲区。
不仅如此,就连谷歌翻译此前推出的黑科技“相机实时翻译”功能也被批评是华而不实。
举最常见的例子,当识别翻译如下提示语时,谷歌翻译不能完全抓取图上的文字,译后结果更看的人一头雾水。很明显这是技术层面的漏洞,如果“抓词”都做不好,何谈翻译的准确性?
左上图为原标语:易碎、向上、怕湿,小心轻放、勿压勿摔;左下图为谷歌识别后的标语,只识别出了“小心轻放、勿压勿摔”;右图为谷歌中译英结果,基本乱码。
英译中也存在相似的问题。左上图原标语的意思是:警告、私家路、不准侵入;左下图为谷歌识别后的标语,只识别出了“警告、私家路”;右图为谷歌英译中结果:“警告私人道路没有TRESPASSING”,其中最核心的词汇没有翻译出来。
饱受争议的用户体验正在让谷歌翻译app在华处境变得进退维谷,高调回归吸引用户眼球、进而获取中文语料数据的目的恐怕难以达到。特别是app内诸多功能的趣味性远大于实用性,显得噱头有余而真诚不足,这引发国内用户在社交媒体的吐槽:“原来外来的和尚并不会念经”、“逐词直译真是不如不译”。
糟糕的开局之后,国内用户大概没有耐心为谷歌翻译app贡献宝贵“数据”,等它升级。并且随着语音输入成为一大趋势,如何准确识别中国各地的方言俚语使谷歌面临更为严峻的技术挑战,而这也是中国公司相对擅长的部分,谷歌很难从中分走一杯羹。或许,只有当谷歌学会真正站在中国用户的角度去设计产品,而非想着在用户身上索取什么,才有机会去找回失去的那几年。