超越语言翻译和文本的搜索引擎
在您浏览《超越语言翻译和文本的搜索引擎》资讯前,为了让您的阅读体验更快乐,先给您讲个幽默的段子“有个绅士从印度尼西亚的爪哇回到日本,带了许多爪哇麻雀。
他把这些麻雀送给了一位很喜欢麻雀的贵人。
一天,这位贵人的仆人在洗涤雀笼的时候,不小心放走了一只
麻雀。这仆人知道他的主人查出了此事定会发怒。所以他找了一
只平常的东洋麻雀放在宠子里,充当那只失去的麻雀,不久,这位
贵人就来看麻雀,他看出了这笼子里普通的日本麻雀,就唤他的仆
人,说:“这只普通麻雀怎样会走进这里的?它只是一只普通的日
本麻雀?”
这仆人回答道:“是的,主人,不错,那只是一只普通的日本
麻雀,但因为其余的麻雀都是外来客,我想他们需要一位翻译呢!”
15年前,搜索由扫描文本页面和查找关键词构成。当时,对于普通人来说,网络上有限数量的信息并不是很有用处,而且数据传输的速度就像蜗牛一样慢。 然而,尽管有这些不利的限制条件,网络最终还是成功俘获了我们的想象力。“网上冲浪”时,我们感觉自己就像太空探索者正在发掘广阔的未知领域一样。当时, 科幻小说里的场景就好像在我们眼前生动地展现开来。
时至今日,这一点也并没有改变,每天都有数十亿份的文件被添加到网络上,而且,人们的期望每天都在发生变化。我们希望信息能以所有不同的格式 (视频、图像等)用世界上的各种语言提供,能够按照我们的喜好量身打造,而且,我们还希望能够即时获得这些信息。换句话说,搜索引擎必须不仅能处理快速增 长的信息量,还要能应对用户行为与期望的快速和根本性的改变。
超越文本和语言
在Google,当大家谈论组织整理全世界的信息时,其实并不只是指文本信息——图像和视频中也包含有大量信息。与文本不同的是,技术和机器无 法简单地阅读一幅图像或一个视频,必须深入观察它们,找出像素信息,并把这些像素信息转化成一些有意义的东西。在很长一段时间里,我们都曾认为这是一个无 法实现的“白日梦”,但通过梳理搜索方法和计算机视觉方面的各项技术突破,今天的搜索技术已经可以做到在视觉层次上匹配画面了。
打破语言方面的障碍可以打开为新的信息领域,但不幸的是,让计算机去理解语言,要比教一个人学语言还难。人类是通过结合词汇和语法规则来学习语 言的,但语言是很复杂的,语法规则中总有例外,例外中还会出现更深一层的例外。而且,这种方法的可伸缩性也不是很好。为了实现在每个可能的语言对之间进行 转化,不管是日语到中文,北印度语到韩语,还是乌尔都语到斯瓦西里语,你的电脑都必须掌握大量的例外情况!
所以,我们并没有试图给电脑制定大量的规则,而是选择向翻译引擎内输入成千上万份专业翻译文件,并使用各种统计搜索模型在这些文件中识别各种模式。这些模式帮助我们找到了无数的相互关系,从这些相互关系中,就可以开始做到预测某个特定单词、短语或文件的最佳翻译结果。
你知道吗?如今每个人都拥有独属于自己的Google版本。你的Google不同于我的Google,我们的版本跟邻里朋友的也不一样。这一点是非常符合逻辑的,因为我们都有自己独特的兴趣与喜好。
然而,创建一个定制的搜索引擎并不是件简单的工作,有许多因素会影响到在某一特定时间对你来说最有用的搜索结果。举例来说,Google在 150多个区域市场都实现了本地化,当你站在前门大街搜索烤鸭店时,看到的结果是前门大街上的烤鸭店。听起来很简单吧?但是,随着用户模型越来越精细,工 作的复杂度会呈指数倍增长。
用搜索查询“lords”这个词语来举个例子。这个简单的词有好几个意思——比如上议院、城堡和宝剑,甚至一个非常流行的多人网络游戏。不过, 作为印度板球队球迷的我,通常都是搜索并点击与板球有关的信息。所以,当我在Google上搜索“lords”时,我首先会看到的是关于伦敦最著名的板球 球场——罗兹板球场(Lords Cricket Ground)的信息。
刚才我们给大家介绍了《超越语言翻译和文本的搜索引擎》的资讯,下来给大家讲2个笑话放松一下:
笑话1:找翻译 “法官,我坚决要求离婚,我同我妻子根本没有共同语言。”
“那没关系,你们可以一同去找个翻译嘛。”
1.问:你们是不是骑马上学啊?答:嗯,一出火车站,我爸我妈就骑着马等我呢!从南方回家的时候从北京转车,下了火车到马站,50匹马连在一起往家里开,广播里还说:“检票口检票员同志注意了,开往赤峰方向的特快111次马队准备开跑了,请给马喂饱饲料............
2.问:草原真的好辽阔啊!
答:的确,你就闭着眼踩着油门往前冲吧,5分钟再睁眼没问题.
3.问:你家是养羊的吧?
答:嗯,那是那是,睡觉时我搂一只,我妹搂两只
4.问:你们上网怎么办啊?
答:我们用笔记本,放马背,有太阳能吸收板,手机无线上网。
5.问:你们怎么洗澡啊?
答:跳到河里洗呗,一三五男人洗 二四六女人洗周日休息让微生物净化下。
6.问:你们是不是都住在蒙古包里啊?平时都穿蒙古袍?
答:对啊....我们一个星期去城里一次买东西,到城里才穿便装,平时都穿蒙古袍....
7.问:那你们上学咋办啊?远不?骑马么?
答:骑啊..不骑马学校太远过不去啊...
8.问:那你们把马放哪啊?
答:我们学校有马棚.....还有的直接栓在楼下,下课的时候直接从窗户跳下去,跳到马背上,骑着就走了....
9.问:你们那里牛羊肉是不是不要钱啊?
答:恩.我们家门外遍地都是.想吃就随便在外面抓一只,也不管是谁家的.反正那么多也看不出来.还是新鲜的呢.
10.问:来天津都多长时间啊?
答:我和老爸骑马来的,还带了一群牛羊来.赶了三天三夜才赶到火车站.把牲口往火车上一塞,坐了一天一夜才到.下了火车把牲口一卖,父亲把卖的钱激动的塞给我说:"你的学费有了".
11.问:你们打的吗?
答:打,有钱打个马的,没钱打个骆驼的
12。问我怎么上课,我说:“老师骑着马,拿着粉笔,在这边写一划,骑马走到那边再写一划;老师提问时,我们就把答案绑在箭上,然后射在黑板上!”
13.问我:内蒙是不是有个古大学
回答:有,考古学很出名,专门研究恐龙的。
14.我家3个水龙头左边蒙牛纯牛奶中间自来水右边伊利酸奶,和水费一起收价钱一样~
15.说自己练长跑,小的时候跟着马跑,长大了马就只能跟着我跑了;
16.我们内蒙的马上了马路都会认红绿灯!见到红灯就利马停下,见到绿灯撒丫子猛跑嘿嘿
17.问:听说你们内蒙杀人不犯法是真的么
答:也不能这么说吧我们一年有五个杀人指标 杀人在五个以内(含五个)不判SX
18.问我内蒙的是不是都能喝,我说不啊.我们也不怎么喝酒,问那怎么喝啊,我说没事回家就和我爸我们爷俩喝两碗马奶酒完了再说话,这是规矩. 从来没喝过啤酒,草原上哪有那东西啊,喝白的从来不用杯,那是骂人,全是碗. 喝酒跟喝水似的.
19.问:你们怎么打架?
答:我们都是群殴,就像古代战场,每个人骑着马,挥着大刀,一顿火拼。。。
20.问:真的每个人都有刀吗?
答:有,看谁不顺眼就捅谁,把对方捅死后不收尸,直接被狼叼走。。。
21.问:内蒙解放没有?
答:没有,我们上课的时候都带着枪
22.问:你原来会说汉语~!
答:恩,来的时候在火车上刚学的
23.问:你们住窑洞吗?
答:不,我们住树上
24.问:内蒙是不是在拉萨?
答:恩,内蒙是拉萨的省会。
25.问:你的很多小辫子呢?
答:为了上大学只好剪掉了!
26.问:你们还吃生肉吗?
答:我们老大发明了燧木取火,我们吃烧烤
27.你是内蒙人啊?"
"是啊。"
"那太好了,下次我去拉萨旅游,就住你家了啊。"
"……没问题,不过我家离拉萨稍有点远。"
"那你们怎么来上学?"
"骑驴到北京后坐飞机。"
"那一定很久才到吧?
"习惯了,提前半年出发就行!"
"………………!
”怎么不骑马呢?
"在内蒙,骑马的都是穷人干的事情,像我们考出来的,都是骑骆驼和驴的。然后内蒙没有高考,考试都是比赛射箭,一公里以外摆个牌子,写上"清华"旁边放一个"北大"然后一个人有三次机会,我第一次射清华,第二射北大,都失败了,最后为了保险,射了最近的一块牌子,就是这个学校……
马云从翻译公司经理到互联网霸主 (2010-9-25 17:3:23)
新香的翻译 (2010-9-25 15:12:47)
动物翻译和礼仪翻译 (2010-9-25 15:11:25)
最后一个苏格兰国王的翻译 (2010-9-25 14:53:40)
婚姻的长久诀窍翻译和美国十大怪翻译 (2010-9-25 14:35:43)
轻诺必寡信-谚语翻译 (2010-9-25 14:25:22)
简单的快乐和至理名言的翻译 (2010-9-25 14:17:25)
教师节祝福语句的翻译 (2010-9-25 14:8:39)
教师节祝福语句的翻译 (2010-9-25 14:8:39)
名人名言的经典翻译 (2010-9-25 13:56:12)
毕业双语翻译和自助餐人生翻译 (2010-9-25 13:42:49)
天主教翻译蕾莎修女 (2010-9-25 13:23:26)
Kang Jin Young品牌如何兴起 (2010-9-25 11:43:59)
《韩国电影史》的翻译 (2010-9-25 11:9:38)
意大利警察使用中学生做兼职翻译,华人容易因翻译错误受亏损 (2010-9-24 17:32:28)