|
把握大数据 看看这些大数据应用案例大数据不是什么完全的新生事物,Google的搜索服务就是一个典型的大数据运用,根据客户的需求,实时从全球海量的数字资产中快速找出最可能的答案,呈现给你,就是一个典型的大数据服务。 他笑了。听众对他的每一句话都报以掌声。有些人甚至流下了眼泪。这种看上去似乎过于热情的反应是可以理解的:拉希德的翻译太不容易了。每句话都被理解,并被翻译得天衣无缝。令人印象最深的一点在于,这位翻译并非人类。 这就是自然语言的机器翻译,也是长期以来人工智能研究的一个重要体现。人工智能从过去到未来都有清晰而巨大的商业前景,是以前IT业的热点,其热度一点不亚于现在的“互联网”和“大数据”。但是,人类过去在推进人工智能的研究遇到了巨大的障碍,最后几乎绝望。 当时人工智能就是模拟人的智能思考方式来构筑机器智能。以机器翻译来说,语言学家和语言专家必须不辞劳苦地编撰大型词典和与语法、句法、语义学有关的规则,数十万词汇构成词库,语法规则高达数万条,考虑各种情景、各种语境,模拟人类翻译,计算机专家再构建复杂的程序。最后发现人类语言实在是太复杂了,穷举式的做法根本达不到最基本的翻译质量。这条道路最后的结果是,1960年代后人工智能的技术研发停滞不前数年后,科学家痛苦地发现以“模拟人脑”、“重建人脑”的方式来定义人工智能走入一条死胡同,这导致后来几乎所有的人工智能项目都进入了冷宫。 这里讲个小插曲。我读大学的时候,有个老师是国内人工智能的顶级教授,还是国内某个人工智能研究会的副会长。他评述当时的人工智能,不是人工智能,而是人工愚蠢,把人类简单的行为分解、分解再分解,再去笨拙地模拟,不是人怎么聪明怎么学,而是模拟学习最蠢的人的最简单的动作。他说,对于当时人工智能的进步,有些人沾沾自喜,说好像登月计划中人类离月亮更进一步了,其实,就是站上了一块石头对着月亮抒情,啊,我离你更近了。他对自己事业的自我嘲讽,让我至今记忆非常深刻。 后来有人就想,机器为什么要向人学习逻辑呢,又难学又学不好,机器本身最强大的是计算能力和数据处理能力,为什么不扬长避短、另走一条道路呢?这条道路就是IBM“深蓝”走过的道路。1997年5月11日,国际象棋大师卡斯帕罗夫在和IBM公司开发的计算机“深蓝”进行对弈时宣布失败,计算机“深蓝”因此赢得了这场意义深远的“人机对抗”。 “深蓝”不是靠逻辑、不靠所谓的人工智能取胜的,就是靠超强的计算能力取胜:思考不过你,但是算死你。 类似的逻辑在后续也用到了机器翻译上。谷歌、微软和IBM都走上了这条道路。就是主要采用匹配法,同时结合机器学习,依赖于海量的数据及其相关相关统计信息,不管语法和规则,将原文与互联网上的翻译数据对比,找到最相近、引用最频繁的翻译结果做为输出。也就是利用大数据以及机器学习技术来实现机器翻译。现有的数据量越是庞大,那么这个系统就能越好地运行,这也正是为何新的机器翻译只有在互联网出现以后才有可能重新取得突破性进展的原因所在。 因此,目前这些公司机器翻译团队中,有不少计算机科学家,但却连一个纯粹的语言学家也没有,只要擅长数学和统计学,然后又会编程,那就可以了。 总而言之,利用这种技术,计算机教会自己从大数据中建立模式。有了足够大的信息量,你就能让机器学会做看上去有智能的事情,别管是导航、理解话语、翻译语言,还是识别人脸,或者模拟人类对话。英国剑桥微软研究院的克里斯·毕肖普(Chris Bishop)打了个比方:“你堆积足够多的砖块,然后退上几步,就能看到一座房子。” 这里我们假设这种技术能够持续进步,未来基于大数据和机器学习基础上的人工智能达到比较流畅地模拟人类对话,就是人类可以和机器进行比较自如的对话。事实上,IBM的“沃森”计划就是这样科技工程,比如试图让计算机当医生,能够对大部分病进行诊断,并和病人进行沟通。另外,也假设目前刚刚兴起的穿戴式计算设备取得巨大的进展。这种进展到什么程度呢?就是你家的宠物小狗身上也装上了各种传感器和穿戴式设备,比如有图像采集,有声音采集,有嗅觉采集,有对小狗的健康进行监控的小型医疗设备,甚至还有电子药丸在小狗的胃中进行消化情况监控。小狗当然也联上网,也一样产生了巨大的数据量。这时,我们假设基于这些大数据建模,能够模拟小狗的喜怒哀乐,然后还能够通过拟人化的处理进行语音表达,换句话说,就是模拟小狗说人话,比如主人回家时,小狗摇尾巴,旺旺叫,那么这个附着于小狗身上的人工智能系统就会说,“主人,真高兴看到你回家”。不仅如此,你还可以和小狗的人工智能系统进行对话,因为这个人工智能系统能基本理解你的意思,又能够代替小狗拟人化表达。以下我们模拟一下可能的对话: 你:“小狗,今天过得好?” 小狗:“不错啊,主人你今天换的新狗粮味道很好,总觉得没有吃够。” 你:“那很好。我们以后继续买这种狗粮。对了,今天有什么人来吗?” 小狗:“只有邮递员来投递报纸。另外,邻居家的小狗玛丽也来串门,我们一起玩了一下午。” 责编:王雅京 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。 |
热门博文 |
|