说三道四技术文摘-感悟人生的经典句子
说三道四 > 文档快照

中国工程院院士李德毅:大数据时代的认知计算

HTML文档下载 WORD文档下载 PDF文档下载
中国工程院院士李德毅在MDCC 2013大会上发表了题为《大数据时代的认知计算》的演讲。他分析了认知究竟可不可以计算,他认为以人为本的认知物联网的时代已经到来了,大数据时代的认知计算正在逼近认知科学。

MDCC 2013移动开发者大会于2013年11月13-14日在北京国家会议中心隆重召开,本届大会由CSDN和创新工场联合主办。逾百位国内外移动互联网领域的领军人物与核心技术专家,以“全民移动,重塑世界”为主题,分享最新实践经验,探讨移动互联网发展趋势。此外,智能硬件、移动娱乐游戏、微APP三大主题峰会成为本次大会新亮点。

中国工程院院士李德毅发表了题为《大数据时代的认知计算》的演讲。他分析了认知究竟可不可以计算,并阐述了大数据时代、移动时代,认知计算应该何去何从。他认为以人为本的认知物联网的时代已经到来了,大数据时代的认知计算正在逼近认知科学。


以下为演讲实录:

李德毅:各位同行大家好。移动生活、移动品质,给我们带来的变化很大。这一年社会上的人,拿个手机,有说有笑有拍照,这就是给我们带来的变化。

人活着就要动,移动的速度是多少,把移动速度搞清楚,移动产品才搞得清楚。我们靠两条腿动,靠轮子动,靠高铁动,靠飞机动,主要还是低速移动,所以我们叫移动,不叫运动。但是背个笔记本是个负担,所以我就想一想,大数据时代对我们移动生活带来了什么变化,也就是大数据时代人的认知,认知最简单的是说话、听、看、写。

认知可不可以计算?

这是一个很古老的命题。因为老科学家认为人是世界上最高级的精品,比其他东西都强,认知是不可计算的。

我们希望提高人的生活品质,我们希望智慧。说把智慧城市变成智能城市,智能是个技术,我们要的是智慧。我们说你这个良心大大的坏了或者我心情不好学不进去,说明这个认知和心态有关系。但是作为人工智能的科学,作为认知科学来说,我们长期以来强调的是智商,脑智,依据现有知识进行分析、联想、推导或归纳,产生新知。我们认为人的认知主要靠大脑。

后来说不对,你这个人智商很高,情商太低不行。面试的时候老板要通过意象、直觉、想象、情感等进行直观、综合的思考,在创新中起着至关重要的作用。这就是二元。更多的人说成功等于40%的智商和60%情商的相互作用。所以认知科学到现在还有很多没有解读的地方。

1936年,天才科学家图灵建立了图灵机概念,任何形式系统可以通过图灵机准确刻画。

老百姓通常把计算工作交给电脑,它是基于人脑的智能吗?IBM研究了一个生产计算机。人们把人的思维能力放到机器里去,前台是机器,后台是人。从这个意义上,认知应该是可以计算的。

我们的程序问题、停机问题、程序验证问题本质上是不可以计算的。所以我们打了补丁还有漏洞。

数学自身是机器程序不可穷尽的。并不是所有的数学问题都可以用计算机来做的。所以人脑不能被物化变成电脑,重要是人脑能不能被形式化。好多诺贝尔获得者都在这个方面获得了重大贡献。但计算性是不依赖于形式系统的选择的。

因此,IT工作者千万不能用行政化的方法来研究思维和意识。意识怎么理解?灵魂怎么理解?宗教怎么理解?信仰怎么理解?它们和思维是什么关系?脑里面有分工,这块干什么,那块干什么,后来研究的成果发现,人的意识和精神活动,是由大脑不同区域共同作用产生的。怎么样才能共同作用,这个问号到现在还很大。

生命科学家喜欢物理,喜欢化学,难道人的思维是由物质和化学规律支配的吗?这个令人怀疑。

有人认为,人是不可能自己把自己搞清楚的。你要研究一个东西,要站在一个东西之外。

大数据时代的挑战

在这样的情况之下,自然杂志登出了一篇重要文章,里面一个小标题——BD(大数据)时代的科学,我们应该怎么做,这是我们时代的挑战。

大数据的来源分为三大块:

  • 第一块是地球,我们叫数字地球,自然大数据把我们的地球、宇宙搞清楚。
  • 第二是生命,包括各种动物,尤其包括我们人类,这本身也是大数据。
  • 第三就是社交,互联网,尤其是移动互联网,我们的日常生活都是大数据,这样的大数据使你对科学,认知科学提供了挑战。

我们去看病,现在不是看医生,医生很宝贵,主要是看仪表。到了医院还没坐三分钟,医生一大堆化验单出来,让做X光、B超、内镜检查、核磁,你还得排队,排了两个星期,才把这些检查做了。你拿着化验结果去找医生,医生不到三分钟把药开出来,现在看病不是看医生,现在就是查,诊查的治疗。医生跟你说一句话,你还没听懂就接待下一个病人,这就是我们日常看病,花钱看仪器,这就是大数据带来的现实。

这些年来,医学诺贝尔奖很多颁给了医学企业的发明,所以现在的高明医生,要么是器械的发明,要么他们能从医疗数据发现价值。你排队5分钟,医生一看没问题,他从这个数据里发现了价值。大数据时代你会发现,你只要知道了是什么,就知道怎么做。

这样问题就淡化了,为什么不仔细诊断了,因为这么多病案,你这个情况在他的病人库里非常清楚,所以怎么做很简单。

我们认为科学是解决的形而上,技术解决的是形而下,我们研究的对象是认知、智慧。现在把我们的对象是什么的问题,可以用大数据来解决,在这样的情况下,对大数据对不同案例对象的处理,也可以用大数据来解决。因此这个社会更多研究的是关联,把科学放在后面。科学解决因果问题,要解决主次问题,解决前后问题。所以人们能更多的解决问题就是好汉。

我们对曾经认为的科学是技术的先导产生了怀疑。在当今情况下,因为IT技术的发展,技术也可以成为科学的先导,要求认知自学的数字化,这是我们大数据对认知科学的认识,以及认知计算的不同。认知计算是技术。

这样的情况下,大数据时代对计算正在告别认知科学。

对人的认知而言,欧盟在上世纪就进行了脑科学的研究。今年澳门又提出了人类大脑计划的,奥巴马也发动了脑计划。这和我们信息工作者关联得太少,全是生命科学家,我觉得我们人类的大脑,从生命科学的角度来讲,大家和猴子的大脑区别不是太大,因为已经有研究表明,脑结构差不多。

我就在想,我是在英国学习的,撒切尔后来得了老年痴呆症,我个人认为她的老年痴呆和一般人的老年痴呆没有多大的区别。因为我认为脑计划的研究有一点偏了。

人类和其他动物相比,都有灵感,有语言,唯独人有文字,因为有文字,才有文明,才有传承。我们的青年人到大学,都要学习知识,学习文明,这个很重要。如果没有文字,我们和其他动物差不多。

另外还要研究人类认知的社会属性,这两个不清楚,认知科学搞不清楚,我建议要把这两点作为人类认知的切入点。

要研究脑认知的后天属性,认知不仅是前面的天性所决定的,DNA、基因、遗传,还要看后天学习和积累的结果,是与社会环境、社会实践,群体交互相关联的。

在移动生活时代,我们怎么办呢?

大数据时代自然语言处理技术正在改变我们的移动生活。

语言是思想的直接现实,这句话是马克思讲的,语言是人类思维的载体,语言是认知科学和认知计算要应对的首要问题。我们的移动生活首先要讲语言,你哪一天不说话不行,能听会说是我们必须具备的能力。让我们迎接语音时代的到来。人类走向文明的四个重大里程碑中,语言和文字占了重要的地位。

人类运用自然语言进行交流获得的效果。你跟人家沟通得到的效果当中,很重要的就是你的强度和语调,要占38%,还有你的面部表情,它有情感在里面。从我们认知科学来说,半个世纪的自然语言理解的研究中,我们对此关注了多少?

人们在思考和解决任何问题时,通常是定性的,对量的规定性往往是是非数值。我们研究大数据,它有一个定性,定量转换的问题。科学研究当中,人们用对象语言表达一个特定的精确学科,比如物理数学、C语言,都是用自然语言来表达。

我们就变成两个学派的争论,脑科学认为自然语言是不可计算的。

如果一个问题不能全部形式化,那么其中的局部问题可不可以形式化?自然语言可以在什么程度上被形式化,取决于能否把不确定性形式化。研究不确定性,我认为是一条道路。

科大讯飞做了一个客服中心,移动客服录音大数据,可实现一秒钟对100万小时音频数据的检查。这就是一个很大的变化。你是雇佣500位客服人员还是启用一台服务器?所以还是用一台服务器。在半个世纪的自然语言理解的研究中,我们对此关注了多少?

我们看报纸,有这么一段文章,但是你仔细看的时候,发现这个字序不对,但是它又能影响我们多少东西?在半个世纪的自然语言理解的研究中,我们对此关注了多少?

再看一个例子,我们网上动不动要区分对方是人,我们经常出来一个识别码,叫你再输入一遍识别码,证明你是人。在半个世纪的语言文本理解的研究中,我们对此又研究了多少?

我觉得要创新,要新思维才能解决。机器人能听会说,能看会想,正在改变我们的生活,这就是移动生活的产品。

有一个产品你们可以做做,叫在线服务机器人。将来IT行业里面,随着智能技术的发展,移动客服中心可以裁减到50人。我们能不能有个智能耳机,这是我个人想的,你戴着耳机,我说话,我的口音比较重,你的耳机听到的是普通话,你能不能做这个?这个很好,特别是广东话北方人听不懂,尤其是语言翻译。假如两国元首会谈,奥巴马的话是普通话,但是是奥巴马的语音。这是一个多大的改变。实际上现在已经有了,这时候就需要云计算,需要一个方案服务中心,需要一个中文翻译服务中心,位置服务中心等等。

语音到文字,文字到文字,我们要让数据说话,这就是大数据给我们移动生活带来的变化。所以有人说先干掉短信。

我这个年龄对五笔字型输入是情有独钟,我们有两代人都是用五笔字型输入。从搜索引擎到个性化搜索,从规则学习到统计学习,从智能计算到情感计算,从形式语言学到智能翻译。

我们想象将来电视台主持人他拿到就能念,这个虚拟主持人在形象、情感、动作、语音、语调、风格都像某一个人多好,那我们演员也可以失业了。这样的时代也许会到来。

以大数据形态反映的语言,是可交互和理解的、是带毛的、鲜活的、有情感的原生态语言。

智能驾驶

下面讲讲和我们移动生活相关的智能驾驶,智能驾驶为什么火起来呢?因为它跟云计算,移动互联网,大数据密切相关,你只要做了这个东西,政府肯定会支持你。因为是战略性新兴产业。当初自然科学基金会在确定这个项目的时候,提出了科学的任务,解决实际的计算问题。后来把这个科学问题明确地用一个载体来表现,叫做科学任务,在正常的情况下北京开到天津,你能不能做得到?

我们用了很多雷达,我们要有驾驶行为数,在这个过程当中我们遇到了很多的困难,好比说要不要研制一个三维成像,怎么样有自学习功能。我们取得了可喜的成果。

我们有详细的实验报告、实验环境,以及超车的次数,我们今年还和韩国车做了比赛,我们在车子里做了一个交互鉴定。

我们想想以后怎么打的?手机目前来讲是人用的,所以以后是人和机器交互,将来你用手机打的,你把手机往汽车来一插,汽车就开跑了,到了一个地方,钱一付你就可以走了,你改变路径,你就用手机跟机器人对话,我们在座的企业家能不能做成,人、手机和轮式机器人之间的关系。如果这个做得了就不得了。

我现在的想法是想做这两个事情,北京从天安门到首都机场做一个实验,混在正常路径当中,目前我们有5辆车。上海我们希望从虹桥机场到浦东再到人民商场,我们准备了6辆车。一种是电动车,一种是混合动力车,一种是国产车。一个类型两辆。如果有一天北京城出现了飙车机器人,当然这是违法的,你还要问认知可以计算吗?

大数据时代,技术的有效性要比科学的完整性更重要。所以我建议这张图(见下面的PPT),给一些中小企业一些参考,我认为以人为本的认知物联网的时代已经到来了。有一个智能眼镜解决照相问题,解决看的问题,有一个智能耳机解决听的问题,有一个智能笔解决写的问题,还有智能手表,解决你身体测试,以及通讯的需求等等。这样一来,以人为本,构成穿戴式设备,这样就可以干成很多事情了。这样真正可以提高我们移动生活的品质,实现智慧生活。

总结一下,如果说人类对认知问题不能全部完整统一的形式化,这是认知科学要做的事。我们认知计算可以让成千上万的小众,甚至千千万万的特定情况下的认知可以局部的形式化。那么,大数据时代的认知计算是否正在逼近认知科学呢?

谢谢大家。

演讲PPT

更多精彩内容,请关注新浪微博:@CSDN移动 ,图文直播专题:移动开发者大会·中国2013 

本文为CSDN

云计算,让游戏世界更加精彩 360推儿童卫士手环,你怎么看? 量产谈判正在进行时:谷歌手表或比Google Glass先上市 Mozilla发布新版Firefox 25 提供支持Web Audio API UC产品总裁何小鹏:轻应用,做什么?怎么做? 高德携手阿里云发布“LBS云”,账户打通只是第一步 最后2天!2013移动开发者大会5折抢票倒计时 大数据如何改变在线广告业? 摩托罗拉推开源硬件平台计划Project Ara 七个垂手可得的敏捷开发工具 微信新版公众平台调整细节381处 300/次认证费引争议 libgit2:纯C语言实现的Git开发包 MongoDB的得与失 开箱即用!Android四款系统架构工具 谁说Kinect只是玩物?微软研究院使用它实现口语手语实时翻译 新浪微博推出粉丝服务平台 引发两微PK大战 MDCC2013移动开发者大会最新日程发布 门票优惠最后1天 英特尔CEO:EUV光刻技术或助力芯片突破摩尔定律 从微软大数据日看到的,银行、交通、医疗实践之路 IDC:iPad市场份额遭Android平板蚕食 滑至29.6% [TUP第30期]直击移动应用开发难点 探讨跨平台最佳解决方案 用动态语言编写程序,命名更重要 命中率80%,磁盘I/O减半,Flashcache的发展史 这次它很低调:谷歌正式发布Android4.4和Nexus 5 iPhone 5S来了,iPhone 6还会远吗?概念机来袭 [开源推荐]PhysicsJS:基于JavaScript的强大的物理引擎 望虚窥实!专访Oculus Rift创始人Palmer Luckey 利益至上,开源也不免于此 开发者必备,超实用的PHP代码片段! 福利来了!AngularJS资源大集锦 移动周报:“360儿童卫士”手环的是与非 pcAnywhere操作不能刷新的问题?高手来解救我吧!! 请帮我分析一下为什么会出现这样的错误提示:Access vidation at address 004a36B2 in modale'**.exe'read of address FFFFFFFF CTime和CTimeSpan的使用问题!!!很奇怪??????? 我在写Tuxedo服务程序时,在VC++环境下编译连接时发生以下错误。 关于PDF文件(高分奉送) 来新公司一月了,遇到一个问题,请大家帮忙分析! 谋杀——转贴 打安装包时,提示某些dll过期(很多),怎么办呀? 出生年月与年龄的问题 大家帮帮忙!!!!!!!!!!! 我的天啊!CListCtrl不允许设置行间距和字体大小吗? 如何在40G的硬盘(maxtor)上安装nt4.0 100分(我全部的分),加速,代码优化,JPEG 求救 如何编代码自动创建NT的账号、密码(用什么API实现) 大家看看,我在做一个Messagebox的提示信息时的提示!!!!!奇怪,.net真奇怪 关于计数统计的问题 查某一个人全部贴子的方法。 怎样建立无盘工作站?? pcAnywhere操作不能刷新的问题?高手来解救我吧!! 高手们帮帮忙,我的聊天室怎么不支持中文??? 关于换行的问题??? 各位大侠,请教注册表子项枚举问题?(100分) 修改記錄問題(20)分! 各位大侠帮我检查一下这段代码 再线关注,一个关于excel的问题?一解决立即给分,up有分! 居中 哪里有这些书下载啊!!!! 我的控件不见了! reintroduce和overload有什么区别吗? 关于Javadoc的使用 请问如何在程序运行时根据分辨率等比例调整窗体,控件和字体的大小,使得在任何分辨率下均满屏显示 世界杯“蓝色厄运”理论:英格兰胜巴西 德国淘汰美国(转贴) 关于treeview的节点事件问题,把在下高糊涂了,请高手明示。 要毕业了。。。 BCB中数据库控件的错误扑捉怎么写?比如数据库不存在? 请教如何在调运api函数时,建立缓冲区 SetEvent函数调用带来非法内存访问,扭心的问题。 文件和字符混和上传问题 诸位大虾请帮忙? 各位大虾:哪里有vb.net下载啊? 请教:“开始”菜单中的“文档”菜单不见了! 急!急!急! 一个关于模式对话框的问题 oracle 用sql plus /spool 输出 查询结果时怎么把 查询sql 本身 去掉(不输出) ? 世界杯“蓝色厄运”理论:英格兰胜巴西 德国淘汰美国(转贴) !!请 “arxing(阿行)”回答!!about 对象池!!!! 各位老大,怎样将给定的中文根据拼音排序? access97中的报表中显示中文字段时为什么是乱码,怎样解决,急呀!老大们!! 急:在哪儿可以下载java的反编译器jad.exe????? 请帮忙 做过数据分析的高手请进。。。(我感觉很头疼的一个问题!) 共享Interent怎样实现? 一块长方形的木板长60厘米,宽35厘米在这块木板上锯下一个最大的正方形,这个正方形的周长是多少厘米?请帮计算 图中阴影部分面积是100平方厘米,求环形面积 从一块长方形木板上锯下一个最大的正方形,剩下一个长方形.已知原来长方形的长是100cm,求剩下的长方形周从一块长方形木板上锯下一个最大的正方形,剩下一个长方形.已知原来长方形的长是 谁能给写一个关于教育方面的调查报告?一千字以上抄袭的就给这些分 1.(sinx)^(-3)(cosx)^(-5)的不定积分2.x乘以arcsinx乘以根号下(1-x^2)的不定积分 一块木板长198分米、宽90分米,要锯成若干个正方形,而且没有剩余,最少可以锯成多少块? 一篇稿件,甲独抄6小时完成,乙独抄要8小时完成,两人合抄要几小时完成?列式计算!重赏! 写一个反义词,对制假币,贩假币的现象进行谴责. 8吨5千克=()千克;3.06m³=()m³()立方分米 一瓶水有5分之4升,4分之3之瓶水有几分之几升? 你还知道哪些诗文“练字”的故事? 一个底面半径为10厘米的圆柱形水桶中装有水,把一个底面半径为5厘米的圆锥形铝锥浸没在水中,水面上升了1厘米,铝锥高多少厘米? 最搞笑的诗 句是什么? 0.98立方厘米=( )立方厘米 650ml=( )立方厘米 买了两副乒乓球拍,如果没人付9元,那么多出5己;如果每人付8元,那么还缺2元,这个小组的人数是多少? 有两只大的网球拍和一只小的乒乓球拍共200元,每只网球拍和乒乓球拍多少元? 有没有像这样的搞笑诗【一年级的小偷,三年级的美眉跳芭蕾……】这样的,不要古诗 650立方厘米=( )升请换算成分数,做得好自然会悬赏! 长歌行的诗句 如图,已知阴影部分的面积是100平方厘米,求圆环的面积. 把一张长120cm,宽80cm的长方形纸裁成最大正方形(纸无剩余),至少可以裁多少张求公式 要《长歌行》诗句 在一只长50厘米,宽40厘米的长方体玻璃水缸中,浸入一块棱长20厘米的正方体铁块后,水面会上升多少厘米? 把一张长为120cm,宽80cm长方形裁成正方形(无剩余)能裁多少正方形? 怎样快速口算出两位数乘法(两位数乘除两位数) 在一只长40厘米宽20厘米的玻璃水缸中放入一块棱长10厘米的正方体铁块,铁块浸没在水中水面升高了几厘米 把一张长180cm,宽120cm的长方形纸片裁成正方形(纸无剩余),至少能裁多少张? 在极坐标系(ρ,θ)(0 一只长方形玻璃缸高为40,浸入个棱长20的正方体铁块,水面上升了2厘米,这个水缸的体积是多 有两条曲线y=-x2,4y=-x2及直线y=-1所围成的图形面积 把长30厘米,宽24厘米的长方形木板锯成大小相等的小正方形,每个小正方形的边长最少是多少厘米?锯多少块 关于亲情的初中作文 计算由下列各曲线所围成图形的面积:y=1/2x2,x2+y2=8(两部分都要计算)为什么会有Pai 一块木板长36厘米,宽24厘米,锯成相同的小正方形若干块,求正方形尽量大,正方形边长是几厘米?可以锯几块 乒乓球拍每幅定价30元乒乓球每盒定价5元甲店买一副球拍给一盒乒乓球乙店全9折优惠需球拍5副乒乓球不小于51)当购买乒乓球多少盒时,两种优惠办法付款一样?2)当分别购买15盒,30盒乒乓球 甲乙两家商店出售相同的乒乓球和乒乓球拍,且定价相同,乒乓球拍每副定价30元,乒乓球每盒5元.甲、乙两家商店出售相同品牌的乒乓球和乒乓球拍,且定价相同,乒乓球拍每副定价30元,乒乓球每 一块木板长36厘米,宽24厘米,锯成相同的正方形木板若干块,要求正方形面积尽量大而没有余料,锯成的正方形木块边长是多少厘米?可以据几块? 一副球怕定价30元,一盒乒乓球定价5元,店买一副球拍给一盒乒乓球乙店全9折优惠需球拍5副乒乓球不小于5当购买乒乓球多少盒时,两家商店给予的优惠相同? 甲、乙两家商店出售相同品牌的乒乓球和乒乓球拍,且定价相同,乒乓球拍每副定价30元,乒乓球每盒定价5元.但甲、乙两点的促销方案不同,甲店每买一盒球拍赠一盒乒乓球,乙店全部按定价的9折 一个长6分米,宽5分米的长方体,浸没在一个长2米宽1.5米,2米的水箱中,水面升高5厘米,这个长方体高?快. 我想把比叫小的虫子拿来喂鱼,但我又不想买饲料,怎么样才可以捕捉昆虫. 请用简短的一句反问句表达自己对制假币现象的看法. 把长24厘米、宽30厘米的长方形木板锯成大小相等的小正方形,且没有剩余,每个小正方形的边长最长是多少厘米?能锯成多少块? 详细的步骤!谢 了! 怎么大量捕捉昆虫 甲乙两家商店出售两种同样品牌的乒乓球和乒乓球拍.乒乓球拍每副定价30元,乒乓球每盒5元,经洽谈后,甲店每买一副球拍送一盒乒乓球,乙店全部按定价的9折优惠.该班需球拍5副,乒乓球若干盒 简述宋朝商品经济发展的特点 少先队员一共采集标本168件,其中5/8是植物标本,其余是昆虫标本.昆虫标本有多少件? 用上一对反义词,写一段对制假币,贩假币的现象进行谴责 运用经济常识的有关知识,阐述低碳商品间隔下降得必然性. 中国有什么民间昆虫协会吗?有一起去捕捉昆虫的活动吗? 练字,关于成年人练字的问题我小时候练过庞中华和司马彦的,但是总是应付,没好好练.现在长大了,后悔了.工作中,写个字觉得很别扭.我写一个字的时候,写的比较好.但是写一段的时候就感觉很 从《西方经济学》角度分析企业如何利用产品差别在竞争中获胜? 浪漫庄园昆虫收集册的昆虫都在哪里收集 成人如何练字 一块长45厘米宽30厘米的长方形木板锯成若干块正方形而无剩余,所锯成的正方形边长最长是几厘米?越快越好 sinx^6/(sinx^6+cosx^6)不定积分 成年人练字方法一把年纪了感觉自己的字写的好差,出去都不好意思当着客户的面做笔记,谁能推荐一些方法把字给整好. 一块长方形木板,长60厘米、宽40厘米,锯下一个最大的正方形后,剩下的小长方形周长是多少厘米 成年人想要练字,应该选择哪种字帖啊? 以“中国梦,我的梦”为主题写一篇征文,500字,内容要新颖,不要复制的.
备案号:鲁ICP备13029499号-2 说三道四 www.s3d4.cn 说三道四技术文摘