说三道四技术文摘-感悟人生的经典句子
说三道四 > 文档快照

中国工程院院士李德毅:大数据时代的认知计算

HTML文档下载 WORD文档下载 PDF文档下载
中国工程院院士李德毅在MDCC 2013大会上发表了题为《大数据时代的认知计算》的演讲。他分析了认知究竟可不可以计算,他认为以人为本的认知物联网的时代已经到来了,大数据时代的认知计算正在逼近认知科学。

MDCC 2013移动开发者大会于2013年11月13-14日在北京国家会议中心隆重召开,本届大会由CSDN和创新工场联合主办。逾百位国内外移动互联网领域的领军人物与核心技术专家,以“全民移动,重塑世界”为主题,分享最新实践经验,探讨移动互联网发展趋势。此外,智能硬件、移动娱乐游戏、微APP三大主题峰会成为本次大会新亮点。

中国工程院院士李德毅发表了题为《大数据时代的认知计算》的演讲。他分析了认知究竟可不可以计算,并阐述了大数据时代、移动时代,认知计算应该何去何从。他认为以人为本的认知物联网的时代已经到来了,大数据时代的认知计算正在逼近认知科学。


以下为演讲实录:

李德毅:各位同行大家好。移动生活、移动品质,给我们带来的变化很大。这一年社会上的人,拿个手机,有说有笑有拍照,这就是给我们带来的变化。

人活着就要动,移动的速度是多少,把移动速度搞清楚,移动产品才搞得清楚。我们靠两条腿动,靠轮子动,靠高铁动,靠飞机动,主要还是低速移动,所以我们叫移动,不叫运动。但是背个笔记本是个负担,所以我就想一想,大数据时代对我们移动生活带来了什么变化,也就是大数据时代人的认知,认知最简单的是说话、听、看、写。

认知可不可以计算?

这是一个很古老的命题。因为老科学家认为人是世界上最高级的精品,比其他东西都强,认知是不可计算的。

我们希望提高人的生活品质,我们希望智慧。说把智慧城市变成智能城市,智能是个技术,我们要的是智慧。我们说你这个良心大大的坏了或者我心情不好学不进去,说明这个认知和心态有关系。但是作为人工智能的科学,作为认知科学来说,我们长期以来强调的是智商,脑智,依据现有知识进行分析、联想、推导或归纳,产生新知。我们认为人的认知主要靠大脑。

后来说不对,你这个人智商很高,情商太低不行。面试的时候老板要通过意象、直觉、想象、情感等进行直观、综合的思考,在创新中起着至关重要的作用。这就是二元。更多的人说成功等于40%的智商和60%情商的相互作用。所以认知科学到现在还有很多没有解读的地方。

1936年,天才科学家图灵建立了图灵机概念,任何形式系统可以通过图灵机准确刻画。

老百姓通常把计算工作交给电脑,它是基于人脑的智能吗?IBM研究了一个生产计算机。人们把人的思维能力放到机器里去,前台是机器,后台是人。从这个意义上,认知应该是可以计算的。

我们的程序问题、停机问题、程序验证问题本质上是不可以计算的。所以我们打了补丁还有漏洞。

数学自身是机器程序不可穷尽的。并不是所有的数学问题都可以用计算机来做的。所以人脑不能被物化变成电脑,重要是人脑能不能被形式化。好多诺贝尔获得者都在这个方面获得了重大贡献。但计算性是不依赖于形式系统的选择的。

因此,IT工作者千万不能用行政化的方法来研究思维和意识。意识怎么理解?灵魂怎么理解?宗教怎么理解?信仰怎么理解?它们和思维是什么关系?脑里面有分工,这块干什么,那块干什么,后来研究的成果发现,人的意识和精神活动,是由大脑不同区域共同作用产生的。怎么样才能共同作用,这个问号到现在还很大。

生命科学家喜欢物理,喜欢化学,难道人的思维是由物质和化学规律支配的吗?这个令人怀疑。

有人认为,人是不可能自己把自己搞清楚的。你要研究一个东西,要站在一个东西之外。

大数据时代的挑战

在这样的情况之下,自然杂志登出了一篇重要文章,里面一个小标题——BD(大数据)时代的科学,我们应该怎么做,这是我们时代的挑战。

大数据的来源分为三大块:

  • 第一块是地球,我们叫数字地球,自然大数据把我们的地球、宇宙搞清楚。
  • 第二是生命,包括各种动物,尤其包括我们人类,这本身也是大数据。
  • 第三就是社交,互联网,尤其是移动互联网,我们的日常生活都是大数据,这样的大数据使你对科学,认知科学提供了挑战。

我们去看病,现在不是看医生,医生很宝贵,主要是看仪表。到了医院还没坐三分钟,医生一大堆化验单出来,让做X光、B超、内镜检查、核磁,你还得排队,排了两个星期,才把这些检查做了。你拿着化验结果去找医生,医生不到三分钟把药开出来,现在看病不是看医生,现在就是查,诊查的治疗。医生跟你说一句话,你还没听懂就接待下一个病人,这就是我们日常看病,花钱看仪器,这就是大数据带来的现实。

这些年来,医学诺贝尔奖很多颁给了医学企业的发明,所以现在的高明医生,要么是器械的发明,要么他们能从医疗数据发现价值。你排队5分钟,医生一看没问题,他从这个数据里发现了价值。大数据时代你会发现,你只要知道了是什么,就知道怎么做。

这样问题就淡化了,为什么不仔细诊断了,因为这么多病案,你这个情况在他的病人库里非常清楚,所以怎么做很简单。

我们认为科学是解决的形而上,技术解决的是形而下,我们研究的对象是认知、智慧。现在把我们的对象是什么的问题,可以用大数据来解决,在这样的情况下,对大数据对不同案例对象的处理,也可以用大数据来解决。因此这个社会更多研究的是关联,把科学放在后面。科学解决因果问题,要解决主次问题,解决前后问题。所以人们能更多的解决问题就是好汉。

我们对曾经认为的科学是技术的先导产生了怀疑。在当今情况下,因为IT技术的发展,技术也可以成为科学的先导,要求认知自学的数字化,这是我们大数据对认知科学的认识,以及认知计算的不同。认知计算是技术。

这样的情况下,大数据时代对计算正在告别认知科学。

对人的认知而言,欧盟在上世纪就进行了脑科学的研究。今年澳门又提出了人类大脑计划的,奥巴马也发动了脑计划。这和我们信息工作者关联得太少,全是生命科学家,我觉得我们人类的大脑,从生命科学的角度来讲,大家和猴子的大脑区别不是太大,因为已经有研究表明,脑结构差不多。

我就在想,我是在英国学习的,撒切尔后来得了老年痴呆症,我个人认为她的老年痴呆和一般人的老年痴呆没有多大的区别。因为我认为脑计划的研究有一点偏了。

人类和其他动物相比,都有灵感,有语言,唯独人有文字,因为有文字,才有文明,才有传承。我们的青年人到大学,都要学习知识,学习文明,这个很重要。如果没有文字,我们和其他动物差不多。

另外还要研究人类认知的社会属性,这两个不清楚,认知科学搞不清楚,我建议要把这两点作为人类认知的切入点。

要研究脑认知的后天属性,认知不仅是前面的天性所决定的,DNA、基因、遗传,还要看后天学习和积累的结果,是与社会环境、社会实践,群体交互相关联的。

在移动生活时代,我们怎么办呢?

大数据时代自然语言处理技术正在改变我们的移动生活。

语言是思想的直接现实,这句话是马克思讲的,语言是人类思维的载体,语言是认知科学和认知计算要应对的首要问题。我们的移动生活首先要讲语言,你哪一天不说话不行,能听会说是我们必须具备的能力。让我们迎接语音时代的到来。人类走向文明的四个重大里程碑中,语言和文字占了重要的地位。

人类运用自然语言进行交流获得的效果。你跟人家沟通得到的效果当中,很重要的就是你的强度和语调,要占38%,还有你的面部表情,它有情感在里面。从我们认知科学来说,半个世纪的自然语言理解的研究中,我们对此关注了多少?

人们在思考和解决任何问题时,通常是定性的,对量的规定性往往是是非数值。我们研究大数据,它有一个定性,定量转换的问题。科学研究当中,人们用对象语言表达一个特定的精确学科,比如物理数学、C语言,都是用自然语言来表达。

我们就变成两个学派的争论,脑科学认为自然语言是不可计算的。

如果一个问题不能全部形式化,那么其中的局部问题可不可以形式化?自然语言可以在什么程度上被形式化,取决于能否把不确定性形式化。研究不确定性,我认为是一条道路。

科大讯飞做了一个客服中心,移动客服录音大数据,可实现一秒钟对100万小时音频数据的检查。这就是一个很大的变化。你是雇佣500位客服人员还是启用一台服务器?所以还是用一台服务器。在半个世纪的自然语言理解的研究中,我们对此关注了多少?

我们看报纸,有这么一段文章,但是你仔细看的时候,发现这个字序不对,但是它又能影响我们多少东西?在半个世纪的自然语言理解的研究中,我们对此关注了多少?

再看一个例子,我们网上动不动要区分对方是人,我们经常出来一个识别码,叫你再输入一遍识别码,证明你是人。在半个世纪的语言文本理解的研究中,我们对此又研究了多少?

我觉得要创新,要新思维才能解决。机器人能听会说,能看会想,正在改变我们的生活,这就是移动生活的产品。

有一个产品你们可以做做,叫在线服务机器人。将来IT行业里面,随着智能技术的发展,移动客服中心可以裁减到50人。我们能不能有个智能耳机,这是我个人想的,你戴着耳机,我说话,我的口音比较重,你的耳机听到的是普通话,你能不能做这个?这个很好,特别是广东话北方人听不懂,尤其是语言翻译。假如两国元首会谈,奥巴马的话是普通话,但是是奥巴马的语音。这是一个多大的改变。实际上现在已经有了,这时候就需要云计算,需要一个方案服务中心,需要一个中文翻译服务中心,位置服务中心等等。

语音到文字,文字到文字,我们要让数据说话,这就是大数据给我们移动生活带来的变化。所以有人说先干掉短信。

我这个年龄对五笔字型输入是情有独钟,我们有两代人都是用五笔字型输入。从搜索引擎到个性化搜索,从规则学习到统计学习,从智能计算到情感计算,从形式语言学到智能翻译。

我们想象将来电视台主持人他拿到就能念,这个虚拟主持人在形象、情感、动作、语音、语调、风格都像某一个人多好,那我们演员也可以失业了。这样的时代也许会到来。

以大数据形态反映的语言,是可交互和理解的、是带毛的、鲜活的、有情感的原生态语言。

智能驾驶

下面讲讲和我们移动生活相关的智能驾驶,智能驾驶为什么火起来呢?因为它跟云计算,移动互联网,大数据密切相关,你只要做了这个东西,政府肯定会支持你。因为是战略性新兴产业。当初自然科学基金会在确定这个项目的时候,提出了科学的任务,解决实际的计算问题。后来把这个科学问题明确地用一个载体来表现,叫做科学任务,在正常的情况下北京开到天津,你能不能做得到?

我们用了很多雷达,我们要有驾驶行为数,在这个过程当中我们遇到了很多的困难,好比说要不要研制一个三维成像,怎么样有自学习功能。我们取得了可喜的成果。

我们有详细的实验报告、实验环境,以及超车的次数,我们今年还和韩国车做了比赛,我们在车子里做了一个交互鉴定。

我们想想以后怎么打的?手机目前来讲是人用的,所以以后是人和机器交互,将来你用手机打的,你把手机往汽车来一插,汽车就开跑了,到了一个地方,钱一付你就可以走了,你改变路径,你就用手机跟机器人对话,我们在座的企业家能不能做成,人、手机和轮式机器人之间的关系。如果这个做得了就不得了。

我现在的想法是想做这两个事情,北京从天安门到首都机场做一个实验,混在正常路径当中,目前我们有5辆车。上海我们希望从虹桥机场到浦东再到人民商场,我们准备了6辆车。一种是电动车,一种是混合动力车,一种是国产车。一个类型两辆。如果有一天北京城出现了飙车机器人,当然这是违法的,你还要问认知可以计算吗?

大数据时代,技术的有效性要比科学的完整性更重要。所以我建议这张图(见下面的PPT),给一些中小企业一些参考,我认为以人为本的认知物联网的时代已经到来了。有一个智能眼镜解决照相问题,解决看的问题,有一个智能耳机解决听的问题,有一个智能笔解决写的问题,还有智能手表,解决你身体测试,以及通讯的需求等等。这样一来,以人为本,构成穿戴式设备,这样就可以干成很多事情了。这样真正可以提高我们移动生活的品质,实现智慧生活。

总结一下,如果说人类对认知问题不能全部完整统一的形式化,这是认知科学要做的事。我们认知计算可以让成千上万的小众,甚至千千万万的特定情况下的认知可以局部的形式化。那么,大数据时代的认知计算是否正在逼近认知科学呢?

谢谢大家。

演讲PPT

更多精彩内容,请关注新浪微博:@CSDN移动 ,图文直播专题:移动开发者大会·中国2013 

本文为CSDN

Silver:用Swift编写iOS、Android和.NET应用 Swift没有异常处理,遇到功能性错误怎么办? 基于Python的测试驱动开发实战 不能守株待兔!移动互联网时代:产品找用户 淘汰传统屏幕,虚拟现实新纪元何时开启? 《近匠》SENSORO CTO赵东炜:解密iBeacon生态 我由Angular转向React,为什么? 产品设计中的九个注意事项 昂贵、复杂、不可靠!智能家居产品的尴尬现状 Facebook的CIO都做些什么? 穷游网CTO黄向阳:成果与价值是最好的驱动力 2015移动游戏行业方向标:创业者必须关注的几个领域 基于Python的行为驱动开发实战 面向WP和Android!微软车库发布多款免费应用 GRPC:谷歌发布的首款基于HTTP/2和protobuf的RPC框架 革命,就是现在!——CES 2015行纪 HTML5游戏引擎排行榜 Construct 2最受欢迎 2015手游营销新趋势:电视广告,及其投放逻辑 详解下一代开源混合应用框架Reapp 应用内一键交易!Google公布Android Pay项目 Timehop为什么要放弃Rails,转向Go? 无线充电技术走入客厅 宜家推出“Home Smart”系列 发布仅一年,虚幻引擎4宣布完全免费! HTML5初学者福利!11个在线学习网站推荐 Qualcomm发布Snapdragon 820与超声波指纹识别技术 App Store应用僵尸化:没品质没资本的必然走向 Unity 5正式发布:支持21种平台、个人版免费! 创新高性能移动UI框架——Canvas UI 框架 取精华、去糟粕!适合iOS开发者的15大网站推荐 Swift如何优化性能? 【程序员电子刊精选】明道CEO任向晖:企业也需要养成好习惯 ORACLE统计问题 腊肉是月老啊,单身的哥哥们找腊肉拉红线啊! 新闻搜索 using namespace std; 微星845 Ultra-C 支持P4赛扬2.0的吗? 请问哪里有关于cc的比较好的文档资料. 水晶报表的问题!!!!!!!!!!!! 关闭Jbuilder9时,会弹出微软拼音输入法的关于信息框,如何解决? TreeView的删除问题/// 怎样在delphi里使用windows定义的结构体 问个问题 顺便散分 sub main问题 郁闷,一夜起来信誉分掉了一大截,散分 请问UNIX下makefile 是怎么一回事 我在学习C#,不过基础不好,很吃力!中秋快乐! 如何防止文件被访问?谢谢! 今年中秋我爸收了一大堆礼物,价值估计不下于20万(我爸是税务局长),呵呵,太高兴了!再散点分给大家!今年中秋我爸收了一大堆礼物, ASP.NET有没有类似javascript中的window.confirm( )这样的方法,弹出对话框提示是否确认? C#builder里的CaliberRM有谁用过? 学ASP学的我晕了,大家给条路!!! 简单问题求助~~~~~~~~~~~~~~~ sql7.0到sql2000升级 图像存储及传输的计算问题? 为什么不能共享? 大家讲讲TreeMap的使用,回答好的立刻给100分!! 请问哪里有免费的或破解的查木马软件下载?? 在ASP.NET中能控制输入法吗?在.NET应用程序中有一INPUTLANGUAGE类,可以控制,在ASP.NET中能实现吗? 有谁做过用moden拨号连接,访问另一台pc,建立连接 如何让bean中的“输出”定位到网页中的特定位置? 请问以下这个项目如何设计?关于图形数据库系统的 触发器的大问题,请各位高手支招: CEO是个什么职务?有多大管理权限? 一个看似简单.....其实非常难的问题....小妹初学web开发. 为什么不能共享??? 100分求:哪儿有《深入理解linux内核》可供下哉! 工作机会 JBUILDER是否帶有TomCat﹐如何安裝使用﹖ 这里有没有用过realbasic的朋友 为什么不能共享??? 报表怎么样进行总计,一个QRexpr的问题? 请推荐 求救,如何用实现在同一个局域网内另外一台电脑用ADO访问服务器的ACCESS文件,马上给分 请问高手,以下问题如何解决? 在java中怎么把日期0204改成2002-04 在自己建立的文件夹下建立文件,可怎么都不对头!!SOS!! 数据窗口打印问题,多多帮忙!!!!!!!!!!!!!!!!!!!!!!!!!! 在SQL中写个函数,急 我刚学编程没有多久,发现在数据库很重要,但不知道怎样一个用一个系统方法去学习?请各们前辈能给我以指点。非常感谢!!! 我用ADO做了一个数据库应用,数据库是ACCESSXP,ODBC JET4。0?有一个问题 使用DEV-C++进行命令行编译的设置问题 请问高手,如何解决图形数据库问题? 初二科学题:将制备的硫酸铜溶液与其他同学制备的硫酸铜比较,你得到哪些启示? The ploughing set 更漏子玉炉香 温庭筠塑造了一个什么样的人物形象 问字怎么读? 求带希字的四字词语.谐音也行. 姓韩的历史上又名的坏蛋大家帮我找找,性韩的优美有什么坏蛋,历史上特别出名的也行,实在没有就是个比较出名的太监都可以,反正只要姓这个韩就可以了~@我想骂韩国人~@ 做个数学题:A,B,C分别为三角形的三边之长,求证:(A/B+C)+(B/C+A)+(C/A+B) 母爱作文200字写的好一点,短一点 关于母爱的作文200字 国家结构形式 名词解释:联合国包括成立时间、外交特权、性质、发挥的作用等 西非经货联盟首脑会议在达喀尔开幕潘基文呼吁世界各国与联合国共同应对全黎巴嫩总理宣布立即采取措施制止北部教伦敦股市股指24日上涨美媒曝美无人机行动得到巴默许 巴政府美农民发现两副恐龙骨架 有望拍出20澳大利亚灭火消防飞机坠毁 驾驶员被证法国、马里和联合国部队在马里北部展开伦敦股市24日上涨叙利亚人权观察组织称叙政府已释放61梁振英:香港将继续实行“双非儿童零配海沧:贪心汉卖车收钱后诬告他人偷车获“货车司机打架后突然死亡”追踪:的哥联组审议“政府账本”场面火爆辞掉工作专偷豪车后视镜 留手机号索要我市法院去年办结案件逾17万件勇立改革潮头 特区再争先锋淡定窃贼围坐石凳抽铜芯 集美一村子电轿车失控冲出路面 坠落12米深谷“插为深化改革建言献策再续传奇努力取得人民群众满意的实效猛虎出林梦降龙神魔纪异爷是机械师平行世界的幻想乡雨三旅暗夜之晓网游之逆天屠龙傲兴高潮无上天师综漫之乖离武汉绿皮小火车旅游七级浮屠塔旅游吴文化公园旅游大风堡原始森林旅游赵公山旅游小北江游船旅游地扪旅游石头寨旅游神树旅游迷楼旅游屋脚旅游
备案号:鲁ICP备13029499号-2 说三道四 www.s3d4.cn 说三道四技术文摘