说三道四技术文摘-感悟人生的经典句子
说三道四 > 文档快照

专访西电朱虎明:异构计算硬件架构呈现百花齐放 百家争鸣

HTML文档下载 WORD文档下载 PDF文档下载
AMD已成功举办5届异构开发者大赛,从第三届开始,朱虎明老师就带领他的同学一直参加这场比赛,并取得非常好的成绩。对此,不妨让我们来看看他对异构计算有哪些看法,对即将要学习异构计算的同学有哪些建议。

因比赛而结缘异构计算的朱虎明老师,带领他的团队屡次在比赛上获奖。可以说,他已成为异构计算领域不折不扣的专家。对此,CSDN记者就异构计算近年来的技术演变、发展趋势、以及开发者该如何学习异构计算等话题采访了他。


CSDN:请您先简单介绍一下自己以及目前主要关注研究的领域。

朱虎明:我目前主要从事高性能计算及其应用的研究,特别是基于集群和GPU的大规模并行计算及其在数据挖掘、SAR图像处理和智能计算领域的应用。

CSDN:您如何看待异构计算/编程领域这些年来的技术演变、应用拓展状况及未来发展?

朱虎明:异构计算的硬件架构及其编程模式现在处于百花齐放 、百家争鸣的阶段,各个公司和各个研究机构都提出了自己的解决方案。目前Intel、AMD、Nvidia和ARM等公司均推出了自己的多核/众核架构,这些架构差异很大,我个人认为将来这些架构会互相取长补短,深入融合,从而达到高性能低功耗的目的。从并行编程的角度来说,要继续提高编译器的智能性,以使大量的高复杂应用经过编译后能够直接高效地运行在并行硬件上,而不是一个一个的去研究算法的并行化,当然,从目前的研究成果来看,短时间内要取得突破可能性不大。另外一个方面就是靠人工来并行化已有的应用,这个需要大量既懂并行又懂专业领域知识的人才,目前并行人才的短缺制约着其发展。我想目前业界的思路就是降低并行编程的难度,使得大量的应用领域专家能够很容易学会使用并行编程工具,或者能够借助第三方的并行开源库,来加速并行计算在各个专业领域中的应用和推广。 

CSDN:作为领域内的专业人士,您认为哪些开发者应该优先学习异构编程的技能?未来异构编程的技能会成为开发者的通用技能吗?

朱虎明:就我所知的领域而言,卫星图像处理、视频分析、生物信息学和大规模数据挖掘等领域由于算法复杂,已经基于高性能计算集群开发了很多的应用,如果将其应用能够移植到异构计算系统上,那将是高性能低成本的解决方案。

今天的桌面级计算平台几乎都使用了异构计算的架构,但是由于异构软件开发者的短缺,只有一些应用支持异构计算平台,我想,谁首先掌握了异构计算的技能,谁就能在未来的竞争中获得先机。

CSDN:您如何看待AMD最新推出的hUMA(异构统一内存访问)技术对GPU/CPU融合带来的影响力,它有哪些优势和劣势?

朱虎明:hUMA(heterogeneous Uniform Memory Access,异构统一内存访问)的出现,我想会使得以前很多不适合运行在GPGPU上的应用,也可以尝试使用GPU来加速。这是因为在以前的CPU+GPU计算模式中,首先要把处理的数据通过PCI总线传输到GPU的显存上,然后GPU对数据进行并行处理,最后将GPU计算的结果又传回给内存,这种模式下,对计算时间/通信比值小的应用,或者不适合或者加速比较有限。新的hUMA技术,不需要在CPU与GPU之间传输数据,这必将会使GPU计算适用于更多的复杂应用。

但是由于这是一个新技术,AMD也没有透漏更多的技术细节,所以目前不好给出更多评价,但是我们很期待这个产品。

CSDN:HSA帮助开发者更高效、更容易的进行开发,并获得可观的性能提升及功耗降低,但这还需要一至两代产品更新才能实现。在当下,开发者学习和使用异构编程有价值吗?

朱虎明:HSA的成立对推动异构计算无疑是非常有帮助的,以前GPU计算主要是Nvidia和AMD推动,成效显著,但是GPU计算仍然是阳春白雪,仅限于既懂并行又懂领域知识的人使用。HSA的成立,致力于打造异构计算的软硬件生态系统,必然会推动异构计算进一步的快速普及。

据透露,HSA年底前推出hUMA(heterogeneous Uniform Memory Access,异构统一内存访问),这是异构计算硬件上的一大进步,我们也希望其配套软件也很快能够问世。那是不是要等软硬件都齐全了,我们再来学习异构计算呢?我个人认为,那可能太晚了。大家都知道,异构并行计算的编程方式与传统的MPI和openMP并行不太一样,要熟练掌握异构计算需要一定的时间周期,而要把异构计算应用于某个领域,那需要的时间就更长了。如果等异构计算的软硬件都非常成熟了,那我们已经落后了。所以,要想占领异构计算的制高点,那就要从现在起抓紧时间学习。等将来新的异构计算技术出来了,我们已经具有丰富的异构并行计算经验了,会很快的将旧的应用移植到新的架构下,从而快速占领市场。

CSDN:如何看待在高性能计算领域流行的CPU/GPU异构计算并获得高性能低功耗在移动平台的运用?

朱虎明:一方面,桌面级CPU/GPU异构计算已经广泛使用在各个领域,更多的基于CPU/GPU的应用还在研究和开发之中,另外一方面,随着智能手机、平板电脑和移动互联网的普及,移动平台上的复杂应用越来越多,要求平台具有高性能和低功耗的特点,但是目前好像还难以达到这个标准。从技术上来说,移动平台已经具有4~8个CPU核,2~8个GPU核,未来还会迅速增加到数十个之多,这些为移动平台的并行计算打下了坚实的基础。我想,与桌面级CPU/GPU应用相比,移动平台的并行应用还处于初级阶段,仅有几个高端平台支持openCL语言,而且由于移动平台计算与存储资源的限制,很多桌面级的原有并行应用和并行库不能直接使用,还需要从新开发和优化。但是根据目前三星研究院和加州大学的研究成果显示,移动平台采用CPU/GPU异构计算后,不但可以加速应用,而且可以降低功耗。因此,我认为移动平台CPU/GPU异构计算非常有发展前途,但是并行计算的生态系统建立还需要很长的时间。

CSDN:C++大师Herb Sutter曾发表过一篇著名的文章《The Free Lunch Is Over》,他表示程序员不断获取硬件升级带来帮助的日子已经结束了,并行计算或异构计算将是未来的趋势。Intel在内的公司不断推出了多核、众核处理器,虽然包括AMD和英特尔等公司做了很大努力,开发者驾驭多线程的编程难度很大,现在学习异构开发的难度依然很大吗?开发工具、函数、算法成熟吗?

朱虎明:我在我们学校已经从事异构计算的科研和教学三年多了,就我个人的经验而言,不管是本科生还是研究生,初次接触异构计算时,仍然面临很大的学习门槛。

就异构计算的研究和开发而言,其发展的速度非常快。异构开发的工具、支持的语言和并行库也越来越多,而且不断有新的基于异构计算应用被研究。目前,异构计算的软硬件都在不断革新中,硬件架构几乎每年都在升级,经常不保证通用计算的向前兼容性。异构计算尽管开发了很多的应用,但是至今仍然没有一个广泛使用的通用异构计算库,使得每一次的异构开发几乎都是从零开始。所以我认为,异构开发的整个生态系统还需要进一步的完善和提高。

CSDN:对想学习或入手异构编程的开发者有什么建议吗?

朱虎明:今天的桌面级计算平台几乎都使用了异构计算的架构,但是由于软件开发的滞后性,只有一些应用支持异构计算平台,比如用于图像处理的Photoshop CS6、用于科学计算的Matlab和谷歌的浏览器Chrome23等。因此很多新的应用开发都需要异构计算人才,但是市场上懂异构计算的开发者却很少。我想造成这个现象的原因很多,其中一点可能就是社会还没有建立起异构计算的人才培养体系,而且市场上很少有适合初学者的学习资料。

基于以上的认识,我想如果要学习异构计算,可能要靠开发者自己多找资料、多实践和多思考。当然另外一方面,情况也在改变,比如CSDN就在网络上建立了“异构开发技术社区”,西安电子科技大学与AMD联合开设了异构计算的课程,并建立了课程学习主页(http://hpc.ee.xidian.edu.cn/html/course/2012/0725/33.html),将来还会在主页上分享更多的异构学习资料。

CSDN:对AMD举办异构开发者大赛的想法和建议?带队参赛感悟?

朱虎明:AMD举办异构开发者大赛是非常好的一件事情,我本人也是由于参加大赛从而了解异构计算,并开始深入研究异构计算并将其应用于我们的科研实践中,目前已经基于异构计算平台开发了卫星图像处理系统、数据挖掘系统和智能计算系统等软件。通过大赛,我们也认识了国内从事异构计算的很多专家学者,与他们的交流,提高了自己的水平。我本人也在AMD的支持下,开设了“异构计算的课程”,从2011年以来,已有数百研究生选修了这门课,通过理论课和实验课的学习,他们掌握了异构计算技术,并将其应用于他们自己的研究领域,取得了良好的效果。趁此机会,我也想感谢AMD提供了这样的机会。

异构开发者大赛已经举办了5届,应该说,与5年前相比,今天异构计算取得了长足的进步,但是,我还是希望AMD能够继续举办这样的竞赛,让更多不懂异构计算的人来学习异构计算,让懂异构计算的专家能够继续提高自己的水平。

异构开发者大赛已经举办了5届,我们参加了3、4、5三届,每次都取得了很好的成绩,我想,之所以能够取得这么好的成绩,首先是我们参赛的学生有学习的动力,由于我们实验室侧重于算法的研究,这些算法在求解大规模问题时经常需要数小时甚至数天,因此他们迫切需要异构计算理论来加速他们的算法。第二就是实验室良好的研究氛围,实验室经常有国内外学者前来访问和交流,使得我们能够及时掌握国内外的最新算法,这样每一次竞赛我们都是学术界最新的算法,保证了我们参赛作品的新颖性,比如这一次我就是和实验室公茂果教授合作,将他研究的最新成果与异构计算相结合。第三就是与AMD技术专家的及时沟通。在竞赛中,AMD会指定专家对每一个参赛队伍提供技术支持,我们有问题时会与AMD专家积极交流,从而保证竞赛的进度。最后一点就是参赛学生的辛勤付出,由于实验室科研任务多,日常工作时间学生都忙于自己的研究工作,竞赛作品主要依靠晚上、周末甚至节假日来完成。

注:本文由付江采访 张红月整理成稿。

用户界面设计攻略:设计师需注意的九大要点 Google Glass的竞争对手来了:看YC演示日的五款新孵化项目! GPU Saturday技术沙龙:OpenCL程序员眼中的下一代APU架构 黑帽大会演讲中国第一人:从攻到防,从白帽黑客到创业者 15个步骤创立技术公司,并收获千万用户(完结) CTO容易犯的三大错误 谷歌艺术计划:互联网能否取代真实的博物馆? Hadoop技术沙龙:Hortonworks技术研发总监展望Hadoop 2.0 Marissa Mayer:雅虎月活跃用户增长了20%达8亿 移动用户3.5亿 气死偷车贼:脑电波防盗技术,让偷车贼无计可施 TIOBE 2013年9月编程语言排行榜:Transact-SQL首次进入前十 前Oracle总裁Charles Phillips:商业软件领域的“乔布斯” 留住你的用户:8款第三方移动推送服务 人气最旺:主流移动应用创建工具大合集(一) 不要强迫用户注册,请让他们先试用产品 Eve:基于Python的REST API框架 想扩展你的数据库吗?那么先了解一下I/O 白帽黑客将现场爆料Android系统及框架漏洞 9月13日:程序员节,一起来过节吧! 欲与Siri、Google Now比高低:微软开始打造个人助理Cortana 【开源专访】禅道创始人王春生:覆盖项目全周期,回归管理的本质 携程无线创业者大赛成功落幕 梁建章为头名“快展”颁20万奖金 Bug报告:小角色,大用处! iOS开发者必备: 五大编程类工具 多核优化软件MCx释放EMC VNX闪存潜能 手把手教学:详解HTML5移动开发框架PhoneJS 快速学习新技术的几条建议 研发周报:Angular.js or Ember.js 谁将成为Web开发的新宠? 10款免费且开源的项目管理工具 Greg Pass:拯救Twitter的无名英雄 Cassandra杀回数据库排行Top 10,及需求Java 7的2.0版本 数据库问题 在同一个页面中,如何让SessionId产生不同的值。 MDI问题:如何在已show的子窗体中点击按钮来show一个另外的子窗体? 问一下xdjm~~~ 我我哦窝窝窝窝窝窝窝 一个记录输出的问题。。急急,,help me!!!在线等待。。。。。。 如何从服务器端下载文件到客户端? 高分求解:如何利用win2000的活动目录技术进行统一登录 有没有在datalist下分页的好方法? 数据窗口中如何得到某个字段在修改之前的值? 服务器事件报错 我想知道在哪可以下载 Microsoft Visual Studio 的中文版 着急的问题 也许是个简单问题 帮忙? 要判断_variant_t类型和CString是否相等,怎么做类型转换? 紧急求助!!!! 女友被抢!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 看看这句代码,在线等待。 请问如何将SqlDataReader类型转变为SqlDataAdapter类型? 寻找开发调试器的网上资源 我想知道在哪可以下载 Microsoft Visual Studio 的中文版 ===有关Datagrid模板列:在里面添加Radio控件,如何设置和获取它们的值[紧急,一定给分]=== 有没有人用过dtl.lib(database template library)编写数据库程序? 就差一点了 谁能回答我关于 Junit 的问题 谁能告诉我,mysql的update语句是否可以用正则表达式呢 关于maxplus的一个问题。 招工信息 ulimit -f 执行不成功为什么? 如何显示时间?? 寻找开发调试器的网上资源! linux下有没有类似windows下struct _finddata_t查找结构体的东西 100分求解pl/sql developer v5.0.1 的注册码! 为什么我的.nsf签名签不上,可能有哪些原因呢?请各位帮帮忙!! 给个匿名FTP站点做中转站。 刚才用了CButtonST,举爽,散分了。。 寻找开发调试器的网上资源! 急:为什么用iframe插入网页只显示一部分? --------开发工作流----------- 大侠们急救,高分给!!! 在98控制面板中发现MS DTC这项,请问它是干什么用的? 用recordset打开数据库的问题 帮忙? 告别美丽的初恋情人 本人开始学vc 请问一个定义全局变量的问题?? 字符比较的问题 用变量来建表的问题 簡單問題﹕請問怎樣用控件綁定數據(在線) !·#¥%施瓦辛格般的女生爱上你,该不该接受??? 建立怎样的数据库? 高中立体几何——线面问题边长相等的两个正方形ABCD和ABEF所在平面交于AB,M为BD上一点,N为AE,且BM=EN,求证MN垂直于AB.注:此题无图,若再副上一幅图来解再加分 世界各大洲人种的分布规律世界三大人种在地球上呈现小范围集中,且又零星分布的特点 标牌专用硅胶的具体参数? 不闭合回路中导体切割磁感线,导体是否产生感应电动势,如果有,从能量的角度如何解释?(例如:导体匀速切割,既然有电动势,则是否储存电能,若储存能量从哪来?若不储存可常把他等效为电 说一说现在三大人种主要分布在那些大洲,并分析其原因 这个PLC程序如何编?用PLC进行编程,用一个启动和停止按钮,按下启动按钮时,交替运行,按下停止按钮,停止运行.那个牌的PLC都可以, 整个电路的感应电动势为零时,其电路中某段导体的感应电动势不一定为0.为什么?关于能使用公式E=n·⊿φ/⊿t的情况,整个电路的感应电动势为零时,其电路中某段导体的感应电动势不一定为0. 三的人种分布在哪些大洲?三大人种分布在哪些大洲的原因?三大人种主要分布在哪些大洲? 并分析其原因. plc程序表判断怎么编 煤焦沥青里的主要成分是什么,是防水材料吗? autocad2008画矩形提示正交用rec然后输入第一点x,y空格,然后输入第二点x,y然后空格,然后本来就完事了,可是出现各正交提示,这是怎么回事,怎么去掉? 硅胶参数中的Tensile是什么? 2H2+O2=点燃===2H2O写出5个信息O.O由此化学式得出的 关于LED加电阻的问题5V300毫安的电源,亮一个灯,灯的电压是3V40毫安LED的,请问要加电阻是多少?能告诉具体告诉最好.8个LED灯 红色并联 电源5V 300HA 需要多大的电阻 世界主要三大人种出现的原因是什么?你能说一说三大人种主要分布在哪些大洲吗? 多边形对角线的规律n边形有45条对角线,求n. 如图所示的几种情况中,金属导体中产生的感应电动势为BLv的是( )A.乙和丁 B.甲、乙、丁C.甲、乙、丙、丁 D.只有乙 为什么有丁,它不应该没有电动势吗? autocad中什么是正交?正交有什么用? 多边形几条对角线? 下列函数中,y随x的增大而增大的函数是 ( )y=8-2x,y=﹣3x+5 y=﹣3+4x y=﹣5(3+x) 这幅图上是那个动漫里的情节求求各位了 多边形的对角线是指什么?多边形的对角是指( ),是如图2中的AC、AD 给出三个单项式a²,b²,2ab(1)在上面三个单项式任选两个加减,并进行因式分解.(2)当a=2010,b=2009 时求代数式a²+b²-2ab的值 在autocad中 平移一条线到一个矩形上 怎么捕捉到矩形上的点我在CAD上想画一个立方体 在画了矩形之后 画45度的斜线 想复制斜线到矩形上 可是找不到矩形的四个点 怎么捕捉到矩形上的点 启辉器和镇流器都是什么作用?启辉器和镇流器都起着什么作用?干什么用的? 给出下列四个函数:1、y=-x;2、y=x;3、y=1/x;4y=x^2..当x 红看绿色物体是黑 看蓝色还是黑? 在PLC中的有效操作数是什么意思.如何才能正确的应用有效操作数. 1/a+b怎么写成两单项式相减 如果只产生感应电动势,不是闭合回路,没有感应电流生成.会消耗能量嘛举个例子就是一部电瓶车把电瓶拿掉,骑起来会比同样结构的自行车费劲嘛(其余条件忽略成一致) 飞机在500m空中,以200m/s速度匀速水平飞行,发现正前方水平距离s2下方A点有一辆迪荡车,刚从静止开始以加速度为4的同向匀加速前进,释放一个炸弹,恰好炸中敌方车,求炸弹从释放到落地的时间, 有没有一百次函数 图像和性质? 混血人种哪个大洲最多 R1、R2是一个自治域系统中采用RIP路由协议的两个相邻路由器,R1收到相邻R2发来的信息,试求更新后的R1.表 R1 表R2 目的网路 距离 下一跳 目的网路 距离 下一跳N1 3 R2 N1 4 R3 N2 4 R3 N2 2 R4 N3 5 R4 N3 7 下列函数中,函数值y随x的增大而增大的是()A.y=1/2x^(-1)B.y=-x/3C.距离一定,未走完的路程s与时间tD.圆的面积s与它直径d的平方 人种最复杂的大洲是?如题 13 .R1、R2是一个自治域系统中采用RIP路由协议的两个相邻路由器,R1路由表如下图2所示,R1收到R2发送的如R1更新的三个路由表项中距离值从上到下依次为 [1分] 一道立体几何题(线面垂直的)AB垂直于平面a于B,BC为AC在a内的射影,CD在a内,若角ACD=60度,角BCD=45度,则AC和平面a所成的角为多少度? 根据下面故事的内容,体会画线部分的含义,在空白处填上恰当的语句.一个人历尽艰险去寻找天堂,终于找到了.当他欣喜若狂地站在天堂门口欢呼“我来到天堂了”时,看守天堂大门的人诧然地 一只蜻蜓在高空200米处,先以10米每秒的速度向上飞行6秒,后又以12米每秒向下飞行10秒,这时蜻蜓的高度为多少? 立体几何,线面垂直一题---急!在四面体ABCD中,AB⊥CD,AC⊥BD求证AD⊥BC 做冰糖葫芦怎样才能不化而且很白亮有什么精致的包装品吗 (1)以8m/s的速度飞行的蜻蜓能在0.7s内停下来 (2)以100m/s的速度着陆的航天飞机在10s内速度减为60m/s计算物体运动的加速度. 例题,立体几何,证线面垂直图丑会意.给一个正方体,E、F分别是BC、DC中点,求证AF垂直于平面D D1 E为什么不能这样证:DD1垂直平面ABCD→平面DD1E垂直平面ABCD→ABCD上的AF垂直于 平面DD1E与平面ABCD的 污水消泡剂的添加量是多少? LED路灯加电阻的问题?12V/的太阳能路灯的那种,为什么灯尾都要串一个电阻,起什么作用?如果是这样,等于把灯头的功率增大了,无用功率增大.如果三颗一串,再加一大的限流电阻会不会更好,哪个 为这张图写一句话.一句经典的. 水性涂料消泡剂的使用方法和添加量? 闭合电路一部分导体切割磁感线产生的感应电动势 图中孩子荡秋千让孩子写一句话 为什么电路不用闭合只需要就有感应电动势?可是感应电流不可呢? 高一立体几何线面垂直问题斜边为AB的RT三角形,过A作PA垂直面ABC,AM垂直PB于M,AN垂直PC于N求证 PB垂直面ANM 怎样使冰糖葫芦外面那层糖不化 没有感应电流时还会有感应电动势么? 发光二极管并联电阻为什么有的亮,有的不亮? 求制作冰糖葫芦不化糖,保存的时间长的做法.知道需要加柠檬酸,和别的东西,希望有具体的比例最好. 检验是否含C H O检验某化合物是否含有碳、氢、氧三种元素,在该物质燃烧前后还必须进行的是1.用带火星的木条检验;2用无水硫酸铜建安;3用澄清石灰水检验;4称量反应物与生成物 选择序 若干个发光二极管并联后,为什么总有一个或几个不亮?我没有加电阻,只是简单的并联在一起.有没有事二极管本身阻值不一样,所导致的电流不同的问题?如果是的话,该如何解决? 求冰糖葫芦不化糖配方谢谢 什么是同种性质的力. 村官缘何频成大贪:占据大量资源 监管李娜“最佳赛季”绽放第二春 再夺大满李娜自评2013“最佳赛季” 感谢团国务院宽进严管激发市场活力 对监管提媒体揭胡万林江湖路:曾在新疆治死13湖南一菜农与市场保安争执后死亡 后者万人排舞展演(图)入秋刚满月 秋天已过半 清晨气温跌破德媒曝美国10年前已监听默克尔通讯 温州文保单位公开招租民办博物馆 11恒大回国孔卡最受球迷欢迎 里皮微笑挥亚锦赛中国女篮首战失利 70-72遗廊坊数百学生不满校园管理聚集抗议 官报告称政府网站影响力偏弱 缺少对热点秋阳退去秋雨来 周四启动阴雨模式失踪小驴友尸体终于找到 距发现头骨处乐清“袭胸男”深夜骑车专找年轻女性下有困难“拨拨就灵” 金华启动8890每年10月也是雷电高发期 西湖五处码杭州近期昼夜温差超10℃ 早晚记得添美媒:监听活动曝光迫使美停止炒作“中网友质疑牛饮食影响酸碱度 专家称云南郑州市区南部将新建12条路 3条主干“我们一起插队的岁月”引共鸣 倡议郑郑州“猎豹”行动抓获143人 捣毁盗郑州警方南三环快速路严查闯禁行 半小郑州黄河铁路大桥16日退役 启用郑焦高清:看三任黄河铁路桥百年沧桑三全老总陈泽民晒小学毕业照 郑州到处郑州连续两日高温天气 今天或迎降雨王菲抱婴儿姿势专业 抚摸小毛头母爱爆地铁试点改进闸机让逃票者无机可乘阿里赴美上市引华尔街围观“后阿里时代”国内电商格局如何改变?上海多部门联手不间断整治群租韩正听取“一号调研课题”汇报中国南方多地将现暴雨 华北等局地降温普京在乌克兰问题上态度缘何发生重要转孙俪赞邓超似超人 等等妹妹小名“小花铸造宝石之梦她的珠宝物语以跨界之名, 爱数码更爱生活
备案号:鲁ICP备13029499号-2 说三道四 www.s3d4.cn 说三道四技术文摘