说三道四技术文摘-感悟人生的经典句子
说三道四 > 文档快照

开源的对决,MapR将Apache Drill引入企业应用

HTML文档下载 WORD文档下载 PDF文档下载
短短两年,Apache Drill当下已获得超过40个公司的支持和贡献,而在近日,更被MapR加入其公司的大数据平台,作为开发者预览版展示给用户。

【编者按】近日,MapR正式将Apache Drill整合进该公司的大数据处理平台,并开源了一系列大数据相关工具。时至今日,在高度竞争的Hadoop领域,开源已成为众多公司的利器,他们纷纷通过贡献更多的代码来保护自己,也通过开源来攻击其它公司的开发性。就这个事件,Derrick Harris在Gigaom上做了简要分析。

以下为译文

近日,MapR,Apache Drill项目的创建者,已经将该技术的初期版本整合到该公司的大数据平台。该公司称这个版本的Drill为0.5,以“开发者预览版”的方式展示这个SQL查询引擎。

Drill最初公布是在 2012年8月,专注于SQL on Hadoop,当下已经取得了很大的进展。在SQL on Hadoop领域,各个公司可谓是八仙过海各显神通——Cloudera的Impala、Hortonworks的Hive迭代,以及各种各样的初创公司和开源项目,包括当下炙手可热的Spark社区。

然而MapR的Chief Marketing Officer Jack Norris表示,Drill是个值得期待的技术,因为它是其他SQL on Hadoop引擎所有特性的“父集”。同时,Drill的主要特性在于,在数据被加载到数据库之前,它可以快速的生成结构模式,这主要因为取代将数据转换成其他模式或者表格,Drill保持原始的格式。因此,Drill也无法满足那些期望将数据转换成特定格式的用户需求。

MapR产品管理负责人Tomer Shiran表示:“对比其他SQL on Hadoop项目,我们更有信心将Drill做好。”

尽管该公司当下的大数据平台已经整合了Drill,但是这个技术并不是MapR产品的唯一选择。MapR的大数据平台同样整合了Impala和Hive堆栈,甚至通过更紧密的集成支持HP的Vertica分析工具。


Tomer承认:“通过支撑更多的技术及贡献大量的代码,这将作为MapR重塑专有Hadoop供应商形象更广泛战略的一部分。”Norris更表示:

当下,MapR发行版中所有关系到应用程序层组件都使用了开源技术或者标准的API。在将来,MapR将尽可能开源更多的技术。MapR会用实际行动证实这一点,比如这周二,公司就开源了大量 Hadoop平台的资源管理功能,并且提交了MapR的磁盘IO分配方法,以及作业调度机制到Apache。

Drill已经得到超过40个以上公司的支持和贡献,其中包括Cisco、LinkedIn以及威斯康星大学。当下,开源已经被证实为产品提升的有效途径,通过众包的方式它可以喜迎大量的工程师致力开源。同时,在高度竞争的Hadoop领域,开源更成为捍卫自己的盾牌,以及在开放性上攻击其它公司的利剑。

原文链接: SQL-on-Hadoop tech Apache Drill is ready to use and part of MapR’s distro(编译/仲浩 审校/魏伟)


免费订阅“CSDN云计算(左)CSDN大数据(右)”微信公众号,实时掌握第一手云中消息,了解最新的大数据进展!

CSDN发布虚拟化、Docker、OpenStack、CloudStack、数据中心等相关云计算资讯,     分享Hadoop、Spark、NoSQL/NewSQL、HBase、Impala、内存计算、流计算、机器学习和智能算法等相关大数据观点,提供云计算和大数据技术、平台、实践和产业信息等服务。     

备案号:鲁ICP备13029499号-2 说三道四 www.s3d4.cn 说三道四技术文摘