说三道四技术文摘-感悟人生的经典句子
说三道四 > 文档快照

Python正在取代R,成为数据科学界新宠

HTML文档下载 WORD文档下载 PDF文档下载
R是数据科学家历来选择的编程语言,但它正在迅速地让位给Python。最大原因是:Python更通用且相对容易学习,而R需要掌握复杂的编程环境。

R:不是真正的语言

人们学习R很困难的一部分原因是,它并不是一种真正的编程语言。John Cook是一位R专家,他曾说:“R是一个做统计的交互环境,不是一种真正的编程语言。把R看做包含有编程语言的交互环境会更有帮助。”

但正如Bob Muenchen强调的,R甚至对于那些精通SAS和SPSS数据统计工具的人来说都是困难的。关于R为分析师降低了复杂性的问题,还有待争议,虽然R包含宏和矩阵语言,此外,你还需要掌握像SPSS等工具。但是对于那些期待R去实现类似Stata的功能的人,他们注定要失望。

综合考虑,R的与众不同使它较难学习。

Python降低数据科学技术壁垒

然而,Python更加平易近人。一方面,各种各样的开发人员都熟悉Python并在广泛的应用领域使用它。不像R几乎只用于数据分析,一个开发人员在第一次编写他的网站脚本或其他应用程序时,就可以体验到Python。

随着企业竭尽所能地使用数据,他们也正在努力寻找合格的数据科学家。然而,正如Gartner的Svetlana Sicular所假设的,在本公司内对员工培训一些简单的大数据技术,比培训新雇佣的数据科学家复杂的商业知识更有效率。

Python”所向披靡“

但是,除了可以利用现成的Python开发者资源,用Python语言做数据科学的最大好处之一是:在不同的应用程序中使用一种编程语言所增加的效率。德克萨斯大学奥斯汀分校研究助理Tal Yarkoni解释说:“事实证明,使用一种语言来做所有的开发和分析的好处是相当可观的。一方面,当你可以用同一种语言做所有的事情的时候,你就不必一直提醒自己:Ruby使用blocks而不是comprehensions,在Python中得到数组的大小应当调用len(array),而不是array.length……

另外,你不需要再担心项目的不同模块采用不同语言的接口问题。没有什么比在Python中解析一些文本数据,然后将它转换成内部使用所需要的格式,最后才发现必须将它以另一种格式写到磁盘上,以便R或者MATLAB去做分析更烦人的了。只要使用单一的语言,所有这些开销都将消失。”

我们可以夸赞某个技术完美地解决了一个问题,但往往胜出的技术是解决一系列问题的通用工具。正如AppNexus优化和分析主管David Himrod指出:“AppNexus面临的最大挑战之一是如何让不同的员工使用相同的技术来工作。Python为具有不同背景的员工(尤其是工程师,数学家和分析师)提供了一种常见的、容易理解的语言,可用于公司将新功能进行标准化。”

使用Python的主流数据科学

相比R丰富的数据分析能力,Python尚有很多不足,但是它正在迅速的缩小差距。请记住:Python成功的关键并不是它比R或其他分析工具能够处理更神秘的功能,而在于它的平易近人和通用的性质。数据科学正在走出头号怪胎的领域,上个月在纽约举行的O'Reilly's Strata会议这一点尤为明显:过去的与会者多是学术领域的博士,现在则是关键的业务分析师和其他被企业要求去弄清楚大数据业务的人。

相比R,这种新的,早期的“数据科学家”,将更多地使用Python。Python使用起来相对简单,而且他们可能已经将其用于一个项目中了。至于在其他市场,相比于那些功能强大但复杂的工具,熟悉或者容易学习的工具更容易取胜。

Python Displacing R As The Programming Language For Data Science(文/任云 审校/周小璐)

跟我学用ActiveBar-VB资料 VB获得IE的版本号 VB获得Windows启动方式 VB获得打印机驱动程序的设定 VB获得当前计算机上的区域设置 VB获得当前用户名 VB获得分区信息并判断是否有CD VB获得某个文件夹下的所有子目录 VB获得驱动器的卷标 VB获得系统中的所有字体列表 VB获得系统中鼠标的键数 获取驱动器信息-VB资料 文章主题: 获取桌面图象 -VB资料 计算两个日期间的工作日-VB资料 监视外部程序的运行情况-VB资料 检测文件是否存在 -VB资料 检测系统驱动器-VB资料 检查电子邮件地址输入的有效性 -VB资料 检查硬盘空间 -VB资料 将数据转换为内存二进制形式字符串(模拟CV?和MK?$两组函数) -VB资料 禁用 Alt-Tab 或 Ctrl-Alt-Del -VB资料 禁止使用 Alt+F4 关闭窗口-VB资料 绝非玩笑:VB7将完全面向对象 拷贝磁盘 -VB资料 控制Ctrl+Del+Alt键-VB资料 快速编辑VB程序技巧 快速查找或替换文本中的字符-VB资料 快速建立目录 -VB资料 快速交换整数 -VB资料 快速注册/注销动态链接库或控件-VB资料 理解面向对象编程 -VB资料 快救救我 难道MSDN也有错误 哪位大侠知道怎样打印stringgrid?小弟成分感谢,并高分相送 怎样才能从邮件中读出邮件的接收日期? 字符输入老是重复怎么回事 请问谁用C++编写过MP3的程序? 请问各位高手,给小弟介绍几个比较好的计算机图书的网站吧。 Access 2000不识别{ts '2001-06-21 21:14:01.890000'}中的.890000,如何解决? 如何得到webbrower控件下载消息?(比如下载*.zip文件) 难题一条 MTS怎么只能生成*.pak 和*.dll,却不能生成Clients子目录及在客户端安装的*.exe COM组件安装! PB 的新问题,有性趣请进!!!! 新手,键值问题 这样的问题没人会????? 大家帮忙看个程序 ACCESS数据库的小问题。 怎样使自己的问题成为热点问题的绝招! 关于c++builder中scanline的应用 跨数据库查询,请教各位高手! 这样的问题也没人会????????????????? 如何使用QuickRep制作简单报表?不牵涉任何DataSet的 关于Transaction的问题 请问 ListCtrl Item里的 Checkbox 被点击时对应的消息是什么? 100分~~100分~~高分求购。。。我也‘倾家荡产求购优秀系统分析案例’(paste from yyzh)。。。100分~~ 全中文的用Rose做的实际项目的UML模型! 救命!!我的机器不能下载东西了,怎么回事?? 求教邮件编程问题,邮件客户端如何实现“在服务器端保留备份的功能“? ciscoworks 各位大哥大虾,VC下如何用ADO连SQL SERVER?(急) ShellExecute和CreateProcess有什么区别? 关于海量数据、最有效率的排序、硬盘缓冲与映射、专业数据库的讨论 如何用VB编启动是可以带参数的程序呢?(例如:我自定义了一种文件,双击用我的程序打开,程序自动会打开这个文档 昨天我过生日,今天分蛋糕给大家 请问哪有《java图形设计2Swing篇》可以下? 我要用一个数据库去实时访问另一个据库,我该怎么办 URLghj1976@csdn.net----别吓我,有请您老人家! 谁给我介绍一下sql server7.0教材的比较好的下载网站,我给他20分。 我都急死了,到搜索引擎里搜到的好几个站点都不能用,到底哪儿可以当到3DMAX? 谁有写的比较好的邮件收发程序? 一个微软证书的私钥问题 微软证书的私钥问题 求助,简单问题 男人最快乐的十个瞬间! solaris下装oracle8.1.6遇到jre环境问题 怎抹加分?我准备给别人加40分,可我最多只能加20,请问另外20分怎末加分,为此我可能已得罪了一些人了。 请教下载的问题 如何在运行时动态修改Quick Report的打印机设置? 怎样做一个接受拽拖的LISTBOS(例如,把资源管理器里的文件拖到上面,就自动增加一项 ,就是拖的文件名) 怎样才能隐藏在ctrl+atl+del中进程列表中的项目啊 用C写DLL 括号x减去y的平方等于9括号x减去y的平方等于5求x的平方加y的平方与xy的值 (2-根号3)的2013次方乘(2+根号3)的2014次方是多少?这种题怎么算? 试求代数式2x的平方+x-3的最小值,并求出当x取何值时,该代数式取到最小值, 已知x的绝对值等于3括号y加1的平方等于4且xy小于0求x加y的值 (7-5根号2)的2013次方乘(-7-5根号2)的2014次方 利用配方发求:当X取何事,代数式2X^2-4X+6有最小值,是多少?代数式有最大值吗?为什么? x的一元二次方程x的平方-4x+m-1=0有两个相等的实数根,求m的值 (根号3+根号2)的2013次方×(根号3-根号2)的2014次方 代数式2X的平方-4X+1的最小值为多少 已知关于x的一元二次方程x2-4x+m-1等于0有两个相等实数根,求m的值及方程的根 (2倍根号2-3)的2013次方×(2倍根号2+3)的2014次方 说明代数式2x的平方-4x-1总大于x的平方-2x-4. 已知关于x的一元二次方程x平方-4x+m-1=0有两个相等实数根,求m的值及方程的根. |根号3-2|+2013的零方-(-三分之一)的负一次方 +3tan30°带上过程! 代数式根号下(X^2+4)+根号下[(12-X)^2+9]的最小值. 12开根号3次方等于多少? 简化√x^4+x^2y^2(x≤0)也就是根号x的四次方+x的二次方*y的二次方,且x小于等于0 代数式根号(x平方+4)+根号[(12-x)平方+9]的最小值为多少?这个题目是刚开学初三的老师布置的~ 极限lim(x趋向无穷)(x平方+x)/(x的四次方-3x平方+1) 2根号3×1.5开三次方×12开六次方=? 根号a的三次方等于多少?根号2y分之x三次方等于多少?(y<0) 求lim(x趋向于0)(1/x-1/( e的x次方-1))的极限 化简:log(2根号3)(144乘根号12开4次方) 已知根号(2x-y)的平方=1,立方根(x-2y)的三次方= 1根据算数平方根的意义,由根号(2x-y)2=1,得(2x-y)2=1,得2x-y=1 ①根据立方根的定义,立方根(x-2y)³= -1,得x-2y= 1 ② 由①+②,得3x+3y=2,解得x-y=2/3以 已知lim x→0 [sin6x+xf(x)]/x^3=0,求 lim x→0 [6+f(x)]/x^2?为什么不可以这样解 因为lim x→0 [sin6x/(6x)]=1所以,lim x→0 [sin6x+xf(x)]/x^3=lim x→0 [6x+xf(x)]/x^3=lim x→0 [6+f(x)]/x^2=0这哪里错了? 比较根号5开5次方 根号3开3次方 根号2的大小 已知根号(2x-y)的平方=1,立方根(x-2y)的三次方= 1 求x-y的值根据算数平方根的意义,由根号(2x-y)2=1,得(2x-y)2=1,得2x-y=1 ①根据立方根的定义,立方根(x-2y)³= -1,得x-2y= 1 ② 由①+②,得3x+ 求极限lim(x->0)(sin6x-6x)/x^3,自学中求助:求极限lim(x->0) (sin6x-6x) / x^3 3分之1(1-根号81)+根号2次方-1 代数式根号x2+4+根号(12-x)2+9的最小值清楚一点 求极限当x→0若lim[sin6x+x f(x)]/x^3=0,求lim[6+ f(x)]/x^2答案不重要.我只想知道为什么对第一个式子上下同除以x,为什么会是错的,错在哪,兄弟,我想问的是如果把[sin6x+x f(x)]/x,x^3/x (即同除以x)第一 已知a>0且a≠1,设f(x)=a的x次方除以(a的x次方+根号a),求f(1/10)+f(2/10)+…+f(9/10)的值.作业本上的= = 还有一题是 (1+2的﹣1/6)(1+2的﹣1/4)(1+2的﹣1/2)=?解题步骤最好清晰一点,太乱了看不清 = = 当X取正实数时,求代数式(根号下X^+4)+(根号下(X-12)^+9)的最小值 假设lim(x趋于0)[(sin6x+xf(x))/x^3]=0,则lim(x趋于0)[(6+f(x))/x^2]=?, 设函数f(x)=a的(x-1/2)次方,且f(lga)=根号10,求a的值 求代数式(根号下X^2+1)+(根号下(4-X)^2+4)的最小值 求极限当x→0若lim[sin6x+xnbsp;f(x)]/x3=0,求lim[6+nbsp;f(x)]/x2若lim[sin6x+xf(x)]/x3=0,求lim[6+nbsp;f(x)]/x2nbsp;nbsp;x→0nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;x→0 (1+根号2)的2012次方乘(1-根号2)的2013次方 代数式√(x^2+4)+√(x^2-24x+153)的最小值 √=根号RT听老师说要数形结合,具体怎么做忘记了 另外百度知道也有人提这个问题 但是答案是错的,我记得答案是个整数的 所以没必要复制了 lim(sinx/X2+3X)x趋于零时的极限这题等于多少, (根号3-根号2)的2012次方*(根号3+根号2)的2013次方 代数式根号2x-1分之x有意义的x取值范围是 lim(x→0﹚(3次根号下1+x2)/x2的极限 (2+根号3)2013次方与(2-根号3)2012次方乘积的结果是 使代数式根号2x-1分之1有意义.则x的取值范围? lim((1/x2)-(ctgx)2) x趋向0的极限值 根号2-根号3的2012次方乘根号2加根号3的2013次方 使代数式根号2x-1/(3-x)有意义的x的取值范围是 若m减三的绝对值加n加二括号的二次方等于零,则m加2n的和的三次方的值为多少? 若y=根号x-1+根号1-x,则x的2013次方+y的2012次方=? 代数式2x²-4x+6有最小值当x取何值,2x²-4x+6最小值是多少顺片教我一下怎么求 若a-b的绝对值加b加1的平方=0 则2a的2007的次方减3b的2008的次方的值为多少 若根号x+1+(y-2013)的根号=0则x的y次方=? 试说明代数式-2x平方+4x-18有最小值,并求出这个最大值,此时x为多少? 若a-1的绝对值与(b+2)的平方互为相反数,求:(a+b)的2008次方+a的2007次方的值 若根号x+1+(y-2013)的根号=0则x的y次方=多少 当X取何值时,代数式2X平方减4X加6有最小值.为什么, 已知xy为相反数,且括号x加二的平方减括号y加二的平方等于四,求xy的 (根号3-2)的2013次方·(根号3+2)的2014次方(根号3-2)的2013次方·(根号3+2)的2014次方 当X取何值时,代数式X的平方+2X+3取最小值,并求出最小值
备案号:鲁ICP备13029499号-2 说三道四 www.s3d4.cn