说三道四技术文摘-感悟人生的经典句子
说三道四 > 文档快照

利用Neo4j对电影评论进行深度学习情感分析

HTML文档下载 WORD文档下载 PDF文档下载
目前,国外一个电影网站允许用户提交关于他们针对某部电影是喜欢还是不喜欢相关信息的评论,随着这种类型评论的海量增加,依靠人工方法以及难以为继,情感分析技术被提到越来越重要的位置。

【编者按】随着互联网的发展,用户从以前的“读”网页转变为“写”网页,互联网上产生了大量的用户参与的,对于诸如人物、事件、产品等有价值的评论信息,而随着网络上评论信息爆炸式的增长,以人工的方法很难应付海量评论信息的收集和处理,情感分析技术随之产生,本文以电影影评为例,利用Neo4j对电影评论进行深度学习的情感分析。

一个电影评论网站允许用户提交关于他们针对某部电影是喜欢还是不喜欢相关信息的评论。充分挖掘这些评论继而生成有价值的元数据(针对相关内容的)将给我们提供一个难得的机会,它可以让我们以一个大众化的方式来理解用户对于这部电影的情感,这是一件很酷的事情。我们可以对主观内容做出一个客观的分析,这样可以使我们能够更好地理解产品和服务的趋势,可以为消费者做出更好的决策。

情感分析的数据模型

实现这些的主要障碍是我们的结构和转换数据。当前最先进的技术包括Naive BayesSupport Vector Machines以及Maximum Entropy。这些技术实施的挑战仍然是如何以最小的性能代价从文本中提取特征和结构化数据,这就是我决定要集中精力解决的问题。

我使用特征选择算法(详情点击这里),利用图形数据库Neo4j来解决数据转换和可用性的挑战,而最先进的自然语言解析算法的重点是关注句子结构,我决定为自然语言Grammar induction设计一个统计方法,主要是针对巨大文本语料库的概括,生成新特性,使用深度学习预测当下特性左边或右边的概率最高的新特性。

基于图形的NLP实例

我假设短语“one of the worst”作为一组文本的特征已经被提取。这个词提取的原因是这个短语有最大的统计学相关性,这意味着这个短语在父短语之后有最佳的匹配机会。使用Neo4j我们可以确定产生这一词的继承特性。


从根节点开始,它被加上“{0 } { 1 }”,路径里面” one of the worst将被解析为(the)->(ofthe)->(one of the)->(one of the worst)

这样的层次结构将会扩展为更多的可能性,如下图显示:


这种特征选择算法可以在不到一秒钟的时间从文本语料库中选择提取概率最大的相关特性和短语。这种技术对于情感分析具有非常重要意义的原因是这些模式节点可以连接到他们训练过的文本标签上,如下所示。


该算法的结果是任何自然语言文本可以在秒级解析,生成一个可用于任何分类算法的子图。这在很大程度上要归功于Neo4j图遍历。

开放源码演示

针对电影评论的例子,我选择了500个影评,包括正面和负面的标签,使用Graphify训练一个自然语言解析模型。在下一篇博文中,我将向你介绍展示如何做到比人类更好地电影评论分类,人类分类错误率为30%。

如果你想一睹为快,请点击Graphify Sentiment Analysis for Movie Reviews。

原文链接:Deep Learning Sentiment Analysis for Movie Reviews using Neo4j (编译/魏伟 审校/仲浩)

大数据之路不乏荆棘,然则其中的机遇却高于一切 iPhone销量令人意外:苹果Q3财季净利69亿美元 同比下滑 励志:12位早起的IT大佬们让小伙伴们都惊呆了 独家:苹果5周年限免神作,BADLAND开发者访谈 10亿次订阅!苹果Podcast的里程碑 免费利器Unity 4.2正式发布 支持WP8、Win8和BB10 SDCC 2013:Pinterest首位中国籍工程师两场演讲议题确定 甲骨文公布中国首届“Duke选择奖”名单 Moco、X幻想、开源中国获奖 直接拿来用,10个PHP代码片段 编程的未来 数据将成为主角 OpenCL 2.0发布,带来更强悍的异构计算能力 代码审查方式大调查 辅助工具居首(信息图) 一网打尽当下NoSQL类型、适用场景及使用公司 初创公司Treasure Data:每天处理7000亿行数据的20万次查询 豌豆荚王俊煜:将推支付SDK 与开发者3:7分成 英特尔-百度移动应用测试中心(MTC)正式启动 Intel将在2014年为数据中心用户定制低功耗SoC芯片 情绪低落?没事,让计算机来帮你! 水果生意难做 前新浪架构师徐佳转行试水挖煤 思考软件开发中的快与慢 Apache CouchDB注入新鲜血液,整合分布式技术 CSS Shapes:Web设计人员的新工具 Android 4.3正式发布:四大新功能一览 史玉柱的创业经验谈 3G门户和GO桌面:海外推广的生意经 系统级编程语言性能大PK D语言成首选 解读Facebook第二季度财报 移动业务风生水起 如何避免失败,像Google一样玩转大数据 首届游戏运营技术论坛隆重开幕,共论大数据时代的游戏运营之道 OpenStack Swift遇到了Erasure Code 微软Win7 IE11开发者预览版发布 开始改进开发工具讨好开发者 ActiveReport问题!!!! 隐藏主窗口(跟以前的贴子不一样)请指教 关于下载 一个问题,一定给分! 关于VB的讨论 如何用ASP连接二个表(急) 改TstringField后的问题怎么解决? 敬请关注!vb数据库问题! 女友长的漂亮真的会短寿? 快救救我 难道MSDN也有错误 哪位大侠知道怎样打印stringgrid?小弟成分感谢,并高分相送 怎样才能从邮件中读出邮件的接收日期? 字符输入老是重复怎么回事 请问谁用C++编写过MP3的程序? 请问各位高手,给小弟介绍几个比较好的计算机图书的网站吧。 Access 2000不识别{ts '2001-06-21 21:14:01.890000'}中的.890000,如何解决? 如何得到webbrower控件下载消息?(比如下载*.zip文件) 难题一条 MTS怎么只能生成*.pak 和*.dll,却不能生成Clients子目录及在客户端安装的*.exe COM组件安装! PB 的新问题,有性趣请进!!!! 新手,键值问题 这样的问题没人会????? 大家帮忙看个程序 ACCESS数据库的小问题。 怎样使自己的问题成为热点问题的绝招! 关于c++builder中scanline的应用 跨数据库查询,请教各位高手! 这样的问题也没人会????????????????? 如何使用QuickRep制作简单报表?不牵涉任何DataSet的 关于Transaction的问题 请问 ListCtrl Item里的 Checkbox 被点击时对应的消息是什么? 100分~~100分~~高分求购。。。我也‘倾家荡产求购优秀系统分析案例’(paste from yyzh)。。。100分~~ 全中文的用Rose做的实际项目的UML模型! 救命!!我的机器不能下载东西了,怎么回事?? 求教邮件编程问题,邮件客户端如何实现“在服务器端保留备份的功能“? ciscoworks 各位大哥大虾,VC下如何用ADO连SQL SERVER?(急) ShellExecute和CreateProcess有什么区别? 关于海量数据、最有效率的排序、硬盘缓冲与映射、专业数据库的讨论 如何用VB编启动是可以带参数的程序呢?(例如:我自定义了一种文件,双击用我的程序打开,程序自动会打开这个文档 昨天我过生日,今天分蛋糕给大家 请问哪有《java图形设计2Swing篇》可以下? 我要用一个数据库去实时访问另一个据库,我该怎么办 URLghj1976@csdn.net----别吓我,有请您老人家! 谁给我介绍一下sql server7.0教材的比较好的下载网站,我给他20分。 我都急死了,到搜索引擎里搜到的好几个站点都不能用,到底哪儿可以当到3DMAX? 谁有写的比较好的邮件收发程序? 一个微软证书的私钥问题 微软证书的私钥问题 解下列不等式:1 3x-4>11 2 5(x+6)4x 3 x+9>2x-4 4 15-9x小于或等于10-4x5 3分之2x-1小于或等于4分之3-4x 6 2分之3x+2+1>2分之5+x x的平方加x减12大于0解不等式 函数f(x)=x(x-m)2在x=2处有极大值,则常数m的值为?为什么没有2呢? 解关于X的不等式a(x-1)除以x-2>2,(其中a小于等于1). 已知关于x的不等式kx平方-(k平方+1)x-3<0的解为-1<k<3,求k的值 已知函数fx=x(x-c)²在x=2处有极大值,求常数c 设不等式x平方加二x减三小于等于零的解集为A,不等式负x平方加二x加十五大于零的解集为B,试求A∪B,A∩B 已知关于x的不等式k的平方减kx大于x加2的结尾x>-1|2,求实数k 的值 求极限lim x→+∞[√(x+a)√(x+b)-x]注意:是根号下(X+A)(X+B)-X,为表示明白我展开了最后那个X是在根号外面的得0的是在胡说 解不等式组{上面为x^2减6x+8大于0下面为x+3/x减1大于等于2 急 若关于x的不等式,根号下2x减x的平方大于kx, 解集是(0,2】 则k的取值范围 lim((a^3+b^3+c^3)/3)^(1/3)的极限x趋向于0lim((a^x+b^x+c^x)/3)^(1/x)我太搞笑了是这个 解不等式 -6X平方-X+2大于等于0 x平方减四x加一等于零. 洛必达法则求极限:lim x→0 a^x-b^x/x(a>0,b>0)如题 解不等式-6x方+x+1大于等于0 x的平方减四x加一等于零怎么样韦达定理求解! 请帮忙求极限:lim[(a+x)^x-a^x]/x^2,x趋于0.答案是1/a.但不知过程.题目是出给微积分只学了第一章的同学出的,不能用什么洛必达法则或泰勒公式之类的 不等式-1小于等于5分之3X+4小于等于2的所有整数解之和为 已知函数f(x)=mx/(x的平方+n) ,m、n都属于R,在x=1处取得极大值21.求函数f(x)的解析式2.求函数f(x)的极大值 求极限lim[(1-x)^10-1]/[(1-x)^11-1]x趋近于0 如果关于x的不等式 -13分之(3x+a) 若函数f(x)=x(x-c)^2在x=2处有极大值,则常数c的值? x趋向于1求lim(x/x-1)的极限 如果关于x的不等式(3x+a)/(-13) < (3-x)/2的解为7,求a.1楼:6x+2a>13x-39 7x 设函数f(x)=x(x-a)的平方在x=2处有极大值,求实数a的值. lim—> -1. X^2的极限存在吗? 已知关于x的不等式(3x+a)÷13>(x-3)÷2的解集为x<7,求a的值十分钟内回答给10财富值 已知实数a≠0,函数f(x)=ax(x-2)的平方(x∈ R),若函数f(x)有极大值32,求实数a的值 求lim x[(√1+x²) -x] 的极限,x→﹢∞ 已知关于x的不等式(3x+a)/13大于(x-3)/2的解集为x小于7,求a的值已知关于x的不等式(3x+a)/13大于(x-3)/2的解集为x小于7,求a的值 已知函数f(x)=x(x-c)的平方,在x=2处有极大值,求c的值. 极限:lim(x->2)1/(x-2) 已知关于x的不等式-13分之3x+a<2分之3-x的解集为x<7,求a的值. 若函数f(x)=x(x-c)2在x=2处有极大值,则常数c的值为 lim(1+x/2)^x+2 求极限x→∞ 2分之1-3x大于等于5解不等式 若函数f(x)=x(x-c)^2在x=2处有极大值,则常数c? lim (x→∞) ﹙1+2/x)^x+2 求极限 解不等式-3小于1-3x小于等于2大家不好意思,我题目打错了是-3小于1-3x/2小于等于2 已知二次函数y等于a括号x+h括号平方,当x等于2时有最大值和次函数的图像经过(1,-3)求此函数的解析式, lim(1/(x+1)+1/(x^2-1)) x->-1 求极限 X平方减〔a加一〕x加a小于等于零.解不等式. 已知点A(2,1)在函数y=a的平方x-x+1的图像上,则a等于? 求极限lim(1-2/x+3/x^2)^x 如果关于X的不等式A减1括号再乘以X小于A加5和2X小于4的解集相同,求A是多少 在平面直角坐标系中画出函数y等于x平方2减4的图象 求极限lim(x->0)((a^x+b^x)/2)^(1/x)有没有简略的步骤?a,b>0 求不等式,3乘以a的3次方减a的平方括号除以a小于a乘以a加2括号乘以a减2,快 f(x)=第1个 -1 X小于-1 第2个X的平方 X大于等于-1小于等于1 第3个1 X大于1 求连续性并画出函数图象f(x)=第1个 -1 X小于-1 第2个X的平方 X大于等于-1小于等于1 第3个1 X大于1 求连续性并画出函数图象 求极限lim x-0 a^x-b^x /x (a〉0 b>0) 不等式x的平方减x大于等于0的解集为? 解不等式 x的平方减x加a减a的平方小于0 在图所示的直角坐标系中,画出函数y=-1/2x的平方的图像,并根据图像判断当-2大于等于x大于等于3时,函数 是否有最大值和最小值?若有,请求出来 先阅读下面例题,再按要求回答 例题:解答一元二次不等式X的平方-9大于0 因为X的平方-9等于(X+3)(X-连接上面所以(X+3)(X-3)大于0 由于有理数法则“两号相乘,同号得正”有(1)(X+3)大 若a-1的绝对值加b+3括号平方求不等式x-a大于0 设a> 0,函数 f(x)=(ax+b)/(x^2+1),b为常数.证明:函数f(x)的极大值设a> 0,函数 f(x)=(ax+b)/(x^2+1),b为常数.(1)证明:函数f(x)的极大值点和极小值点各有一个(2)若函数的极大值为1,极小值为-1,失球a的值。 解不等式组1/2x>1/3x和4x-3≥1 解关于X的不等式:X的平方减5X加6大于零 函数 f(x)=x(x-m)^2在x=2 处有极大值,则常数m的值
备案号:鲁ICP备13029499号-2 说三道四 www.s3d4.cn