说三道四技术文摘-感悟人生的经典句子
说三道四 > 文档快照

《近匠》豌豆荚李大海:用搜索敲开手机娱乐平台之门

HTML文档下载 WORD文档下载 PDF文档下载
《近匠》第48期:不久前,豌豆荚发布了"应用内搜索"技术协议。初步提供了对应用内搜索的检索、收录和调起标准。还同步上线了“应用内搜索”接入申请入口。豌豆荚已不再是简单的应用平台,逐渐变成了娱乐搜索中心。

2014年3月,豌豆荚发布了垂直应用搜索的"应用内搜索"技术协议。初步提供了对应用内搜索的检索、收录和调起标准。同一时间,豌豆荚同步上线了“应用内搜索”接入申请入口。应该说搜索是豌豆荚的重要战略之一,而开放接口的一个重要原因在于,在已经培养一段时间的用户习惯后,豌豆荚的深度用户已不满足于现有应用的内容。同时,部分通过豌豆荚分发的应用已经开始与豌豆荚接触希望成为应用内搜索的来源之一。

应用内搜索的意义在于,像当年的Web网站一样,试图将移动互联网打通,使手机应用之间的关系,不再像现在一样是一个个的信息孤岛,而是可以通过搜索将信息内容串联起来。此前,Google在Android 4.4中推出的App Indexing便试图做到这一点,即将应用内容URL化,方便被搜索引擎抓取。而作为一家应用平台,着力打造应用内搜索,除了能从侧面提高被调起应用的下载量,有利于增强豌豆荚分发优势外,还可以打破各家内容的瓶颈,将视频、 电子书等内容在搜索内进行聚合,探索移动搜索的同时去发现渠道市场的新形式。

那么,豌豆荚在应用内搜索方面都做了哪些实践?应用内搜索技术在国内目前处于哪个阶段?又有哪些机遇与挑战留给开发者?针对这些问题,CSDN近日对豌豆荚搜索平台技术负责人李大海进行了专访。


CSDN:请简单介绍一下你的工作经历。

李大海:我2006年毕业于北京大学基础数学系,之后加入了谷歌中国,在谷歌待了四年多以后,跟当时的谷歌北京工程副院长刘俊一起创业做云云网。去年 8 月来到豌豆荚,负责搜索业务方面的事情。目前,我的主要工作是跟着搜索平台团队一起为公司的搜索产品提供技术支持。

CSDN:能否介绍一下豌豆荚的搜索技术团队?

李大海:豌豆荚早在2012年就开始做应用搜索,团队是按照典型的搜索引擎架构来分工的。工作内容包括爬虫、后台的数据处理、检索、排序,以及对用户意图的理解等。当然,随着公司业务的变化,我们的团队也一直在变。随着业务功能的增加,团队的规模也在不断壮大。 

CSDN:今年你们的工作取得了哪些成绩?

李大海:今年是我们从应用搜索向手机娱乐搜索转变的过程,这个过程有很多阶段性成果,比如我们的电子书、视频以及壁纸搜索,在线上服务了很多的用户。这些业务的变化促使我们在人员的规模和分配上也作出了一些调整。

CSDN:豌豆荚现在所做的应用内搜索是一个什么样的体验?

李大海:我们是把App的内容做了一个索引,给用户提供一个完全直达的体验。以电子书为例,用户通过搜索找到自己想看的书,豌豆荚可以直接把用户带到相应的 App 中去(比如《多酷书城》),你可以免费试读也可以下载。而这些 App 则变得更像传统互联网的网站,不再是信息孤岛。

CSDN:现在一些巨头也在向应用内搜索方向进行尝试,请问你怎样看待这种现象?在你看来,应用内搜索业务在竞争中得胜的关键是什么?

李大海:应用内搜索是一个非常新的领域,从产品形态上来看,它一定是基于手机使用场景发展起来的产品。豌豆荚一直专注于移动使用场景,为用户打造简单有爱的手机应用,我们也是第一个把应用内搜索产品化的公司。我们看到有越来越多的公司认可这件事,并且加入到这个领域当中,这是非常令人高兴的现象。说起应用内搜索的关键,我认为以下三点比较重要:全面、准确、情景化。尤其是全面、准确,这是用户愿不愿意用你的搜索产品的关键。另外,数据的积累客观上也能形成竞争的壁垒。豌豆荚在移动领域积累了4年的数据,这正是我们的优势。

CSDN:这样看来,豌豆荚已不再是一个单纯的应用平台?

李大海:是的。其实我们最终想做的事情是一个手机上的综合的内容搜索,把手机娱乐场景下的所有内容全面建立起来。当然,这需要一些时间,让用户对产品的认知慢慢改变。

CSDN:前不久,豌豆荚与《猫眼电影》合作,提供基于场景的搜索内容反馈。在你看来,理想的场景推送是一种怎样的体验?

李大海:我认为,理想的场景推送就是准确把握住用户需求。在搜索的场景下,我们知道用户需求后,再根据其他一些条件去判断,成功率和准确率会高很多。举个例子,一个智能的生活类搜索引擎,在用户晚上十点,以“川菜”为关键词进行搜索时,应当结合用户所处的位置,为用户提供附近能吃宵夜的川菜馆,而不是那些虽然流行但已经关门了的馆子。这就是所谓的“智能”,它不是虚无炫酷的,而是对用户需求的的准确判断。豌豆荚最近引入了电影票门类,在搜索最近热映的电影时,比如《后会无期》,用户可以直接点击第一条搜索结果开始选座购票,这样,用户会被直接带到猫眼电影 App 中,整个流程是无缝、流畅的。


CSDN:应用内搜索用到了一个关键技术,即Deeplink,能否简单介绍一下这一技术?

李大海:Deeplink在互联网发展的早年就提出来了,当时的概念是与首页对立的,“藏在首页之下的页面”,再后来,搜索引擎行业把这个概念跟爬虫容易抓取到的内容相对起来。我们认为,还有更多的互联网内容是藏在这些页面之后没被人看到的,也就是说,我们看到的信息只是冰山一角,更多的数据实际上是藏在冰山的下面的。现在,Deeplink更具体的是指App里面的内容。我们知道,App是组成移动互联网的一个个细胞,它对应着以前的网站。但它与网站不同的是,App的内容是孤立的,没有超链接的技术规范。所以,想知道App内有哪些好的内容从 App外部是不太容易做到的,这些内容隐藏得很深。针对这一情况,人们开始找出一些技术方案来解决这一问题,这些技术解决方案统称为Deeplink。

CSDN:能否举一些例子,具体讲讲Deeplink的实现原理?

李大海:现在已经有很多公司在定义自己的Deep Link规范,比如豌豆荚的应用内搜索技术协议(http://developer.wandoujia.com/search),Google的App Indexing(https://developers.google.com/app-indexing),Quixey的AppURL(http://appurl.org)和Facebook的App Links(http://applinks.org)等。

这些协议都有一个共同特点,通过某种方式代替URL来描述资源,为了与普通的(Web)URL对应,我们姑且称之为App URL,再使用第三方工具把App URL解释为Android系统或其它移动操作系统的原生App调起方式,打开App内对应的资源。这些协议要变得可用,都需要App首先能支持系统原生的外部调起方式。在Android上,这就是使用intent-filter来响应特定的intent。

拿豌豆荚的应用内搜索技术协议来说,我们使用Microdata+扩展的Sitemap来结构化地描述内容资源(这里的内容资源有比如视频和电子书等),在每个资源的描述文件中使用标签xhtml:link来描述该资源在Android上对应的打开方式,当这个资源在搜索结果中被点击时,标签xhtml:link中的内容会被豌豆荚翻译成相应的intent,让Android系统调用合适的Action。

下面是一个具体的例子:


这个视频的App URL就是“example://play/movie/xxx”,在调用的时候,豌豆荚会向系统构造一个intent,这个intent的action是"android.intent.action.VIEW",category是 "android.intent.category.DEFAULT",scheme是“example”,host是“play”等。这样,只要App在manifest文件中通过intent-filter注册了这样的intent响应能力,就能够顺利调起这个视频,进而开始播放了。

CSDN:这个过程当中会不会引起一些安全性的问题?

李大海:首先,从豌豆荚下载的应用我们会进行严格的认证,我们的应用内搜索本身也是在这些验证、审核过的应用的基础上把里面的内容提供给用户。用户能够搜索到这些内容,就表明这个内容本身的安全性是有保证的。第二, 用户在点击这个内容之后,会通过刚才提到的技术直接调起对应的App,打开相应的资源。到这里豌豆荚的工作就结束了,接着就是由对应App接手这个工作继续为用户服务,豌豆荚不能也不会获取和监听用户的使用信息。

CSDN:这是不是说,你们要去与开发者沟通,取得他们的支持,才能真正实现Deep link所预想的想法?

李大海:是这样的。真正支持Deeplink的开发者还非常少,所以我们为了实现预想的用户体验效果,必须跟开发者合作,跟他们解释需要做的事情和可以获得的好处,这是很难绕开的事情。目前,我们已经与超过50家合作伙伴达成了合作。最近也在准备上线自动接入内容的新版开发者中心,提升接入效率。

CSDN:作为豌豆荚搜索平台的技术负责人,你的常用开发工具是什么?

李大海:我研究生毕业前就是一个Liunx爱好者,是北京大学Linux俱乐部的常任会员。进入谷歌之后,也一直在Linux平台下做开发,日常使用的操作系统是Ubuntu,平时使用Vim进行代码编写,开发语言主要是用C++和Java,偶尔用一下Python,对Go语言也很感兴趣。

CSDN:在你的技术实践当中,有哪些建议与心得可以给到开发者?

李大海:现在是一个开源的时代,我建议开发者多了解开源界的动向,对常用的开源框架和工具,以及一些现成的存储系统有所了解,这样,在需要快速实现一个原型系统的时候能够以很低的时间和成本完成。比如Java和 Spring框架、Hadoop、Hbase、Hive、Storm、Spark等。另外,在移动互联网时代,我们经常需要处理海量数据。我建议开发者,在开发的时候,一开始就要想好怎样能把代码写得对分布式比较友好。比如选用数据库解决方案的时候虽然一开始量可能很小,但还是要想清楚到底是MySQL更合适业务需要,还是用HBase这样的Non-SQL数据库就足够了。如果采用MySQL,以后数据量大了可能会怎么运营?诸如此类。


【《近匠》上海庆科:智能家居背后的连接和交互方案提供商】《近匠》第47期:今年国内智能硬件团队不断涌现,而专注于智能家居方向的团队数量多。同时,一些如海尔、美的这样的老品牌也开始走向智能化。在这些智能家居背后,有着一个重要的云方案提供商,那就是上海庆科。

【《近匠》图灵机器人:App和移动硬件的智慧大脑】《近匠》第46期,图灵机器人是为开发者提供智能语义处理能力(包括语义理解,智能问答,知识库对接等)的服务。目前已经积累近百亿条语料库和GB级别基础数据,本期专访联合创始人韦克礼,听他详解“智慧大脑”。

【《近匠》Blueware何晓阳,不做中国的New Relic】《近匠》第45期,APM指“端到端应用性能管理”,可以对应用的传输链进行统一、实时深入分析。目前这一领域最广为人知的公司是美国的New Relic。作为一家中国APM提供商,Blueware希望APM可以为更多国内开发者所用。

回顾更多内容及线下开发者活动信息,请关注mobilehub公众微信号(ID: mobilehub)


寻求《近匠》免费报道,请私信:@CSDN移动,或发送邮件至mobile#csdn.net。

用Delphi开发“瘦”单机数据库应用系统 用Delphi如何实现VFP中的Cache特性 用Delphi设计数据库应用的几点体会 在我们日常工作中,常会碰到这样一个难题:一大堆-Delphi资料 用DELPHI制作应用软件 用Dephi 程 序 维 护Paradox 数 据 表 的 索 引-Delphi资料 用Dephi程序维护Paradox数据表的索引-Delphi资料 用InstallShield制作数据库应用系统的安装程序-Delphi资料 在BDE中使用ASCII-Delphi资料 在DBMemo中查找文字-Delphi资料 在Delphi 程序中维护DBF 数据库 在Delphi 中 利 用 Tbatch 组 件 完 成 数 据 批 处 理 在Delphi 中使用计算出的字段 在Delphi3 程 序 中自 动 检 测、 建 立 数 据 库 别 名 和 表 格 在Delphi3程序中自动检测、建立数据库别名和表格 在Delphi4 BDE中配置Access数据库 在Delphi5 中修改了Delphi自带的VCL Source文件后怎样重建Delphi的库文 在DELPHI程序中动态设置ODBC数据源 在DELPHI程序中使用ADO对象存取ODBC数据库 在DELPHI程序中自动设置ODBC数据源 在Delphi的DBGrid中插入其他可视组件 在Delphi的Socket编程中如何从服务器向指定的客户机发送信息? 在Delphi动态生成定义数据库 在Delphi中处理数据库日期型字段的显示与输入 在Delphi中简单实现多重查询 在Delphi中建立和使用别名 在DELPHI中使用ADO对象存取ODBC数据库 在Delphi中使用DBF数据 在Delphi中随意控制DBGrid 每一行的颜色 在Delphi中自动检测、建立数据库别名和表格 在存储过程中使用use database-Delphi资料 移动文件 DataSource的问题 cookie的问题 我学C语言有一段时间了但我发现没有什么成果?? 我想做一个象MSN类似的界面,请教各位应该怎么整啊? 简单的textbox控件问题,再次散分了! 有一个1024K*32位的存储器,由128K*8位的DRAM芯片构成,看下面对吗? colordialog的问题 win98窗口上的最大化最小化按钮变成了数字 请问,如何以编程的方式创建SQL server的实例的? 请问“[System.ComponentModel.DesignerCategory("Code")]的意义? table1.FieldbyName('Company').asstring:= ExpandFileName (filelistbox1.filename); 网卡使用的问题!在线等候 会c/s的高手请帮忙! 为什么我的winme关机后在开机总是要检查磁盘,可是我是正常关机呀,烦死我了。谁能解决给100分。 各位高高手,有没有MS SQLServer6.5的JDBC驱动?救人一命胜造十级**,忘了咋说的了. 大家给我解答我不会用,请再帮帮忙(前后贴200分一起结,谢谢) 在一个dataset中,对于不是主键的列中的值如何进行查询? 星球大战前传2:美国人全面攻击 有谁知道在哪有IIS6.0下载呢 请问在mysql中怎么建立自动增加的字段呢 , 好想在mysql中没有那么强大的工具。 请问哪里可以下载中文的windows Media Player SDK? 高分求助 数据备份 为什么Access中排序顺序不正确?<在线等待> 在菜单中增加CIMAGELIST中的位图,这样写对吗? 为什么受伤的总是我?只因为我是菜鸟??? 寻一个asp.net(codebehind)实现的数据库访问的demo sybase事务处理的问题 我的程序用的Access,,运行时出现“无法为更新引集定位:一些值可能已在最后读取后改变”什么原因? 怎样加大在sql server中存储图片字段的大小 这回真的是“高手请进”了!!!! 求救,javabean编译问题?? 如何获取Dispatch接口中的事件? 小小问题:如何清空用ADO连接的数据库表中的记录 大家由没有碰到这样的问题? 100分请高手给澄清关于数据库引擎的几个概念 请问 ucs2编码如何转化成gb格式的? 在Ado2.1中如果已经Addnew,如何撤消而不引起错误? 打开新窗口的问题 谁知道那里有电子版的《C语言编程思想》 如何获得输入得BSTR 字符串得值? 帮我想想! 为什么我运行 ms-project2000会出错!错误内容在里面,请大家指教!!! 哈工大附近有卖3号足球(最小的那种,可以在室内玩)的吗? 修改?? 关于CPU 100%使用率的问题 如何使用VB访问MySQL数据库? 视图窗口的windows句柄和视图窗口的指针有什么区别? SQLServer出现问题,急!! 如何像Windows Form一样,弹出 .aspx的Web文件。 请教一个问题。急 改成打比方的句子海鸥起起落落飞翔着.要表达更生动、形象.给我写好的 我看了如果很好 在12月11日晚上9点给我答案! 汽车发动机原理是什么? 液态氯化氢为什么不是电解质?不是说酸、碱、盐都是由离子组成,都是电解质吗 阅读题:映山红, 改成打比方的句子,急`~(1)果园里桃花开了,远远望去很美.(2)八路军把敌人的阵地完全包围了.(3)春雨很细,也很轻,柔柔的洒向大地. 如何区分强、弱电解质?如何区分强弱电解质?怎样能知道某物质是否完全电离呢?必须所有的都背吗?没有什么规律吗?都有哪些盐是属于弱电解质的?问题多了点……我是高一的…… 为什么以公元前475年做为春秋和战国时期的分界点? 一支粗细均匀的蜡烛长20cm.点燃5分钟后,蜡烛缩短2cm;点燃12分钟后,蜡烛还剩多少厘米?比例解 怎样判断哪些是碱性氧化物,哪些是酸性氧化物?怎么判断强弱酸、强弱碱以及强弱电解质?有什么窍门 公元前七百年到公园前476年是春秋到战国经历的时间吗 太阳下山了.打个比方句子写下来,怎么写. 游泳和跑步哪个氧气消耗大跑马拉松和游泳哪个耗氧大 公元前476年发生了什么事,为什么以这一年为界分开春秋与战国? 为什么卡诺循环效率最高 24题BCD分别解释一下? 电子 质子 离子 原子 区别和联系 线路板清洗剂里面含双氧水吗? “胡萝卜,鸡蛋和咖啡”这篇文章中富有哲理的一个句子摘录下来,并把自己的感受写下来 关于电子质子分子原子离子的所有知识点 卡诺循环的效率不是负数吗n=1-T1/T2 已知T1是高温热源 T2是低温热源 则T1大于T2 则 T1/T2必定大于1啊,1-T1/T2 则肯定小于零啊 求解是怎么回事? 请你提出两种不同方案,证明HA酸是弱电解质 原子,电子,质子,中子,离子,核子,分子的区别与联系? 一支粗细均匀的蜡烛长20cm.点燃5分钟后,蜡灶缩短2cm,点燃12分钟后,蜡烛还剩多少厘米? 下列事实能说明HA酸是弱电解质的是( )下列事实能说明HA酸是弱电解质的是( )A 浓度相同时HA溶液的导电性比强酸弱,B 10mL 1mol/L的HA溶液与10mL 1mol/L的NaOH溶液恰好完全反应,C NaA溶液的PH>7,D 原子,分子,离子,质子, 一支蜡烛长20cm,点燃5分钟后,蜡烛说短2cm,点燃12分钟后,蜡烛还剩多少厘米?比例解 证明次氯酸是弱电解质那个选项   A.次氯酸在光照下分解   B.次氯酸钙溶液中通入适量二氧化碳气体产生白色沉淀   C.次氯酸与氢氧化钠中和   D.次氯酸和亚硫酸作用 为什么把公元前475年作为战国的开始?这种说法是何时出现的? 一支粗细均匀的蜡烛长20厘米,点燃5分钟后,蜡烛缩短了2cm,点燃12分钟后还剩多少cm? 怎么证明hclo是弱电解质? 公元前475年到公元前221年为战国时期,是我国奴隶制向封建制转变时期duicuo. 一只粗细均匀的蜡烛长20厘米.点燃5分钟后,蜡烛缩短2㎝;点燃12分钟后,蜡烛还剩多少厘米 在一根长1.5L的不能伸长的轻绳上,穿过一个质量为m的光滑小圆环c,然后把绳的两端固定在竖直轴上,绳的A、B端在竖直轴上的距离为L/2,转动竖直轴带动c环在水平面内做匀速圆周运动,当绳的B端 初一一元一次方程应用题:京泸高速公路全长1262千米 不饱和烃消去反应生成卤代烃的化学方程式卤代烃加成反应生成不饱和烃的化学方程式不饱和烃发生加成反应生成醇的化学方程式醇发生消去反应生成不饱和烃的化学方程式 竖直平面上的圆周运动,绳模型和杆模型求详细讲解,包括各种临界点分析.好的要追加分数的. 电动车电池,用铅酸电池好,还是磷酸铁锂电池好呢 怎么辨别人的体质是酸性还是碱性?汪涵和何炅为什么合不来? 摄制电影时,为了拍摄下落物体的特写镜头,做了一个线速度味事物的1/49的模型.放电影时,走片的速度为每秒24张,为了使画面逼真,拍摄时走片速度应为多大?模型的云广东速度应为实物的多少倍 白菜-甘蓝可育吗?为什么? 为什么人体会有酸性和碱性的区分?是酸性好呢?还是碱性好? 质点在连续相等的时间t内所通过的位移之比为(下标为罗马数字1.2.3.4)S1:S2:S3:……:SN=1:3:5:……:(2n-1)质点在连续相等的位移段内,连续各段所用的时间之比为(下标为数字)t1: 被染色的衣服怎样恢复原色? 人的人身体是否有酸性或碱性之说? 我还没有学到机器能守恒,请用圆周运动的知识讲解一下,小球质量为m,用长为L的轻质细线悬挂在O点,在O点的正下方L/2处有一钉子P,把细线沿水平方向拉直,如图所示.无初速度地释放小球,当细线 战国公元前几年到公元前几? 一根蜡烛长20厘米,点燃后每小时燃烧5厘米,燃烧时剩下的高度h(厘米)与时间t(小时)之间的关系图( ) 《胡萝卜.鸡蛋和咖啡》 哪一句话是富有哲理的句子.是最后一段 父亲说的话吗 永不凋谢的杜鹃花阅读答案 必修二生物.为什么答案是d而不是b. 请问:易挥发成无味气体的试剂有哪些?(1)易挥发成无味气体的多为液体试剂,请问这类试剂有哪些?(2)也可两种试剂合成为无味气体的,如有请告知.(3)有些固体试剂也易挥发,但挥发较 卢宁高速公路全长约275千米,量得这条高速公路的图上距离是5.5厘米,这幅地图的比例尺是多少 为什么不选A而选 刚刚那个《胡萝卜.鸡蛋和咖啡》哲理的句子,.简而言之后面要不要写 在比例尺是1:5000000的地图上,量得卢宁高速公路长5.5厘米一辆汽车以每小时125千米的速度行完全程需要几小时 必修一生物,为什么答案是A 为什么同为电解质 盐和碱在熔融状态下可以导电,酸不可以?我刚上高一,老师没和我们解释什么是共价化合物.请问这和共价化合物有什么关系,什么是共价化合物 泸泞高速公路全长约275千米,在一幅地图上量得这条高速公路长2.5厘米.这幅地图的比例尺是多少?在另一幅地图上量得这条高速公路长5厘米,这幅地图的比例尺是多少?拿衣服缩小的程度大一些? 慢走一个小时消耗多少热量? 还原糖实验 胡萝卜代替苹果可以用胡萝卜代替苹果作为实验材料吗?原因是什么?
备案号:鲁ICP备13029499号-2 说三道四 www.s3d4.cn 说三道四技术文摘