说三道四技术文摘-感悟人生的经典句子
说三道四 > 文档快照

《近匠》第04期:移动开发技术访谈,多看科技CTO王毅——阅读未来

HTML文档下载 WORD文档下载 PDF文档下载
12000本图书、2200万用户、超过200家合作出版社,这是多看科技创建至今的积累。但数字背后,他们也在数字化阅读的路上解决了很多问题,代码管理的迁移、盗版的预防、阅读体验的革新、垂直社交与电子杂志平台的试水。

CSDN移动频道推出移动开发系列访谈《近匠》。新一年起,我们将走近更多移动开发者与移动开发服务商,从深植与软件及硬件领域的“工匠”们的口述中,窥探移动互联网趋势与走向。本期CSDN移动对话移动阅读平台——多看科技。

自2010年多看阅读成立以来,已经经历了3个年头。它从最初人们口中的“Kindle必刷的系统”,逐渐蜕变为现在跨Kindle、iOS、Android多系统的数字阅读平台。目前,多看的图书已达12000本,但每本从获得版权到最终上架并非全都一帆风顺。做数字化出版不得不面对哪些问题?自从2012年小米并购多看后,多看与小米的技术团队又有怎样的协作?多看作为中小团队的技术经验有哪些?在多看眼中,实体书数字化在国内正遭遇哪些难题?不妨让多看科技副总裁兼CTO王毅与我们聊一聊。


多看科技副总裁王毅

CSDN:请您介绍一下个人的经历,以及多看阅读团队。

王毅:我的工作经历比较简单。我从北大毕业后,就一直在北大方正,当时王选老师还在任。我在方正主要负责的是排版软件的相关工作,然后从2000年起转向了数字出版领域。自从那时起,就在数字出版领域,工作了很多年,主要是做与数字相关的基础的技术研究工作,在方正最开始从方正电子,到最后方正技术研究院从事数字出版相关的工作。大概在2011年8月,我加入了多看,当时多看成立的时间也比较短,算起来,到现在为止,在多看工作也有两年多的时间了。

整个多看阅读团队大概有160人左右,分为内容、产品研发和运营等几个团队。现在多看阅读的技术团队大约有30多人,很多技术骨干都是以前与我一同工作至今的,其中也不少曾在方正研究院共事过的同事。

CSDN:多看阅读的技术团队都采用哪些技术服务?

王毅:技术主要是自主研发,实际上多看整个平台,不管是云端,还是客户端都是自己搭建的,这是一套比较完整的包含数字出版发行、销售等环节的一个平台。我们的客户端也已经覆盖了从Kindle到iOS、Android,再到Web等几个主流的平台。

实际上,多看在2010年创立之初是从开发Kindle的中文系统出发的。因为当时Kindle没有中文系统,而且Kindle也还未入华,在国内能买到的都是水货,我们基于它做了一套完整的中文系统。这也使得Kindle可为大多数中国人所使用,方便更多用户操作和阅读。当然,Kindle入华则是后来的事情了。

CSDN:从多看阅读发布第一个版本至今,技术团队做过哪些改进,遇到并解决了哪些问题?

王毅:我们发布过很多版本,以Kindle版为例,从发布第一个版本开始,我们每周都更新一个新版本,一直坚持至今。同时,其他平台版本的更新频率也非常高。在2010年到2011年的起步阶段,我们主要是以开发Kindle的中文系统为主。

随后,在2011年下半年,我们开始尝试向Android和iOS平台拓展。当时,我们发布至两个平台的产品形式有所不同,在Android上我们开发了一个阅读器,而在iOS平台,我们所遵循的是“精品阅读”的理念,所以最开始从单行本入手。在此期间,我们也在多个平台发布了客户端。

从2012年起,我们开始准备发布“多看书城”,这是一个正版电子书的销售平台。它在2012年的5月31日率先在iOS版本上正式发布,随后Kindle、Android和Web版客户端也逐一接入了这个平台,逐渐形成现在大家所看到一个全平台的正版电子书发布和销售渠道。

还记得,在最开始时我们的电子图书加工、制作进度很慢,资源也比较匮乏,所以上线时书城中只有100本书,其中免费书籍和付费书籍各占50%。但是现在,书城已经拥有超过12000本正版图书,而且每一本都是经过我们精心加工制作的。除此之外,与去年发布第一版本时相较,各个平台的终端数和用户数也得到了很大的提升。

CSDN:就像每一家实体书店都有自己的特色一样,作为一个移动阅读应用,多看的特色是什么?

王毅:我们认为多看最大的特色其实就是极致的阅读体验。所有用户在我们的平台上都能够享受到最好的数字版图书,以及最好的数据阅读服务,这就是我们最大的特色。我们应该是在国内唯一一个跨越了从Kindle到Web、iOS,再到Android,几乎所有的移动系统的电子书平台。我们在每本书上付出了很大成本去进行制作。我们的客户端具备跨平台特性,阅读体验保持着一致性,比如阅读进度、阅读笔记,甚至将来书架里所有的内容,都会云同步。

我们在最近推出了一些社交化服务,比如说书友圈,它能够有效地拉近读者和读者之间的距离,甚至作者与读者之间也能进行互动。我们平台上有些书的作者会直接在书友圈中和读者去互动交流,这在实体书店中是很难做到的,但借助移动互联网,我们可以轻松拉近他们之间的距离,方便他们相互交流,这是完全不同的体验。

CSDN:电子图书与纸质图书的制作流程是不同的,多看阅读在这方面是怎么做的?

王毅:我曾在知乎写过一篇贴子,简单介绍了多看对每本电子书的制作流程。我们的每一本书都和其他平台完全不同,多看书城中的书籍很多都是图文混排的,我们深谙此道。而且我们对排版的字体,以及许多排版细节要求都很高。我们制作每本书之前,首先需要出版社提供数据源,然后我们再根据数据源进行加工制作。从排版设计的角度讲,我们的理念是“千书千面”,希望每一本书都有它独特的风格和阅读体验,包括封面设计、版面设计,甚至文案编辑都会有所不同,有些书会加入视频(如,柴静的《看见》试读版),有些会加入交互。我们不完全是追求与实体书的一致,我们希望电子书的体验完全超越实体书。

在多看中,不同类型的书,会被赋予完全不一样的阅读体验。以计算机类图书为例,这也是多看最具特色的图书之一。与其他平台不同,书中所有代码不是用图片形式显示,而是以真正的代码块形式显示的,我们为此专门扩展了交互代码块的定义,所有计算机类的图书都不能直接使用代码图片,而必须全部是等宽字体排的代码文本,代码是可以交互的。


技术类图书

手机屏幕对文字的缩进、排版存在很大的限制,但代码往往比较长,如果它不符合手机屏幕对缩进、排版的要求,代码段看起来会非常乱,不利于阅读。但通过一些交互的操作,用户可以阅读到原版的格式规范的代码。

完成排版后,我们的开发工程师会利用业余时间对所有的代码进行审校,这也让图书中的代码比实际纸质图书更准确、更规范。不过,加工成本很高,而且周期都很长。

CSDN:制作一本书的周期是多久?

王毅:现在计算机类图书的制作周期一般在两周以上,因为它的流程很长,其中包括审核、校对、制作等,而且计算机类图书的加工成本是最高的。

CSDN:就像之前所提到的,一些图书会加入视频,我们发现也有一些图书会加入轮播图形式的插图(如,《转一转希腊》)。

王毅:这是专门使用了我们的“画廊”技术。在很多摄影类图书中,我们大量地使用“画廊”,因为摄影类的图书,经常会拿不同曝光、不同光圈下的图像进行对比,但你会发现其实图片大小是一样的,所以采用“画廊”的交互形式,能让用户滑动浏览图片,非常便于对比在相同环境下使用不同参数的照片,它阅读体验比纸质书籍会更好。

CSDN:在电子书制作方面,多看有哪些独特之处呢?

王毅:交互式代码是多看独有的,其他平台都不具备这样的特性。当然还有很多细节也非常与众不同,比如说多看的图文混排、多字体排版、独特的样式和字体,这在别的应用中是没有的。

另一个独特之处就是多看的纠错和更新系统。每本书就像一个应用一样,它会有自己的版本号,会根据用户反馈进行定期更新。如果读者在读书时发现了错别字,他可以点击选中它,并发送纠错报告。多看的后台有一个数据整理系统,每天定时收集这些用户的反馈报告,系统会自动生成相应的错误报告,然后发送到我们的工作流系统里。我们的编辑团队会根据这些反馈做出相应处理,然后更新图书版本。这时用户就会在客户端就会看到一个温馨提示,告诉用户图书更新了,用户甚至可以查看更新记录,在图书的详细信息页里面也可以浏览它的更新历史。用户只需点击下载更新,就可以继续阅读了。

我认为这种更新机制完全颠覆了传统纸质图书的出版流程,因为实体书的出版无法做到快速更新,再版最短也需要6个月。但是我们基本上在一个月之内,就可以把用户提交的Bug全部修改完,然后更新上线。用户也能很快的得到反馈效果,他看到的电子书的内容精准程度,通常比实体书更高。同时,我们与出版社保持沟通,获取刊物的最新信息,这使电子书臻于完美。频繁的更新使得数据越来越准确,电子书的质量会变得越来越高。

CSDN:在电子书中加入视频、图片等多媒体元素,无疑会让文件体积增大。你们会如何处理?

王毅:我们会做一些处理,会对其体积进行控制,因为数据量太大也会影响用户的下载体验。但是文件体积变大是不可避免的,尤其对图文混排的书,多媒体图书体积相对较大。不过现在的网络带宽在不断提升,下载速度也在不断的加快,我们认为这已经不再是什么太大的问题了。

CSDNPDF智能重排和切边功能是如何实现的?

王毅:这个功能也是一个特色,因为多看阅读除了是多看书城的终端之外,在各个平台也是很好的一个阅读工具,它支持主流格式,比如TXT、ePub、PDF等。同时,每一种格式在多看中都会有自己的特点,比如ePub,我们很好地支持了ePub标准和它的CSS解析。在很多的阅读器中,ePub仅被简单当作了一种的文本格式,这一种误解,其实不利于ePub标准的推广。实际上,ePub标准主要的核心优势是采用了HTML5和CSS技术,可以做出非常精美的电子书,包括多看书城上的很多书都是ePub格式的,所以我们在ePub的兼容性方面应该比绝大多数的应用更完美。

我们有很多用户,甚至会自己制作ePub图书放到多看里面阅读。前一段时间,我们基于ePub做了一些扩展的开放标准,开放了一些多看的扩展规范,比如说我们的交互式的文内注,这个扩展规范已经开放给了用户。我们有一些用户专门针对我们的扩展规范,做了一些电子书。这些开放的规范都可以在我们论坛找到。

关于PDF格式,我们对PDF投入较大的就是重排功能,现在不论是文字版还是扫描版的PDF都可以实现重排。PDF是作为一个版式的文档,它其实在小屏幕上的阅读体验并不好,所以为了能让它适应小屏幕的阅读,就需要借助重排的功能,目前这方面我们也在努力,包括切边,包括重排扫描版的处理。

然而PDF重排是个很复杂的过程,因为PDF主要是面向印刷,很多PDF本身丢失了文档的结构信息。它不像重排一个TXT或者Word文档,这些文件都是有段落结构的,而PDF则不同,它是一种基于矢量的文件格式,最终印刷效果是否高保真,是否与原始版面完全一致才是它的重点,但它的文档却缺失了逻辑结构。所以PDF重排过程会涉及到一些对版面理解的算法。你可以将PDF理解为一张图像,你用算法去理解这张图像,其中哪些是段落,哪些是标题,哪些是图,以及哪里是段落的起始和结束的位置,这些信息都需要以算法来进行处理。

CSDN:在多看在线书店中搜索书籍时,输入法国,搜索结果中不仅仅有书名包含法国一词的书籍,还有法国作家的著作,以及中国作家写的相关图书。多看的搜索基于什么?

王毅:现在我们并没有在搜索方面投入很多人力,但是我们做了一些管理性的工作。多看不仅仅针对书名、作者进行搜索,还包括标签。我们编辑会对每本书加上标签,这是加工制作流程的一环。编辑会根据他的理解,为每本书打上相关的标签。这些标签用户也可以在图书详细信息页中看到,如果用户点击标签就可以进入相关的标签书单。另外,我们对标签有多个维度,比如地理的纬度、人名的纬度等,都有比较严格的限定。

CSDN:小米并购多看为你们带来了什么样的变化?从技术层面讲,有哪些协作呢?

王毅:最明显的就是基础技术的互通,现在我们所有的应用,包括多看阅读,全部迁移到了小米帐号的体系下,多看现在也使用小米帐号,作为一个身份认证系统,小米帐号打通了整个小米的业务系统。用户可以基于小米账户做很多事情,比如访问云空间,以前的多看帐号是没有这项服务,但是随着无缝迁移至小米帐号后,用户可以通过小米账号登录,同步账号中的图书、笔记等信息到小米云空间。

与此同时,米币支付系统也是一大重点。支付系统是小米生态中非常重要的一环,现在游戏、主题和阅读都以统一的支付系统贯穿起来。同时支持各种各样的充值的方式,这样我们的用户不管是在移动端,还是在Web端都可以很方便地使用米币来支付,这也是合并之后的一大变化。

CSDN:多看目前有100多名员工,算是一个中等大小的团队。从技术层面看,您认为对于中小开发者来说,什么样的开发工具或服务是必需的?

王毅:我觉得从开发团队管理上讲,采用适合自己的开发工具是很重要的,因为这有利于大幅提升他们的开发效率。就好像我们的代码管理方式已经历了好几次的改变,最初我们使用的是微软一套代码管理系统TFS,后来开始使用SVN,由于SVN在分布式处理方面存在一些缺陷,所以最终采用了Git。

我认为选择工具的目的是尽量杜绝以往手工作坊式的开发方式,使开发更有条理和规范。与我们现在采用Git做代码管理的道理一样,因为Git的特点是分布式开发,它很便于分支,同时它也很轻量级,跨平台性能好,现在也是主流的代码管理工具。

我们的Bug管理现在采用的是JIRA,这也是目前整个小米体系下大多数团队所采用的平台。这个平台可以通过多种方式扩展,可定制接口和模块,轻量、灵活也是它的重要特性,能够有效地帮助中小团队解决项目管理问题。

CSS Shapes:Web设计人员的新工具 Android 4.3正式发布:四大新功能一览 史玉柱的创业经验谈 3G门户和GO桌面:海外推广的生意经 系统级编程语言性能大PK D语言成首选 解读Facebook第二季度财报 移动业务风生水起 如何避免失败,像Google一样玩转大数据 首届游戏运营技术论坛隆重开幕,共论大数据时代的游戏运营之道 OpenStack Swift遇到了Erasure Code 微软Win7 IE11开发者预览版发布 开始改进开发工具讨好开发者 个性化推荐服务商百分点宣布B轮融资1000万美金 全球著名互联网企业背后的开源力量 基础设施对决Facebook vs. Google:差距绝不是一点点 Amazon Q2财报同比转亏,但AWS反其道而行:高歌猛进! 开拓海外市场的两年:海外上线小技巧 SDCC 2013首批讲师名单出炉 一线工程师唱主角 [开源推荐] 跨平台的.NET运行环境 Mono 3.2发布 Heroku发布API平台Beta版 采用OAuth2.0安全授权 大数据时代:移动数据能为我们带来什么? iOS开发经验谈:如何提高应用开发效率? 贝索斯:你否定亚马逊的现在 我决定亚马逊的未来 谷歌新产品Chromecast:一夜之间价格从35美元飙至100美元 移动周报:苹果5周年限免神作,BADLAND开发者访谈 开源平台Cloud Foundry获IBM和百度支持,步入高速发展的“黄金期” GDK仍未发布 谷歌鼓励Glass开发者可提前用Android SDK开发 Adobe发布PhoneGap 3.0 支持命令行工具 初级vs.高级开发者 哪个性价比更高? 一周观察:Cloud Foundry生态圈渐成型 数据分析中的10个注意点,让你更了解用户体验、行为及需求 压不垮就奋行!Dropbox Datastore API给初创NimbusBase带来的启示 史上14大最具创新意义的科技发明 为什么要学Java http://Scjp.myrice.com 也许你的一切会改变! 请问怎么修改InstallShield中的可选项,如Typical、Compact、Custom等。 如何.定制通用对话框中的路径及文件名? 我照着网站上的中文输入法提示,做了可没效果 为什么要学Java 看 http://Scjp.myrice.com 也许你的一切会改变! 回答问题,我给500分!! 语音聊天用什么软件好?qq,netmeeting,yahoo message or icq? 为什么不能汇编成功? 各位,帮我一下,非赏急! 数据库快照复制问题,总出错,求救!(50分) 请问这是怎么一回事。win2k(p)+tomcat+jdk1.4.` 在VB中怎样设置Excel单元格的样式?如设置为百分数显示单元格数值? 下拉菜单问题? 请问这是怎么一回事。win2k(p)+tomcat+jdk1.4.` 求救,我财务系统的问题,大大们一定要帮助我呀! 我在调试jsp是的一个错误信息,请指教~~~ 急!!! 一个烦人的问题 关于在应用程序中使用dll中资源的问题 關於並行執行的問題 也许你现在就会改变!! 看 http://Scjp.myrice.com 为什么要学Java 其实我们很封闭! 关于NT的小问题! 请问: 請問哪里有c++的書籍下載? 几个控件重叠在一起,怎样用代码的方式使其中的某个控件在运行时放至最上!?谢! 也许你现在就会改变!! 看 http://Scjp.myrice.com 其实我们很封闭! 如何发布我的网站? 怎样编程在Windows开始菜单的的“启动”栏中添加本程序的快捷方式? 谁有installshield 6.30的license注册文件? 请问:DataGrid在WebForm中明明有数据显示,但用浏览器看就没,为何? 显卡选择问题 ? 也许你现在就会改变!! 看http://Scjp.myrice.com 其实我们很封闭! 一个Acme .....???? 共计350分哟。急急。。。。我在PHP区有发言。但是还连不上SQL SERVER2000呀。。请进 boyqing(阿清):我的问题转到这了! 谁有installshield 6.30的license注册文件? 高手请进! 大家用java都来做什么????? 搞linux,unix底层的在中关村有没有搞头? 请问为什么我的CBuilder中在菜单项File/new下的无法找到RemoteDataModule?我是新手,请帮忙! 这几句TSQL有错?帮忙看看 请教关于网卡与声卡冲突的处理方法 谁有installshield 6.30的license注册文件? 请问如何在页面操作中保存dataset 怎样选定ListCtrl中的一行(包括subItem区域)? 类对象的实例和类的实例有什么区别?? 请问各位大虾,公文管理系统怎么做? 如何将TIF或TIFF文件转换成网页可以显示的JPG,或是GIF文件(最好给出JAR和例子) 这段程序应该怎么编? 各位老大,近来看看吧,一下午了也没有人来回答,苦命呀!加分...狂加....跳楼... TO net_lover(孟子E章) : 为什么说物体的温度越高,红外辐射越多如果一个物体的温度很高,以至于他的辐射段是可见光以上了,那么这个物体还会辐射出红外线吗 辐射的温度,表面每一平方厘米辐射功率为一千瓦的物体,对应的表面温度是多少?怎么计算的啊,attrations大侠能说的具体点么?公式中P是什么?正比于T的四次方吗?T是温度吗?3371摄氏度是准 “天下相亲与相爱“,这句歌词是哪首歌的? 小虫为什么喜欢往灯泡上飞?小虫为什么喜欢往灯泡上飞呢.怎么可以让它不往那飞呢? 困加一笔能组成什么字, 求曲线ρ^2=cos2θ所围成图形的面积 为什么虫会喜欢在灯的附近飞? 人教版一年级语文有生字一、二怎么区别呀.在具体掌握过程中如何区别,那些是会认,那些是会写呀我指的是教材最后的生字表(一),生字表(二)那部分是会认,那部分是会写会用呢? 求曲线r^2=cos2θ所围成图形的面积 答案1/2, 有温度的物体都会辐射红外线,这是对的吗?不是有温度的物体都会辐射电磁波,只有在一个范围内,才会辐射红外线吗,而宇宙3K的温度不就是辐射微波吗 如:句 苗 良 (犭)心 口 人 (门)兆 包 易 ( )都不对,要跟后面的2个也组成一个字啊. 要一片五年级动物的说明文(300字左右) 物体辐射红外线的强弱与温度有什么关系 动物说明文 600字 (2sin2α/1+cos2α)*(cosα)^2/cos2α=多少 不同温度的物体所辐射的红外线强度都不同吗? 描写兄弟情的诗句 像相亲相爱的词语还有什么? 为什么有温度的物体有红外线辐射 小学一年级上册语文什么是一类词什么是二类词? (2sin2α/1+cos2α)*(cos^2/cos2α)=? 寄居在消化道内的寄生虫对身体影响最小的是哪种寄生虫? 小学一年级语文上册组词一上上的什么? 同班同学情同手足怎么能打架斗殴呢?这时你会说诗句----- 手足情的诗?谁有手足情的诗词?整首的啊! 情同手足中的手足是什么意思,还有面目用来比喻什么这可是送分啊 已知tanΘ=1/3,求cos2Θ+2sin2Θ 关于兄弟情的古诗 情同手足中手足一词比喻什么? 化简 [2sin2α/(1+cos2α)]*[cos^2α/cos2α] 红外线温度高还是紫外线温度高?在暗室里让一束阳光进入,用三棱镜将它分解为七色的太阳光谱.把灵敏温度计放在红光之外的部分,可以观察到温度计的度数上升,这是红外线的热效应.这说明 求解 小学二年级语文题什么字可以和这几个字组成词:‘日、星、间、求’ 2sin2α/1+cos2α 乘以 cos²α/cos2α,本人比较笨希望讲细一点,一步一步的. 为什么一般物体都会辐射红外线,却不一定能辐射紫外线.(请通俗说明,尽量别掺进太多术语)我觉得奇怪的是,一束光射到物体上,将反射的光色散,就可以看到七种颜色,那紫色之外不就是紫外 下面的句子用什么词形容?小学二年级的语文题下面的句子用什么词形容?第1题:在极短的时间内发生的,出乎意料.第2题:重视,爱护,常放在心上.第3题:亲密,热情.第4题:使不存在,除去. 自从上次赛跑乌龟大胜兔子后,乌龟便成了体育界的名人,又是广告,又是讲演,活动不断.可蚂蚁便便不服气,向乌龟下了挑战书,我们来看:乌龟先生:本日20日下午,我们进行长跑,从小柳树开始 是不是任何物体都有并产生红外线和紫外线?十万火急.明天就开学了~ 小学二年级语文第三课三组词龙字怎么组词 兔子,乌龟,蚂蚁,蜗牛,老鼠,龙它们几个哪个跑得快? 《诗经》中描写秋天的诗 一、照样子写词语:急得(团团转)做得( ) 热得( ) 笑得( ) 酸得( ) 谈得( )二、把下面的词语补充完整( )不林( )轻重倒置 人教版七年级下语文书第五课课后题最后一题是什么 甲杯里有水300千克,乙杯里有水200千克,往甲杯中放入60克糖,乙杯放入45克糖,哪个杯中的水甜些?快 二年级语文词语 七年级上册语文书第六课课后题答案 人体的体表寄生虫有哪些? 照样子给下列词语扩词.(每词3个)例:清秀——山清水秀风雨—— 昏暗—— 曲线r=√2sinθ含在曲线r∧2=cos2θ内部的部分的曲线之长是?答案√2pai/3求详解. 帮忙写一篇关于动物的说明文 600字左右、、 人体的体表有哪些寄生虫?怎么医治? 关于自然万物的相依相伴,相亲相爱的和谐状态的诗句并说明理由 介绍小动物的说明文~跪求600字常见的 哪位能找关于兄弟情的诗句呀?急用注明诗名.作者.朝代 不许组菠萝要三个 介绍动物 说明文 600字你喜欢动物吗?从你所熟悉的动物中任选一种或几种,对其进行说明,或解说其外部特征,或介绍其生活习性、生理功能等.要求:1.写成不少于500字的说明文.2.应抓住该动 有那些关于兄弟情的古诗啊 不要《九月九日忆山东兄弟》 和《水调歌头》 至少两首 反对相亲 经典语句 红外线与温度有什么关系?是温度越高辐射的红外线越强吗?比如,人在感觉热的时候辐射出的红外线是不是...红外线与温度有什么关系?是温度越高辐射的红外线越强吗?比如,人在感觉热的时候 是不是有温度就有辐射啊? 例:清秀——山清水秀要4个
备案号:鲁ICP备13029499号-2 说三道四 www.s3d4.cn 说三道四技术文摘