说三道四技术文摘-感悟人生的经典句子
说三道四 > 文档快照

《近匠》第04期:移动开发技术访谈,多看科技CTO王毅——阅读未来

HTML文档下载 WORD文档下载 PDF文档下载
12000本图书、2200万用户、超过200家合作出版社,这是多看科技创建至今的积累。但数字背后,他们也在数字化阅读的路上解决了很多问题,代码管理的迁移、盗版的预防、阅读体验的革新、垂直社交与电子杂志平台的试水。

CSDN移动频道推出移动开发系列访谈《近匠》。新一年起,我们将走近更多移动开发者与移动开发服务商,从深植与软件及硬件领域的“工匠”们的口述中,窥探移动互联网趋势与走向。本期CSDN移动对话移动阅读平台——多看科技。

自2010年多看阅读成立以来,已经经历了3个年头。它从最初人们口中的“Kindle必刷的系统”,逐渐蜕变为现在跨Kindle、iOS、Android多系统的数字阅读平台。目前,多看的图书已达12000本,但每本从获得版权到最终上架并非全都一帆风顺。做数字化出版不得不面对哪些问题?自从2012年小米并购多看后,多看与小米的技术团队又有怎样的协作?多看作为中小团队的技术经验有哪些?在多看眼中,实体书数字化在国内正遭遇哪些难题?不妨让多看科技副总裁兼CTO王毅与我们聊一聊。


多看科技副总裁王毅

CSDN:请您介绍一下个人的经历,以及多看阅读团队。

王毅:我的工作经历比较简单。我从北大毕业后,就一直在北大方正,当时王选老师还在任。我在方正主要负责的是排版软件的相关工作,然后从2000年起转向了数字出版领域。自从那时起,就在数字出版领域,工作了很多年,主要是做与数字相关的基础的技术研究工作,在方正最开始从方正电子,到最后方正技术研究院从事数字出版相关的工作。大概在2011年8月,我加入了多看,当时多看成立的时间也比较短,算起来,到现在为止,在多看工作也有两年多的时间了。

整个多看阅读团队大概有160人左右,分为内容、产品研发和运营等几个团队。现在多看阅读的技术团队大约有30多人,很多技术骨干都是以前与我一同工作至今的,其中也不少曾在方正研究院共事过的同事。

CSDN:多看阅读的技术团队都采用哪些技术服务?

王毅:技术主要是自主研发,实际上多看整个平台,不管是云端,还是客户端都是自己搭建的,这是一套比较完整的包含数字出版发行、销售等环节的一个平台。我们的客户端也已经覆盖了从Kindle到iOS、Android,再到Web等几个主流的平台。

实际上,多看在2010年创立之初是从开发Kindle的中文系统出发的。因为当时Kindle没有中文系统,而且Kindle也还未入华,在国内能买到的都是水货,我们基于它做了一套完整的中文系统。这也使得Kindle可为大多数中国人所使用,方便更多用户操作和阅读。当然,Kindle入华则是后来的事情了。

CSDN:从多看阅读发布第一个版本至今,技术团队做过哪些改进,遇到并解决了哪些问题?

王毅:我们发布过很多版本,以Kindle版为例,从发布第一个版本开始,我们每周都更新一个新版本,一直坚持至今。同时,其他平台版本的更新频率也非常高。在2010年到2011年的起步阶段,我们主要是以开发Kindle的中文系统为主。

随后,在2011年下半年,我们开始尝试向Android和iOS平台拓展。当时,我们发布至两个平台的产品形式有所不同,在Android上我们开发了一个阅读器,而在iOS平台,我们所遵循的是“精品阅读”的理念,所以最开始从单行本入手。在此期间,我们也在多个平台发布了客户端。

从2012年起,我们开始准备发布“多看书城”,这是一个正版电子书的销售平台。它在2012年的5月31日率先在iOS版本上正式发布,随后Kindle、Android和Web版客户端也逐一接入了这个平台,逐渐形成现在大家所看到一个全平台的正版电子书发布和销售渠道。

还记得,在最开始时我们的电子图书加工、制作进度很慢,资源也比较匮乏,所以上线时书城中只有100本书,其中免费书籍和付费书籍各占50%。但是现在,书城已经拥有超过12000本正版图书,而且每一本都是经过我们精心加工制作的。除此之外,与去年发布第一版本时相较,各个平台的终端数和用户数也得到了很大的提升。

CSDN:就像每一家实体书店都有自己的特色一样,作为一个移动阅读应用,多看的特色是什么?

王毅:我们认为多看最大的特色其实就是极致的阅读体验。所有用户在我们的平台上都能够享受到最好的数字版图书,以及最好的数据阅读服务,这就是我们最大的特色。我们应该是在国内唯一一个跨越了从Kindle到Web、iOS,再到Android,几乎所有的移动系统的电子书平台。我们在每本书上付出了很大成本去进行制作。我们的客户端具备跨平台特性,阅读体验保持着一致性,比如阅读进度、阅读笔记,甚至将来书架里所有的内容,都会云同步。

我们在最近推出了一些社交化服务,比如说书友圈,它能够有效地拉近读者和读者之间的距离,甚至作者与读者之间也能进行互动。我们平台上有些书的作者会直接在书友圈中和读者去互动交流,这在实体书店中是很难做到的,但借助移动互联网,我们可以轻松拉近他们之间的距离,方便他们相互交流,这是完全不同的体验。

CSDN:电子图书与纸质图书的制作流程是不同的,多看阅读在这方面是怎么做的?

王毅:我曾在知乎写过一篇贴子,简单介绍了多看对每本电子书的制作流程。我们的每一本书都和其他平台完全不同,多看书城中的书籍很多都是图文混排的,我们深谙此道。而且我们对排版的字体,以及许多排版细节要求都很高。我们制作每本书之前,首先需要出版社提供数据源,然后我们再根据数据源进行加工制作。从排版设计的角度讲,我们的理念是“千书千面”,希望每一本书都有它独特的风格和阅读体验,包括封面设计、版面设计,甚至文案编辑都会有所不同,有些书会加入视频(如,柴静的《看见》试读版),有些会加入交互。我们不完全是追求与实体书的一致,我们希望电子书的体验完全超越实体书。

在多看中,不同类型的书,会被赋予完全不一样的阅读体验。以计算机类图书为例,这也是多看最具特色的图书之一。与其他平台不同,书中所有代码不是用图片形式显示,而是以真正的代码块形式显示的,我们为此专门扩展了交互代码块的定义,所有计算机类的图书都不能直接使用代码图片,而必须全部是等宽字体排的代码文本,代码是可以交互的。


技术类图书

手机屏幕对文字的缩进、排版存在很大的限制,但代码往往比较长,如果它不符合手机屏幕对缩进、排版的要求,代码段看起来会非常乱,不利于阅读。但通过一些交互的操作,用户可以阅读到原版的格式规范的代码。

完成排版后,我们的开发工程师会利用业余时间对所有的代码进行审校,这也让图书中的代码比实际纸质图书更准确、更规范。不过,加工成本很高,而且周期都很长。

CSDN:制作一本书的周期是多久?

王毅:现在计算机类图书的制作周期一般在两周以上,因为它的流程很长,其中包括审核、校对、制作等,而且计算机类图书的加工成本是最高的。

CSDN:就像之前所提到的,一些图书会加入视频,我们发现也有一些图书会加入轮播图形式的插图(如,《转一转希腊》)。

王毅:这是专门使用了我们的“画廊”技术。在很多摄影类图书中,我们大量地使用“画廊”,因为摄影类的图书,经常会拿不同曝光、不同光圈下的图像进行对比,但你会发现其实图片大小是一样的,所以采用“画廊”的交互形式,能让用户滑动浏览图片,非常便于对比在相同环境下使用不同参数的照片,它阅读体验比纸质书籍会更好。

CSDN:在电子书制作方面,多看有哪些独特之处呢?

王毅:交互式代码是多看独有的,其他平台都不具备这样的特性。当然还有很多细节也非常与众不同,比如说多看的图文混排、多字体排版、独特的样式和字体,这在别的应用中是没有的。

另一个独特之处就是多看的纠错和更新系统。每本书就像一个应用一样,它会有自己的版本号,会根据用户反馈进行定期更新。如果读者在读书时发现了错别字,他可以点击选中它,并发送纠错报告。多看的后台有一个数据整理系统,每天定时收集这些用户的反馈报告,系统会自动生成相应的错误报告,然后发送到我们的工作流系统里。我们的编辑团队会根据这些反馈做出相应处理,然后更新图书版本。这时用户就会在客户端就会看到一个温馨提示,告诉用户图书更新了,用户甚至可以查看更新记录,在图书的详细信息页里面也可以浏览它的更新历史。用户只需点击下载更新,就可以继续阅读了。

我认为这种更新机制完全颠覆了传统纸质图书的出版流程,因为实体书的出版无法做到快速更新,再版最短也需要6个月。但是我们基本上在一个月之内,就可以把用户提交的Bug全部修改完,然后更新上线。用户也能很快的得到反馈效果,他看到的电子书的内容精准程度,通常比实体书更高。同时,我们与出版社保持沟通,获取刊物的最新信息,这使电子书臻于完美。频繁的更新使得数据越来越准确,电子书的质量会变得越来越高。

CSDN:在电子书中加入视频、图片等多媒体元素,无疑会让文件体积增大。你们会如何处理?

王毅:我们会做一些处理,会对其体积进行控制,因为数据量太大也会影响用户的下载体验。但是文件体积变大是不可避免的,尤其对图文混排的书,多媒体图书体积相对较大。不过现在的网络带宽在不断提升,下载速度也在不断的加快,我们认为这已经不再是什么太大的问题了。

CSDNPDF智能重排和切边功能是如何实现的?

王毅:这个功能也是一个特色,因为多看阅读除了是多看书城的终端之外,在各个平台也是很好的一个阅读工具,它支持主流格式,比如TXT、ePub、PDF等。同时,每一种格式在多看中都会有自己的特点,比如ePub,我们很好地支持了ePub标准和它的CSS解析。在很多的阅读器中,ePub仅被简单当作了一种的文本格式,这一种误解,其实不利于ePub标准的推广。实际上,ePub标准主要的核心优势是采用了HTML5和CSS技术,可以做出非常精美的电子书,包括多看书城上的很多书都是ePub格式的,所以我们在ePub的兼容性方面应该比绝大多数的应用更完美。

我们有很多用户,甚至会自己制作ePub图书放到多看里面阅读。前一段时间,我们基于ePub做了一些扩展的开放标准,开放了一些多看的扩展规范,比如说我们的交互式的文内注,这个扩展规范已经开放给了用户。我们有一些用户专门针对我们的扩展规范,做了一些电子书。这些开放的规范都可以在我们论坛找到。

关于PDF格式,我们对PDF投入较大的就是重排功能,现在不论是文字版还是扫描版的PDF都可以实现重排。PDF是作为一个版式的文档,它其实在小屏幕上的阅读体验并不好,所以为了能让它适应小屏幕的阅读,就需要借助重排的功能,目前这方面我们也在努力,包括切边,包括重排扫描版的处理。

然而PDF重排是个很复杂的过程,因为PDF主要是面向印刷,很多PDF本身丢失了文档的结构信息。它不像重排一个TXT或者Word文档,这些文件都是有段落结构的,而PDF则不同,它是一种基于矢量的文件格式,最终印刷效果是否高保真,是否与原始版面完全一致才是它的重点,但它的文档却缺失了逻辑结构。所以PDF重排过程会涉及到一些对版面理解的算法。你可以将PDF理解为一张图像,你用算法去理解这张图像,其中哪些是段落,哪些是标题,哪些是图,以及哪里是段落的起始和结束的位置,这些信息都需要以算法来进行处理。

CSDN:在多看在线书店中搜索书籍时,输入法国,搜索结果中不仅仅有书名包含法国一词的书籍,还有法国作家的著作,以及中国作家写的相关图书。多看的搜索基于什么?

王毅:现在我们并没有在搜索方面投入很多人力,但是我们做了一些管理性的工作。多看不仅仅针对书名、作者进行搜索,还包括标签。我们编辑会对每本书加上标签,这是加工制作流程的一环。编辑会根据他的理解,为每本书打上相关的标签。这些标签用户也可以在图书详细信息页中看到,如果用户点击标签就可以进入相关的标签书单。另外,我们对标签有多个维度,比如地理的纬度、人名的纬度等,都有比较严格的限定。

CSDN:小米并购多看为你们带来了什么样的变化?从技术层面讲,有哪些协作呢?

王毅:最明显的就是基础技术的互通,现在我们所有的应用,包括多看阅读,全部迁移到了小米帐号的体系下,多看现在也使用小米帐号,作为一个身份认证系统,小米帐号打通了整个小米的业务系统。用户可以基于小米账户做很多事情,比如访问云空间,以前的多看帐号是没有这项服务,但是随着无缝迁移至小米帐号后,用户可以通过小米账号登录,同步账号中的图书、笔记等信息到小米云空间。

与此同时,米币支付系统也是一大重点。支付系统是小米生态中非常重要的一环,现在游戏、主题和阅读都以统一的支付系统贯穿起来。同时支持各种各样的充值的方式,这样我们的用户不管是在移动端,还是在Web端都可以很方便地使用米币来支付,这也是合并之后的一大变化。

CSDN:多看目前有100多名员工,算是一个中等大小的团队。从技术层面看,您认为对于中小开发者来说,什么样的开发工具或服务是必需的?

王毅:我觉得从开发团队管理上讲,采用适合自己的开发工具是很重要的,因为这有利于大幅提升他们的开发效率。就好像我们的代码管理方式已经历了好几次的改变,最初我们使用的是微软一套代码管理系统TFS,后来开始使用SVN,由于SVN在分布式处理方面存在一些缺陷,所以最终采用了Git。

我认为选择工具的目的是尽量杜绝以往手工作坊式的开发方式,使开发更有条理和规范。与我们现在采用Git做代码管理的道理一样,因为Git的特点是分布式开发,它很便于分支,同时它也很轻量级,跨平台性能好,现在也是主流的代码管理工具。

我们的Bug管理现在采用的是JIRA,这也是目前整个小米体系下大多数团队所采用的平台。这个平台可以通过多种方式扩展,可定制接口和模块,轻量、灵活也是它的重要特性,能够有效地帮助中小团队解决项目管理问题。

天云盾:构筑在云端的Web安全防护 解析大数据时代的数据库集群技术 莫里航海图,最早的大数据实践 弥补空缺!HappyFox面向iOS开发者发布开源移动HelpDesk SDK Chitika北美网络流量报告:WP KO黑莓、iOS超Android 《近匠》秦时明月:知名IP光环下的生存之道 微软研究院正式发布编程学习游戏Code Hunt 走近讲师:Memblaze刘爱贵讲述云计算中的闪存应用 【云先锋】ClouDil云方案:PB级大数据解决方案 一周消息树:这是要“发”啊?Google Brain之父正式加盟百度 最受欢迎的游戏引擎集结号:小白篇 多盟总设计师邢开捷:四两设计拨千金 Cocos2d-x游戏《Monster Strike》终结《智龙迷城》霸榜神话 高通物联网技术解决方案:从汽车到智慧城市 Arduino携手Atmel 发布Arduino Zero开发板 以色列玫瑰:细数十位科技创新领域的女性佼佼者 8款最佳的开源在线学习CMS系统 在发布站点前,Web开发者需要关注哪些技术细节? TOCC、中航信、高德、北斗平台重磅专家登场 邀您共享ITS技术盛宴 腾讯大数据之TDW计算引擎解析——Shuffle AMD APU14 BEIJING技术创新大会精彩看点 这是云整合时代开始的节奏吗?Rackspace考虑退出 一周热点:如何使用15美元每月的机器实现百万文档检索 黑客获取数据信息的目的和进攻手段及应对之策 Surface Pro 3遭大曝光:799$起、四色可选、12寸屏幕 当软件遇上设计,浅谈敏捷UX VS.精益UX DIY“物联网”——自己动手处理传感器数据 AMD成首家X86+ARM双架构计算 欲寻新蓝海 锤子手机发布:Smartisan T1与其背后的开发团队 第六届中国云计算大会在北京隆重举行 替代笔记本的Surface Pro 3:800g、9.1mm,极致轻薄 告急?(在线等待) 用正则表达式,怎么验证日期(yyyy-mm-dd)的输入啊? kao~ 请教有关MSWORD9.OLB的帮助文档是哪个? 怎样知道一个调度执行失败或没有执行???(MSSQL7)上火呀~~~ 如何将自己定义的记录类型转化成Tmemorystream对象? c++builder5的下载地址? 做个调查,来者有分。 ODBC下的数据库查询,急!急! 初学者的问题--com dll服务器如何在客户程序中使用? 如何统计 DBGrid 中记录的个数???? 请教:m_fLogfile.Read(pBuffer , sizeof(VNumAndPassWord)); 错在哪? 谁能替我做一张图片啊? 气死人了,安装红帽子在输入根口令时遇到的尴尬:( 奇怪的oracle数据库错误? 公布我的软件了——网络邮盘,国内日下载量>1000,国外<10 关于堆和栈的队! 请问,准考证的英文怎么说? ASP终极开发:请成功用INSTALLSHIELD设置好IIS的高手朋友进来看看。100分全散了!!!!! 是屏保的问题?还是硬件故障? 紧急救命啊!各位大虾:)98关机时断电出现的故障 初级问题,请教大侠 在C#里面如何取得这个SQL値那? 请教, 扫描的问题... 不好意思,还有问题,关于span,恳请高手答完再下班。 心情郁闷,各位朋友安慰我一下好么。 如何注册JDBC驱动啊!我手头好多的驱动但是我不知道如何的注册这些驱动 在RICHEDIT里怎么实现换行输出? 200分求快速取中值的算法!(thirdapple) Flash Action 如何定时,就像Javascript中的setTimeout()? 保护的问题 用一个关于Printer对象的问题?各位大虾,初来乍到,请多多关照。 请问如何自动提交一个FORM? 请问各位师兄:web开发如何起步?例如使用JSP? 求助! 如何知道电脑中的网卡是什么型号的? 大家请帮忙,兄弟必重谢,分都给了 如何制作含有msdn数据库的安装程序 Web Service服务程序如何增加对SSL的支持? 怎么還可以上網﹐向各位大蝦求救 请问如何自动提交一个FORM? 如何处理并发访问! 如何在网页中打开*.ocx组件?是否能打开? 如果给我再来一次的机会...我还是想说... 求随机数发生器的算法 高手来拿高分!!!!!!!!!求开发自定义服务器控件的好书或代码 那位有ESQL(嵌入SQL)中文资料? 如何select LONG类型的字段? 红帽子里面可以演戏吗? 如何改变 Win me 快捷方式上的小键头图标。 ANY元素不是可以表示“任意”吗?为什么这个不行? 皇帝的新装 八下地理复习提纲 湘教版第一节 中国的主要产业第二节 沿海万里行······ for children,the important one is that of receiving gifts.其中OF是什么用法和意思? 汉译英几个短句记得外出时吧外套穿上(WHEN,PUT ON)你一定很累,应该去睡觉打破这扇窗他们全家都喜欢在花园里干活 2011年底考四级,要怎么复习! The relation of genius to talent is the same as that of instinct to reason中that of的用法!去掉不用行么?这里是什么用法? the man __ me is talking loudly with the girl __.A .in front ,to his leftB .in front of,to his rightC.at the front of,on his leftD.in front of,on his right为什么? 2011年英语四级考前如何系统复习? Is your school life that of other teens?这个句子中that是什么用法Is your school life ____ of other teens?a.this b.the same c.one d.that为什么选that啊? 汉译英 几个短句请翻译以下内容:这是一封来自中国的邮件.由于看到中国的泥炭需求量大增,陆续有欧洲和北美的泥炭公司进驻中国市场,谋求发展.如果您欲在中国市场寻求商业机会,请关注 She went to the zoo after lunch.(改为一般疑问句) A commonly held superstition is that of touching wood for luck.为什么加个of?这是什么特殊的用法吗?为什么is后面是that of touching不直接是is touching或者is that touch?到底为什么是of touching?为什么一定要加一 我不认识音标,怎么学啊 that +of 是什么用法请举个例子好吗 为什么问句中glue前面是用some,而不用any 音标也不认识啊 翻译: 安徽省合肥市香樟城市花园 7栋10单元 507室 邮编241000翻译地址: 安徽省合肥市 芜宁路 香樟城市花园 7栋10单元 507室 邮编241000安徽省合肥市 镜湖区 芜宁路 香樟城市花园 7栋10单元 507 是在表请求的问句中some不用改any吗? 不认识音标怎么办我想问一下,等我上初中的时候,英语试卷上会不会考音标 that + of 是什么用法,请举例说明 09年12月19号英语四级估分听力:短对话3个 长对话2个 听力短文理解3个 听力填词3个 听力句子0个快速阅读:填句子0个选词填空:1个仔细阅读:3个完型填空:7个翻译:0个作文中等 The boy's______ is tom 中译英,软件机器直译的勿进,地道一点1.已将化学制剂(chemical (IPA))及时清理出房间,并在房间中设置化学制剂的最大存放量(1瓶)2.增加一个可抽风的柜子去保存打印机,使其余净化间(clean 十二月19号考完四级之后多久可以拿证通过的情况下~ 怎么能认识音标!怎么能认识和读好它! 到安徽合肥肥东,哪个火车站离肥东最近交通方便,我要去肥东镇 撮镇 大丁村 马场组. 坐什么公交可以到附近.万分感谢坐什么公交,到哪个站下,然后怎么到撮镇 大丁村 马场组? 关于that of的用法They believe the data support an idea current among marine biologists,that of the "shifting baseline".这句话的意思是:在这些海生物学家中,他们相信目前的数据支持当前的想法,那就是所谓的“转 Tom's brother is clever,_________ the boy can't be trusted.A.only B.or C.for D.and 合肥市肥东县在哪学英语比较好 watch怎么读 怎么快速认识音标? 合肥肥东的变化快,急!6小时以内只要是农村的变化都可以 The town is no longer _____it was five years ago,______it was quite dirty.A what ; which B that ; which C what ; when D that ; where the boy on the bike is tom's brother.对on zhe bike提问,怎么写?little john does his homework every day.对does his homework提问,怎么写?最快的就选! 请教"中共合肥市直属机关工作委员会"的英文翻译 以下的字怎么读 英语翻译求翻译 合肥肥东县政府在哪怎么走都走不到 watch out! She does (her homework) in the evening对括号部分提问 过去式,some要改成any吗 watch out 与watch out for的区别he minds so much about his position in the office that he_____any chance to be promoted.中为什么用watch out for而不用watch out 多伦多属于什么气候类型 some的过去式只要some的过去试只要答案正确, That's why I propose,that as of today;这句话中as of 的用法是什么? Tom is a boy w____ small eyes and a big nose. do some reading 的过去式是什么? as that用法A large-amplitude compression wave,as that produced by an explosion or by supersonic motion of a body in a medium.中that是指wave么? The boy with big eyes _______ (not be) my brother.The boy in a red T-shirt _______. 过去式的问句中前面的do变成过去式了后面的动词还要变过去式吗 形容词最高级前加the,那么比较级前面加说明? 高中英语省略句的题,1到9 do some shopping的过去式 汉译英(几个短语)1)紧张 2)多喝水 3)太多 4)饮食习惯 5)与.不同6)每年一两次 7)很,非常 8)前往 9)根据,依靠 He is a successful businessman改感叹句?a businessman he is 翻译:watch out 比较级前面不用加the,最高级加the ,对吗 My father is a businessman. He likes _________(make)money.He ___________(be) a businessman forMy father is a businessman. He likes _________(make)money.He ___________(be) a businessman for ten years. 关于watch out for和watch out 的区别?还有protect.from doing. 汉译英的几个短语几个短语 do you know what's going on between your legs?求翻译
备案号:鲁ICP备13029499号-2 说三道四 www.s3d4.cn 说三道四技术文摘