说三道四技术文摘-感悟人生的经典句子
说三道四 > 文档快照

【云先锋】数云:另类淘宝创业,瞄准背后百万卖家的数据挖掘

HTML文档下载 WORD文档下载 PDF文档下载
从2011年4月成立,5月便获得天使投资,杭州数云抓住电商行业发展的趋势,针对背后海量数据,他们推出了让广大中小企业用上物美价廉的数据挖掘和营销自动化软件产品,一举获得了成功。

电子商务的快速发展和普及,催生出海量的数据,如何让数据产生价值,数云做到了。 2011年4月,杭州数云信息技术有限公司正式成立,其定位为让广大中小企业用上物美价廉的数据挖掘和营销自动化软件产品。淘宝上聚集了百万级的卖家, 为卖家提供数据分析和营销类的应用产品。这是一个以数据挖掘和营销自动化为业务主线,以互联网软件为主要服务模式,以电商行业为主要业务领域的新公司。

2011年5年,数云获得了天使投资,2012年9月,数云得到了红杉资本的A轮融资。我们A轮融资的时候,我们只有20家客户,这是2012年初谈的,2012年中结束的。为什么最后我们还是获得了红杉资本的融资,第一个是团队,虽然当时我们只有20家客户,但是这20家当时的情况来看,足以帮我们孵化200家,300家,为什么?这20家不是找销售团队,就是我们早期的创始团队,都是找各个类目的标杆卖家,最有影响力的标杆卖家,通过他们证明我们的这个产品是能够给客户带来价值的。接下来就是你怎样增长规模的问题了,投资人是看你的这个商业模式成了没有,你通过这个产品给客户创造价值,客户是不是认同。其次,就是我们产品的优势。当然,还有就是大家对这个行业的看好,大数据和数据化营销这样一个行业的看好。本文来自对该公司CTO段勇的采访整理。


段勇

杭州数云信息技术有限公司CTO,数据挖掘和建模应用专家,数云核心技术团队成员在云计算、SAAS、数据挖掘、CRM软件等领域拥有多年的开发和实践经验,数云的技术团队目前有108人。


产品体系

数云的产品体系包括客户关系管理(CRM)和商业智能(BI)两大产品线,支持跨平台的线上线下数据源整合,从品牌层面实现以客户为中心的智能营销管理体系。

  • 数云的CRM软件产品——数据赢家是一套针对B2C零售企业的CRM软件。数据赢家可以高度灵活地实现3W1H(在合适的时间—when、对合适的人—who、用合适的方式—how、沟通合适的内容—what)精准营销活动设计,并自动化实现从执行到评估的流程。
  • 微营销中心是数云精心打造的淘宝第一款微博营销管理工具,利用微博提高店铺曝光率、借用产品吸引微博上的目标客户群,将粉丝的微博行为与在淘宝的消费行为进行关联,自动发放奖励激励粉丝传播品牌信息,使粉丝直接转化为客户,让微博营销带给客户全新的盈利感受!
  • 数云智多星是一款旺旺专业客服插件,同时兼容千牛。可单窗口完成淘宝后台操作工作,有效简化客服工作,提高接待效率,并在客服端有效做好二次营销,老客户维护,是淘宝卖家提高客服效率,提升订单转化率的首选工具。

核心技术架构

数据赢家的业务特点和服务模式决定了我们既需要考虑传统企业应用的复杂业务架构,也需要考虑互联网场景下的高并发、大数据处理带来的性能问题,以及快速业务发布带来的灵活扩展要求。

在整体架构上我们分为原始数据层、基础服务层、应用层、展现层。

其中原始数据层从各大电商平台准实时的同步各种业务数据,日处理事务数在亿级。这一层主要是做 ETL的工作,其中E、T、L都是分布式的后台应用,并通过Kafka异步解耦。
基础服务层是我们服务化的思想体现。这一层有基于hadoop集群提供的离线计算服务、基于不同数据库集群提供的实时数据查询服务以及OLAP服务,也有很多不同业务类型的公共服务。这些基础服务主要以restful接口对外提供service,方便上层应用快速开发。
应用层是实现业务逻辑的主体,不同模块根据业务和技术特点会采用OSGI、消息驱动、规则引擎、工作流等技术方案。
展现层通过数据接口与应用层交互,可以方便的使用相同的接口开发不同的展现层界面。总的来说,我们技术架构的几个关键词是:异步、解耦、服务化、分布式、业务拆分。

数据挖掘的挑战和趋势

段勇表示目前数据挖掘面临的挑战主要有几个方面:

  1. 数据收集和整合的困难。如何从多个渠道收集客户的数据并进行关联,这是一项非常耗时和具有挑战的工作,也是大数据分析最重要的环节之一。
  2. 海量数据的实时分析。随着数据量的增长,传统的数据挖掘工具和算法已经不能满足实时数据分析的需求,需要使用新的数据分析平台技术,例如分布式、内存计算等。
  3. 面向业务人员的数据可视化挑战。数据分析不再只属于数据分析师,很多业务人员也要参与到数据分析过程中来,针对这些使用人群提供简单、直观易用的数据分析工具和成果有很大的挑战。
  4. 人才的问题。企业急需要大量的懂数据懂业务的数据分析师,这一块人才是供不应求的。

CRM发展趋势:随着近两年中国传统零售和消费品生产企业电商战略的快速发展,电商企业的竞争加剧,给企业经营带来的挑战越来越大:首先,流量困境,流量成本越来越高;其次,产品同质化,产品经常被模仿甚至假冒,产品的生命周期越来越短;最后,价格战凶猛,不促不销。CRM将成为今后B2C零售企业的标配,就像传统制造企业对于ERP的需求一样。而且,CRM一定会为企业的数字化营销带来巨大的变革。

Cloud Edge:中国“云先锋”系列报道
序号 公司名称 成立时间 CEO/CTO 官方微博 公司产品/方向
1. 云适配 2012年 陈本峰
网站适配
2. 友友 2010年 
姚宏宇
@友友微博 C、C++、Java产品研发 
3. 聚合数据
2010年
左磊 
@聚合数据管 移动数据服务
4. Anchora 2009年 鲁为民       

MoPaaS和InPaaS 
5. 够快 2012年
蒋烁淼 @够快科技 
云存储
6. 文思海辉
2012年 吴凯
@文思海辉 OpenStack公有云       
7. 搜狐云 2011年 邱英波
SendCloud                  
8. 联想云存储 2009年 罗予晋
云存储
9. 南京讯之智 2012年 谢晚霞
大数据实时分析
10. 上海圣何赛 2012年 
金剑 

云管理、云存储                
11. 国云科技 
2010年
季统凯
@国云科技 云操作系统                
12. SSO365 2012年 赵健                

云安全、云身份认证 
13. ClouDil云方案 2001年
叶滨 @世纪鼎利 
通信运营商                
14. 多备份 
2013年 胡茂华            
@木浪 云备份                 
15. 上海越诚软件 2011年 王炜                  
基于云的建站软件超市 
16. 云智慧 2009年 殷晋 @监控宝 云监控、基于大数据APM
17. 深圳泽云 2012年 何巨彬
高性能存储系统
18. 深圳智冠 2004年 卢慧莉  
手静脉生物识别、虚拟化
19. 北京沃安科技 2009年 曹学武 @沃安科技 移动视频技术提供商
20. 星环信息科技 2013年 孙元浩 @星环科技 大数据分析平台
21. 杭州数云 2011年 宣晓华 @杭州数云 数据挖掘
备注:2014年9月9日更新,持续更新中......


备注:云先锋系列文章是由CSDN云计算频道打造的,主要报道国内外在云计算、大数据方面具有独特竞争优势的企业,以传播技术为目的,推动中国云计算技术的发展,只有你有云计算或大数据方面独特的技术、产品和服务,你就可以投稿,欢迎投稿weiwei@csdn.net。

备案号:鲁ICP备13029499号-2 说三道四 www.s3d4.cn 说三道四技术文摘