说三道四技术文摘-感悟人生的经典句子
说三道四 > 文档快照

【云先锋】数云:另类淘宝创业,瞄准背后百万卖家的数据挖掘

HTML文档下载 WORD文档下载 PDF文档下载
从2011年4月成立,5月便获得天使投资,杭州数云抓住电商行业发展的趋势,针对背后海量数据,他们推出了让广大中小企业用上物美价廉的数据挖掘和营销自动化软件产品,一举获得了成功。

电子商务的快速发展和普及,催生出海量的数据,如何让数据产生价值,数云做到了。 2011年4月,杭州数云信息技术有限公司正式成立,其定位为让广大中小企业用上物美价廉的数据挖掘和营销自动化软件产品。淘宝上聚集了百万级的卖家, 为卖家提供数据分析和营销类的应用产品。这是一个以数据挖掘和营销自动化为业务主线,以互联网软件为主要服务模式,以电商行业为主要业务领域的新公司。

2011年5年,数云获得了天使投资,2012年9月,数云得到了红杉资本的A轮融资。我们A轮融资的时候,我们只有20家客户,这是2012年初谈的,2012年中结束的。为什么最后我们还是获得了红杉资本的融资,第一个是团队,虽然当时我们只有20家客户,但是这20家当时的情况来看,足以帮我们孵化200家,300家,为什么?这20家不是找销售团队,就是我们早期的创始团队,都是找各个类目的标杆卖家,最有影响力的标杆卖家,通过他们证明我们的这个产品是能够给客户带来价值的。接下来就是你怎样增长规模的问题了,投资人是看你的这个商业模式成了没有,你通过这个产品给客户创造价值,客户是不是认同。其次,就是我们产品的优势。当然,还有就是大家对这个行业的看好,大数据和数据化营销这样一个行业的看好。本文来自对该公司CTO段勇的采访整理。


段勇

杭州数云信息技术有限公司CTO,数据挖掘和建模应用专家,数云核心技术团队成员在云计算、SAAS、数据挖掘、CRM软件等领域拥有多年的开发和实践经验,数云的技术团队目前有108人。


产品体系

数云的产品体系包括客户关系管理(CRM)和商业智能(BI)两大产品线,支持跨平台的线上线下数据源整合,从品牌层面实现以客户为中心的智能营销管理体系。

  • 数云的CRM软件产品——数据赢家是一套针对B2C零售企业的CRM软件。数据赢家可以高度灵活地实现3W1H(在合适的时间—when、对合适的人—who、用合适的方式—how、沟通合适的内容—what)精准营销活动设计,并自动化实现从执行到评估的流程。
  • 微营销中心是数云精心打造的淘宝第一款微博营销管理工具,利用微博提高店铺曝光率、借用产品吸引微博上的目标客户群,将粉丝的微博行为与在淘宝的消费行为进行关联,自动发放奖励激励粉丝传播品牌信息,使粉丝直接转化为客户,让微博营销带给客户全新的盈利感受!
  • 数云智多星是一款旺旺专业客服插件,同时兼容千牛。可单窗口完成淘宝后台操作工作,有效简化客服工作,提高接待效率,并在客服端有效做好二次营销,老客户维护,是淘宝卖家提高客服效率,提升订单转化率的首选工具。

核心技术架构

数据赢家的业务特点和服务模式决定了我们既需要考虑传统企业应用的复杂业务架构,也需要考虑互联网场景下的高并发、大数据处理带来的性能问题,以及快速业务发布带来的灵活扩展要求。

在整体架构上我们分为原始数据层、基础服务层、应用层、展现层。

其中原始数据层从各大电商平台准实时的同步各种业务数据,日处理事务数在亿级。这一层主要是做 ETL的工作,其中E、T、L都是分布式的后台应用,并通过Kafka异步解耦。
基础服务层是我们服务化的思想体现。这一层有基于hadoop集群提供的离线计算服务、基于不同数据库集群提供的实时数据查询服务以及OLAP服务,也有很多不同业务类型的公共服务。这些基础服务主要以restful接口对外提供service,方便上层应用快速开发。
应用层是实现业务逻辑的主体,不同模块根据业务和技术特点会采用OSGI、消息驱动、规则引擎、工作流等技术方案。
展现层通过数据接口与应用层交互,可以方便的使用相同的接口开发不同的展现层界面。总的来说,我们技术架构的几个关键词是:异步、解耦、服务化、分布式、业务拆分。

数据挖掘的挑战和趋势

段勇表示目前数据挖掘面临的挑战主要有几个方面:

  1. 数据收集和整合的困难。如何从多个渠道收集客户的数据并进行关联,这是一项非常耗时和具有挑战的工作,也是大数据分析最重要的环节之一。
  2. 海量数据的实时分析。随着数据量的增长,传统的数据挖掘工具和算法已经不能满足实时数据分析的需求,需要使用新的数据分析平台技术,例如分布式、内存计算等。
  3. 面向业务人员的数据可视化挑战。数据分析不再只属于数据分析师,很多业务人员也要参与到数据分析过程中来,针对这些使用人群提供简单、直观易用的数据分析工具和成果有很大的挑战。
  4. 人才的问题。企业急需要大量的懂数据懂业务的数据分析师,这一块人才是供不应求的。

CRM发展趋势:随着近两年中国传统零售和消费品生产企业电商战略的快速发展,电商企业的竞争加剧,给企业经营带来的挑战越来越大:首先,流量困境,流量成本越来越高;其次,产品同质化,产品经常被模仿甚至假冒,产品的生命周期越来越短;最后,价格战凶猛,不促不销。CRM将成为今后B2C零售企业的标配,就像传统制造企业对于ERP的需求一样。而且,CRM一定会为企业的数字化营销带来巨大的变革。

Cloud Edge:中国“云先锋”系列报道
序号 公司名称 成立时间 CEO/CTO 官方微博 公司产品/方向
1. 云适配 2012年 陈本峰
网站适配
2. 友友 2010年 
姚宏宇
@友友微博 C、C++、Java产品研发 
3. 聚合数据
2010年
左磊 
@聚合数据管 移动数据服务
4. Anchora 2009年 鲁为民       

MoPaaS和InPaaS 
5. 够快 2012年
蒋烁淼 @够快科技 
云存储
6. 文思海辉
2012年 吴凯
@文思海辉 OpenStack公有云       
7. 搜狐云 2011年 邱英波
SendCloud                  
8. 联想云存储 2009年 罗予晋
云存储
9. 南京讯之智 2012年 谢晚霞
大数据实时分析
10. 上海圣何赛 2012年 
金剑 

云管理、云存储                
11. 国云科技 
2010年
季统凯
@国云科技 云操作系统                
12. SSO365 2012年 赵健                

云安全、云身份认证 
13. ClouDil云方案 2001年
叶滨 @世纪鼎利 
通信运营商                
14. 多备份 
2013年 胡茂华            
@木浪 云备份                 
15. 上海越诚软件 2011年 王炜                  
基于云的建站软件超市 
16. 云智慧 2009年 殷晋 @监控宝 云监控、基于大数据APM
17. 深圳泽云 2012年 何巨彬
高性能存储系统
18. 深圳智冠 2004年 卢慧莉  
手静脉生物识别、虚拟化
19. 北京沃安科技 2009年 曹学武 @沃安科技 移动视频技术提供商
20. 星环信息科技 2013年 孙元浩 @星环科技 大数据分析平台
21. 杭州数云 2011年 宣晓华 @杭州数云 数据挖掘
备注:2014年9月9日更新,持续更新中......


备注:云先锋系列文章是由CSDN云计算频道打造的,主要报道国内外在云计算、大数据方面具有独特竞争优势的企业,以传播技术为目的,推动中国云计算技术的发展,只有你有云计算或大数据方面独特的技术、产品和服务,你就可以投稿,欢迎投稿weiwei@csdn.net。

【工具推荐】Vert.x——非阻塞、高并发的编程开发框架 Google搜索在确定结果排名时会将网站的移动设备适用性作为考量因素 W3C首次发布SVG标记、SVG轮廓标准工作草案 第七届中国云计算大会 | 首批主会演讲嘉宾和议题公布(表) 安沃传媒创始人王旭东:开发者从移动广告获利的黄金时代已经来临 【舌尖上的CTO】砂锅馄饨的交付件 微软新Visual Studio Code开发工具支持Mac和Linux 科技新创公司想做大?从CNN记者跳槽Snapchat谈起 Java二十年特别奉献:晒博文、赢大奖! 《近匠》华为创新总监蔡绪鹏:智能手表的三大感知与未解难题 从Samurai-Native框架开发谈React Native Qualcomm公司李申:Vuforia打破AR设备界线 物与物的互通:解析Thread、AllJoyn、OIC、Bonjour的特点 《天龙八部3D》中Unity使用介绍 微软推出ManifoldJS,Web App自动转成各平台本地App 专访庄晓丹:Java程序员眼中的Clojure 全面解析ECMAScript 6模块系统 七牛技术总监陈超:记Spark Summit China 2015 Project Tungsten:让Spark将硬件性能压榨到极限 Android手表在中国这样落地 ART运行时Foreground GC和Background GC切换过程分析 开创未来的关键:是什么造就了硅谷?(上) 微软前员工:开发Apple Watch应用的27个技巧 Apple Watch应用开发:从再造墨迹天气谈起 Java二十年特别策划:有奖征文,评选结果出炉! Zen=禅道:图解AMD技术战略转型 从友盟微社区看Android第三方SDK架构实践 无创客 不青春!2015全国大学生移动应用创新大赛在京启动 响应式Web开发,必懂媒体查询(系统理论+实战教程) 实例剖析:如何用Foundation For Apps创建完美Web应用 【舌尖上的CTO】兄弟肉夹馍的开发运维一体化 请问在CB中如何隐藏WINDOWS的任务栏呢? 今天不爽,下班后打星际,大家一起来。 指点!在PB中怎样用程序作成一张动态的交叉表 编辑控件怎样才能显示那些怪字符? 有没有人喜欢郑智化 大家推荐好听的几首歌吧! 请教:怎么学c++? 高手点拨! 各位网络高手.如何在程序里讲ip地址转化为域名 有什么方法,可使表单内的组件背景变成透明的而文字不透明,请看例子: 编辑控件怎样才能显示那些怪字符???? swall(壹心) 你还在深圳特区吗? 如何设置Session的密码?请高手指点迷经^^^^^ 哪位可以解释一下下面的代码? perl 的人气太差。罢了罢了。找本perl自己搞定 MsSQL7.0 当日志文件大小未限制而变得很大时,怎样清日志文件,使其减小? 请教诸位牛兄牛姐牛夫人---有难度哦(着急出活!) 基本问题:如何将一个.txt中的内容读入到内存再从内存中读出并存为另一个文件?谢了先!!!! 高手帮帮忙!!!!!!!!!!!!!! 又有台风了。。。。 在zip包中加入ASP推荐的PAD File有用吗????? PB连接SQL数数库,为什么显示的表会不全 如何把一个文件file.dat里的数据写入软盘0磁道0磁头1扇区. 我要骂人! chris2001(牛虻),不是东西 华为工程师 谁知道 vb 的序列号?????? VS.NET 有开了个新铺子。为什么我的ejb/j2ee还没有开张。气愤。 老大们:我是菜鸟,有问题要问,不过不要笑我。一定给分的 再次发问:关于在SQL SERVER中的某张表上建立触发器...... 没有有这样的病毒,或者文件 各位老大,如果有asp、sql基础学jsp和php是不是比较容易一些呀?言者有分哦! dll中怎样调用主程序中的函数? 新手请教接口聚合!!!!!!!!! 高分求教!有没有谁编写过WEB服务器程序? 微软OfficeXp女孩 请教一个报表问题? 小技巧!!! delphi中调用MessageBox出错,高手指点一下。 大家好,这是我提的第一个问题!我学DELPHI才两周!对您的指点,小弟万分感激! 请问sybase12。0中,游标能不能用动态sql申请 紧急求助:如何调用父对话框的函数 各位好,我在VB下做了一个ACTIVE 控件,但是加不到CBUILDER 上,但能加到VB里,为什么? 婚介所 关于C++打开文件的问题? 请教一下关于多表查询的问题 求助:中文Delhpi帮助 为什么我的rose装好后没有html帮助?还有安装时应该选择client还是administrator? cathy0505;chenkane;zhangshicun;swall;(_2_);riluo;wt13;MonkeyLin;seedundersnow;qancy_chen;cathy0505;acute 一个很简单的问题,怎样把一个php字符串变量转为实型变量 用过2K/NT DDK的大侠:如何在2000的内核里编程向硬盘里写文件,如:写c:\a.txt到C上,给我一段代码? 我急需一个“医院生殖中心病历管理软件”,sbf2000@363.net 请问一立方100摄氏度的开水有多少热量?一立方300摄氏度的水蒸气 压力为9.8公斤 有多少热量? 管道压力表、真空压力表一般与何种阀门连接?现在有两种阀门Z43F-16C Q41F-16C 压力表一般和哪种阀门连接啊. 0.1mol的铜与足量的浓硫酸反应生成SO2的体积约为22.4 L 用0.6MPa压力的管道蒸汽直接加热1T水,从15摄氏度到100摄氏度,需要多少立方蒸汽,换算KW数要多少KW能量 φ76的管道,压力0.5Mpa每分钟流多少方水 常温常压下 1mol二氧化硫的体积小于22.4l这句话正确,为什么 不同压力下水升高1摄氏度需要的热量一样吗蒸汽锅炉里的压力大约是1MP,50摄氏度升到80摄氏度需要多少热量?和在标准大气压下一样吗? 管道φ219,压力0.4-0.5MPa流量150m3/h需提高压力1.0mpa用多大管道增压泵 在20度温度下,压强为101kpa时1mol的氧气和1mol的二氧化碳为什么所含的分子数相等?不是2和3吗? 如果3个溢流阀依次串联联接,且它们的调定压力依次为6MPa、4MPa、7MPa 那么液压泵的出口压力为多少? 给水管道试验压力是如何确定说明其合格标准 1mol氢气和0.5mol氧气在相同状况下混合,求混合气体中氢气的体积分数,物质的量分数和质量分数 反应釜机械密封压力怎样调节,使用什么测量,依据什么来调整 请问进气管道压力5MPa 管子直径10毫米,忽略阻力,求1小时流量是多少?出口0.1MPa,空气,管道长度1米 同温同压下,分别为1mol的氢气和氧气,它们的〔 〕(A)质量相同,体积不同 (B)分子个数相同,质量不同 (C)体积相同,分子数不同 (D)体积相同,分子数也相同 为什么不是D? 溢流阀的选择 我做实验用的,液体压力要维持在3mpa,4mpa,6mpa等,溢流阀选哪种合适呢,可调可控就是我设定一个值,到达那个值后就溢流,不到继续上压 差压变送器测流量用的温压补偿公式设计温度和设计压力是怎么来的?有没有通用数值的?我们厂的煤气管道就是露天的,夏天最高有45度,冬天最低-5度吧.另外是不是说不同的管道这2个参数不同 下列物质中所含微粒物质的量最多的是A 3.01×10∧23个镁原子 B 1mol氮气 C 4克氢气 D 36克氧气 在精馏操作中,塔釜压力为什么是一个重要的参数?塔釜压力与什么因素有关? 孔板流量计为什么要加压力补偿和温度补偿 标准状态下,1mol的水体积是多少?存在22.4升的水蒸气吗?化学里面的确是说标准状况下没水蒸气没错,但是物理题目里动不动就来个“标准状况下1mol的水蒸气体积是22.4升,请问此时水分子间的 很多地方提到高压反应釜,到底承受多少压力才算是高压反应釜.有高压就有中压和低压吧,如何区分? 孔板流量计上的NM3是什么单位 1mol水的体积和1mol冰的体积哪个大 酯化反应釜操作压力问题我设计的反应釜酸酐进料压力0.1Mpa,醇进料压力i0.1Mpa,出料0.9Mpa.1.搅拌釜内操作压力是0.2Mpa还是0.9Mpa呢?2.夹套内用水蒸气加热,工作压力是该温度下水蒸气的饱和蒸汽压 谁讲一下跟孔板流量计相关的知识, 1. 1mol的二氧化碳和1mol的水在相同状态下体积一定相等吗? 1mol的二氧化碳和1mol的水在相同状态下体积一定相等吗?不同的气体,若体积不等,则它们所含的分子数一定不等吗? 搪瓷反应釜、搪玻璃反应釜的性能 请问孔板流量计的测量原理? 1mol的氧气、1mol的水和1mol的铁哪个体积大 压力反应釜正负压怎么做 孔板流量计安装条件孔板流量计(流量计油表)安装管道在安装的时候有没有什么条件 0.1mol氢气和0.1mol水所含的分子数相同,在标准状况占体积都约是2.24L ;0.1mol任何气体标况下V都是2.24L这两句话 哪句错了啊? 请说下理由 谢谢! 什么样的压力容器需要型式试验,搪玻璃反应釜需要吗?新容规上说蓄能器等需要做型式试验,这个等包括反应釜吗? 在标准状况下1mol任何气体的体积都是22.4L那么在标准状况下11.2L氢气中的分子数是多少个 葡萄糖发生加成反应? 常温下使甲烷液化需要多大的压力?安全标准是什么?谢谢!RT 带夹套的不锈钢反应釜是不是需要检测的压力容器?蒸汽加热,需要温度105 容器内为常压,所需蒸汽压力2公斤请提供解释或依据夹套内为水蒸气,容器内为水和肉(猪肉、牛肉或羊肉),它是低压 在标准状况下,1mol任何气体的体积都是22.4L.那么,在标准状况下,11.2L氢气中的分子数是几个 哪里有沼气液化的设备?哪里有沼气液化工程? 搪瓷反应釜是几类压力容器 在标准状况下1moL水的体积是22. 沼气能液化吗?沼气如果直接用高压瓶装后还能用吗?建沼气政府有补贴吗? 半管加热的反应釜是否属于压力容器? 标准状况下1mol的混合气体的体积怎么是22.4L.分子间有较大的间隔.像酒精和水一样混合了不是会体积减少么 氧气在多大压力下可以液化?一般的医用氧气,纯度达到99%.99以上的氧气,在多大的压力下可以实现液化?这个压力大约等于多少公斤?我还想问下,在一定的压力下,氧气可以通过加压的方式实现缩 甲醇对20号压力容器用钢材有没有腐蚀性? 是不是当1mol气体的体积为22.4L时,它就一定处在标况下麽?1mol水蒸气在标况下的体积是22. 氢液化的温度是多少?常温下将氢液化的压力是多少?等于多少个大气压氢气在室温下不可能液化的话,那市场上买的那种氢气钢瓶里装的液态氢不是会爆掉吗? 求一反应釜各管道连接图 标准状况下,1mol任何气体所占的体积为22.4L 在标况下,1mol任何体积所占的体积约为22.4L多了一个约,为什么不同的题目上都对 供暖压力达到多少才能保证供热效果 压力表连在管道上,为什么压力表与管道连接处之间管道是弯成一个圆的样子 标况下,1mol三氧化硫的体积为22.4L 采暖总热负荷 循环泵流量 电机功率的关系? 管道压力表怎样装 1MOL SO2在20度 体积大于22.4L为什么是错的? 按流量供暖怎么计算 请问有没有关于化工设备(比如精馏塔,反应釜,管道等)的国家标准可查? 这种说法对吗?1mol三氧化硫和1mol二氧化硫体积均为22.4L如题
备案号:鲁ICP备13029499号-2 说三道四 www.s3d4.cn