说三道四技术文摘-感悟人生的经典句子
说三道四 > 文档快照

Bing,每月27亿的有效搜索不及僵尸网络的一半

HTML文档下载 WORD文档下载 PDF文档下载
做搜索引擎从来都不是件容易的事,与欺诈搜索的斗争更是从未间断。Bing以每个月27亿次的有效搜索荣登美国搜索引擎第三的宝座,然而经过调查发现:16天发生的Bing上的自动化搜索达到32亿次!然而这之中刨去大部分来自僵尸网络的搜索,还有一部分是来自数据中心的机器集群!

搜索引擎经营者除下要打造一个优秀的搜索平台,还要不停的与欺诈搜索幕后黑手斗争。这不Robert McMillan最近在Wired上撰文表示:微软必应以每个月27亿次的有效搜索荣登美国搜索引擎第三,然而在2011年10月16天一轮调查中发现,自动化搜索次数竟然高达了32次!然而除了一直作斗争的僵尸网络,还有一小部分的自动化搜索来自合法经营的数据中心。

以下为译文:

2011年10月,微软Bing搜索引擎处理了27亿次搜索,荣登美国搜索引擎第三。然而对比十亿计来自被入侵电脑的僵尸网络的搜索,这个数字却是黯然失色。

聚焦10月Bing的搜索数据中的16天,来自微软、莱特州立大学、乔治亚理工学院专家发现接近32亿的搜索来自动化软件 —— 绝大多数这些自动搜索请求来自僵尸网络。这比一个月的合法查询还多5亿。而在另一个5月的一次16天计数中,自动化查询的数字同样超过30亿。

来自Search Engine Land(聚焦搜索引擎的网站)的创始编辑Danny Sullivan说道:“自动化查询确实太多了。”这是搜索公司于欺诈者之间从不停止的争斗,欺诈者在受害人不知情的情况下,利用受感染计算机访问一些网站/广告从而获得中介费。

通过俄亥俄州代顿市的莱特州立大学副教授Junjie Zhang了解到,这些僵尸网络中一大部分寻求网站进行入侵或者是电子邮件地址发送垃圾邮件。

他说:“最常见的查询就是弱点查询,62亿查询中大约有1/3都在搜索‘使用PHP注册及登录系统’或者是‘WP-Forum插件基于WordPress’类似的关键词。”

这些搜索结果可以用于不法分子进行入侵之前的准备,给他们一张存在已知软件漏洞的网站列表。使用Fredrik Fahlstad在搜索引擎中查询,结果将返回易受SQL注入的网站列表,不法分子可以使用网站作为后门入侵所有者的数据库。

通过Zhang还了解到,僵尸网络同样会占用不菲的贷款,大约占自动查询(找电影预告片或在线优惠券下载)的3.6%。

有趣的是研究人员发现,并不是所有这些自动搜索垃圾来自入侵电脑。经过一个32天的统计,其中有大约3亿的查询来自专门针对Bing查询的数据中心主机。

Zhang并不能确定是来字哪些主机,他说是来自这些数据中心集群;报告显示,其中的一些可能来自云计算服务。报告上云:“这些来自数据中心的恶意行为可能表示出一个新的趋势,攻击者已经开始里要哪个云计算或者其它一些维护良好的基础设施进行攻击。”

但是也存在这些数据中心集群由合法公司运营的可能,它们利用Bing的搜索结果来建立营销页面。然后这些公司会赚取一定的中介费 —— 有时候只是几分;但是也存在几美元的情况 —— 一旦商品出售。Zhang说:“看起来就像是它们在搜索相关商品的信息,他们可能是想简化这些信息,然后组成一个更容易理解的数据库。”

Sullivan说:也可能是有些人在做搜索排行,让Bing把指定的页面放到更好的位置。

微软当然不会容忍僵尸网络对Bing为所欲为,在这方面微软与赛门铁克已合作超过一年,下面来看一下他们最近劳动果实:

微软与僵尸网络之战最近成果

赛门铁克最近透露,它们联手催化了一个名为Bamital的僵尸网络;该僵尸网络在用户不知情的情况下控制了全球数十万台的计算机,利用fraud-click(涉及重定向谷歌、必应、雅虎等搜索引擎,强制被感染计算访问指定广告)获利超百万美元。为了阻止Bamtial,搜感染的计算机被禁止在互联网搜索,而这两家公司告诫其计算机已收到僵尸网络的感染,并免费提供清除工具。

原文链接: Microsoft Bing Battles Bot Queries by the Billions (仲浩/编译 王旭东/审校)

欢迎关注@CSDN云计算微博,了解更多云信息。

备案号:鲁ICP备13029499号-2 说三道四 www.s3d4.cn 说三道四技术文摘