微信因光缆被挖断导致宕机,通讯光缆再遇安全危机
发布时间:2013-08-09 新闻来源:中国电线电缆网
一次城建工人的失误,造成了微信史上最大规模的一次宕机,也让这个拥有4亿用户的超级即时通讯工具面对了自上线以来的最大危机。
从通讯中断后的修护时间之长,到光缆被挖断后的应急方案之弱,都让外界注意到,微信乃至中国互联网产业体系中曾被忽视的安全软肋。
宕机之后,微信团队恢复通讯的时间是6个小时,这在互联网乃至通信行业里都极为罕见,尤其是曾被认为需要向互联网学习的通信运营商,重新成为腾讯需要学习的对象。
“网络再烂的运营商,也基本不会出现全网中断;即使有局部地区短信中断或话路中断,基本也很少超过一个小时。甚至在雅安地震这样的灾难事件中,运营商也做到了在一小时内恢复75%的通信。”一位运营商人士告诉记者。
微信为何中断
实际上,这并不是微信第一次发生宕机事故。4月10日,微信曾因机房故障发生10分钟的中断。
但与上一次的短暂中断不同,此次长达6小时的严重事故,具有更大的影响与意义,仅其引发的7月23日股价波动,就让腾讯蒸发了近百亿市值。
作为中国最大的互联网公司之一,腾讯究竟为微信配置了怎样的基础架构,是如何保证机房数据安全、顺畅的?为何因为2根光缆的中断,就出现如此致命的网络问题?
实际上,微信在全国的机房架构均是遵循交互式的布局方式,因为不能将所有的鸡蛋都放置到同一个篮子里。面对4亿用户群体,微信不可能、也不会将所有的用户集中在一家服务器上。也就是说北京的用户数据不全存储在北京的机房里上,有可能存储在上海、广东等地的机房。而上海的光缆断了,会影响到存储到本地的北京、上海、广东、浙江等地的用户。
一般来说,大型公司为保证机房数据安全会设置光纤通信双保护,一旦其中一条光缆出现故障,可迅速切入另一条光缆,以保证数据传输。《财经国家周刊》记者了解到,此次,腾讯与上海运营商合作,已明确要求使用双光缆。
但从此次的宕机故障来看,这两条光缆却还是被放在了同一个管道中,变成了“双光缆、单路由”。
这就好比为了防止堵车,运营商应该为腾讯提供两条不同的路,一旦A车被堵在了A路上,任务可由B车通过B路完成。但现在,两条路却重叠在了一起,并且同时中断。
据悉,之前因为双光缆单路由的设置,曾导致QQ连接故障,所以腾讯一些重要的机房被改为双光缆双路由。但这个经验显然未被复制到微信上。“同时受到光缆被砍断影响的业务还有QQ的其他一些业务。”腾讯公关部总经理助理张军电话里对记者说。
对于用户规模越来越大的腾讯,其在基础设施的花费也变得庞大起来。腾讯财报显示,“移动及电信收费以及频宽及服务器托管费”位列开支项目中前三。从2004年到2012年期间,增长超过10倍,从3.16亿元增至34.08亿元。
宕机后遗症
微信宕机事件,再一次为互联网企业们拉响了警钟。
当前,在信息化浪潮的冲击下,每个国家的政治、军事、经济、民生,乃至每个人的生活与娱乐,都越来越依赖互联网,一旦互联网自身出现安全问题,所造成的影响将在更大的领域扩散,甚至可能引发更大危机。
事实上,腾讯不是第一个、也绝不可能是最后一个出现宕机现象的互联网公司。在此之前,新浪微博就曾两度出现宕机现象,而Google、维基百科也曾因各种原因数度宕机。
对互联网公司来说,每一次宕机,都有可能导致大量的用户离开。据IDC调查显示,1990-2000年间,美国发生过数据灾难的公司中,55%当时倒闭,29%在两年内倒闭,生存下来的仅占16%。
调研机构Qualix Group的一组数字,更说明了不同行业关键业务中断带来的金钱损失:服务器宕机1分钟,平均会使运输业损失15万美元,银行业损失27万美元,通信业损失35万美元,制造业损失42万美元,证券业损失45万美元……
而涉及到政府、国防、安全、电信、金融、交通和医疗等关系到国计民生的行业的关键业务,需要遵循“5个9(99.999%)”、“6个9”、甚至是“7个9”的标准。这意味着一台服务器每年的非计划停机时间分别只有5分钟、30秒和3秒钟。
综合来看,目前出现的各类宕机,可以归结为六大类:网络故障、应用系统本身产生的问题、基础设施问题、系统部署方案不合理,人为原因(如黑客攻击)以及硬件故障。
【打印】 【关闭】
分享到: | qq空间 | 新浪微博 | 人人网 | 豆瓣网 | MSN | 腾讯微博 |