携程回应官网瘫痪12小时原因:员工错误操作

29.05.2015  20:26

  29日,针对昨日携程官网和APP瘫痪的原因,携程官方发表回应,称经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。

  28日上午11:09,携程称因为部分服务器疑似遭到不明攻击,导致官方网站及APP暂时无法正常使用。晚上22时45分,携程官方确认除个别业务外,携程网站及APP恢复正常,数据没有丢失。

  对于为何恢复时间长达12个小时,携程官方解释,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个WebService组成,而每个应用子系统和每个WebService之间都存在着相互调用的依赖关系。

  携程称,发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个WebService的功能正常,同时确保应用子系统与WebService间的调用关系得以正常执行。

  “这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与WebService功能的正常运行。

  携程再次保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,并表示携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。

  最后,携程还称,为了避免此类事件再次发生,携程已经在系统上做了改进,以规范并杜绝技术人员错误删除生产服务器上代码的操作。