2015 年 5 月 8 日:即时聊天 IM 服务故障说明

上午 10 点左右,我们接到用户反馈,说聊天室中的新会话出现丢失。经过分析和追踪,我们确认这是由于今天早上服务端一次版本更新后,导致使用 IM 2.0 服务的应用出现了问题,所以在同日上午 11 点 12 分对代码进行了回滚,新会话丢失的现象随即消失。

故障时间

2015-05-08 08:54 至同日 11:12(持续约 2 小时 20 分钟)

受影响的服务

实时通信服务(IM)2.0

未受影响的服务

  • API 服务
  • 消息推送、短信服务
  • 数据存储服务
  • 应用统计服务
  • 网站和开发文档

故障原因及补救措施

我们在今天早上 08:54 分发布新 API 功能时,由于疏忽,引入了一个漏洞,导致任何使用 IM 2.0 的应用在更新会话时会意外将会话删除。使用 IM 1.0 的应用则不受影响。我们采取了以下措施进行补救:

  • 回滚 API 代码到上一发布版本。
  • 从备份数据里中恢复受到影响的会话列表(约 700 个)。

我们将改进

  • 新代码发布前,必须通过单元测试和同伴的再次审核。
  • 将所有创建对象的请求的具体内容记入日志,以便于在故障发生之后,有效地进行数据恢复。

我们对此次故障给用户造成的影响表示诚挚的道歉!我们会改进工作流程,避免类似错误再次发生。如果您对此故障有任何疑问,请及时与我们联系。

发表评论

电子邮件地址不会被公开。 必填项已用*标注