2016 年 2 月 26 日:聊天服务短暂异常的故障说明

2016 年 2 月 26 日下午五点左右,我们的聊天服务出现了短暂异常,导致部分终端用户在获取指定聊天记录时,可能会得到整个应用的聊天记录。此次故障持续了十多分钟,具体情况如下。

故障时间

16:45 至 16:58(持续约 13 分钟)

影响范围

使用了聊天服务,且在服务异常期间发生了聊天记录查询请求的所有应用

故障处理

  • 16:45 我们对生产 Web 服务器应用了新的配置以优化性能。
  • 16:56 内部监测系统发现聊天服务流量异常并发出报警。经查确认新配置中的部分规则没有产生预期效果,在处理聊天记录 REST API 请求(/1.1/rtm/messages)时会忽略掉所有查询条件(query string)而返回应用下的所有聊天记录。
  • 16:58 立刻恢复原有配置,问题得到解决。

改进措施

随后我们进一步调查得知,我们的预备系统与生产系统存在一些微小差异,新配置在预备系统上通过而在生产系统中部分失效。我们会重新对所有业务系统的预备和生产环境进行一致性检查,避免类似的情况再次发生。

在此我们向受影响的用户道歉!如果您有任何疑问,请发送邮件至 support@leancloud.cn 进行确认。

发表评论

电子邮件地址不会被公开。 必填项已用*标注