返回第六十五章 系统的问题  路大头首页

关灯 护眼     字体:

上一页 目录 下一页

户群都炸锅了。”

陈建业放包的手顿了一下:“崩了?”

“韩总带我们搞的,还有赵磊,三个人从下午五点多干到快八点。”她喝了口水,完全没有要停下来的意思,“我当时都慌了,韩总让我坐他旁边,他给我什么脚本我就跑什么脚本。”

她越说越来劲。

陈建业的脸色越来越难看。

姜亦心感叹了一声:“我真的是第一次见有人那样排查问题的,连日志都不看就知道瓶颈在哪,现场写改动,就好像不用思考一样。”

陈建业站在那没动,开物的扩容计划是韩路一让他写的,要求是支撑一万日活,他当时不以为意,按最低标准做的,能支撑两千同时在线,这两千人也不是同时发请求。结果,崩了。

“老陈你脸色不太好,”姜亦心歪了一下头,“昨天孩子看病累着了吧?”

“有点。”

“那你多喝热水啊。”

姜亦心走了。

陈建业也在工位坐下来。

打开飞书,群里置顶了一份文档,是韩路一写的,标题是《929线上事故复盘》,他点进去,从头开始看。

开头是事故时间线:16:27在线人数突破五千,16:31推理队列明显堆积,16:38首批用户超时,16:52超时率突破40。

影响范围:全部在线用户,持续约三小时,预估流失用户数待统计。

然后是根本原因分析,用的五个为什么方法:

为什么服务崩了?用户量超出设计上限。

为什么用户量超出上限?社交媒体病毒式传播,增长超出预测。

为什么超出了没有预警?没有设监控阈值。

为什么没有设监控阈值?上线流程里没有。

为什么上线流程里没有?我们还没有正式的上线流程清单。

最后是改进清单,监控阈值、压测标准、上线流程清单、架构扩容方案,每条后面跟着负责人和截止日期。

他从头翻到尾,通篇没有出现他的名字——不,出现了,架构扩容方案负责人。

旁边赵磊一直在敲代码,中间去接了次水,路过他工位看了一眼,没打招呼。

看完文档,陈建业又坐了一会,然后他站起来,往韩路一工位走过去。

韩路一面前的两块屏幕,一边是代码,一边是飞书文档。

“韩总。”

“老陈啊,”韩路一抬头看到陈建业,“孩子好点了吗?”

陈建业一愣。

他走过来之前想了很多种开场——道歉、解释、主动认错。他没想到第一句话是问孩子。

“退烧了。”

“那就好。”韩路一的语气跟闲聊差不多,顺着就切进了工作,“昨天下午用户暴涨,把后台冲垮了。我们做了紧急处理,现在系统是临时方案。现在用户量还在涨,得赶紧重新设计一下,我正在写复盘文档,等写完了你看一下,做一下参考,再出一版设计给我。”

陈建业坐在椅子上,没接话。

他不知道说什么。

他在鼎盛干了十多年,见过太多次事故复盘了,每次复盘会都只做一件事,就是甩锅

章节内容不完整,请退出阅读模式查看完整内容!
『加入书签,方便阅读』

上一页 目录 下一页