1    问题源起

上游系统通过公司rpc框架调用我们系统接口超时(默认超时时间为100ms)数量从50/分突然上涨到2000/分,在发生变化时间段里我们的系统也没有做过代码变更,但上游系统的调用确发生了变化。由于处于主要链路上,sre同学找过来询问原因,所以开始了问题排查。

2    问题初步定位

排查rpc超时的基本思路是这样的:

1)   &nb

网友评论