需求背景在私有化环境中,客户的服务器环境可能在本地,也可能在云端,可能会受环境因素影响程序运行的效能。
本文针对效能问题的排查步骤、分析工具进行梳理分享,以便后续遇到效能问题时能有序进行排查。
效能问题排查SOP
性能问题排查步骤
1.性能问题记录(Chrome)
应用QC可以针对效能问题进行巡检:
记录效能问题的时间、页面、操作步骤、网址、截图(耗时的Chrome Timing截图)
1.1 问题定位:Chrome开发者工具
开发者工具,点击网络,再点击Timing,可列出请求响应信息
waiting for server response:等待服务器响应时间
content download时间长:资源下载时间长
等待服务器响应:服务器响应时间慢,需排查服务器资源与后端接口性能。
content download时间:资源下载慢,需排查网络带宽(服务器、用户),或是前端性能问题

2.效能问题接收分析定位
收到效能问题,可以再根据不同的状况,往下分析定位
2.1 资源加载慢
当客户出现异常的加载慢、content download耗时很久的情况,
可以找一个单纯的静态文件,进行下载测试(排除后端处理因素),定位是否是网络带宽问题。
2.1.1 服务端网速测试
iperf3
(带宽吞吐量测试)
通过工具,可以确认客户端服务器的带宽
宽吞吐量测试
- 在服务器端启动:
iperf3 -s
- 在客户端执行(内网):
iperf3 -c 目标IP -t 30 -P 4
- 记录最大/平均带宽。
测试数据说明:
Interval → 测试的时间区间(每秒一行)。
Transfer → 在这段时间内传输的总量。
Bandwidth → 平均频宽(Mbits/sec)。
最后的 summary (sender / receiver) 就是整个测试的平均结果
丢包率 (Lost/Total datagrams, Lost%) 与 jitter (抖动 ms)
2.1.2 客户端网速测试
ping
基本连通性检测
ping目标IP -n 100
- 记录平均延迟与丢包率。
tracert
路由分析
tracert目标IP
或traceroute目标IP
- 确认路由跳点数与延迟异常
curl
文件下载分析
可以先准备比较大的静态文件js,进行下载分析
curl -o null 下载文件网址
- 确认客户端下载网速
下图案例:客户在不同区域,下载速度有很大差异。(需要再请客户网管定位网络是否异常)
2.2 服务器响应慢
grafana效能监控仪表盘
通过grafana可以分析客户服务器端资源运行的状况,定位是否存在资源或网络问题
以上就是本期的分享,谢谢收看