目录:导读
- 前言
- 一、Python编程入门到精通
- 二、接口自动化项目实战
- 三、Web自动化项目实战
- 四、App自动化项目实战
- 五、一线大厂简历
- 六、测试开发DevOps体系
- 七、常用自动化测试工具
- 八、JMeter性能测试
- 九、总结(尾部小惊喜)
前言
1、日常化
很多做性能测试的同学,在工作中面临的最大问题是性能测试无法成为日常测试工作的一部分,即性能测试作为质量保障的一种手段,却无法融入正常的需求版本迭代流程中。
最常见的例子就是一句话需求,比如:这几个接口压测一下,出一份报告;或者线上出了性能问题,才火急火燎的找测试同学,对系统进行压测,再排查定位问题。
要构建性能测试的技术体系,最基础也是最核心的部分,就是将性能测试融入软件研发交付流程中,即但凡涉及到系统迭代或者变更,都需要经过评估甚至性能测试,才能发布上线。
否则性能测试只会成为不重要的救火队员角色,疲于奔命却没时间去沉淀,更不要说构建测试体系了。
2、自动化
在传统的性能测试方法中,每次性能测试(需求迭代或项目维度)都需要重新评估需求,然后准备对应的测试数据和压测脚本,在我看来除了增加多余的工作量,实际的作用和价值并不明显。
正常情况下,大部分公司的业务和系统不会有高频次大范围的变更,即比较核心的业务链路和场景相对是稳定的。在这种情况下,对核心业务场景(比如P0+P1场景)进行性能测试全量覆盖,是一种比较可行的方式。
通过自动化的执行方式,不仅能提高验证效率,还可以大大缩短信息反馈耗时,即快速得到迭代后系统性能变化的结果,做到快速评估和反馈,这样也有助于帮助研发同学快速修复,提高线上交付效率。
3、工具化
性能测试体系的构建,除了压测工具之外,还需要丰富和完善其他方面的工具。比如:
造数工具:性能测试最耗时的部分应该是准备阶段,其中最麻烦的应该是准备测试数据并验证其可用性,因此提升造数据的效率是工具化很重要的一部分。常见的造数方法有线上数据导出脱敏、调用API生成、录制回放以及通过生成器模式进行封装。
故障案例库:其实导致出现性能问题的根因总结下来就那么几种,只不过实际表现为多种方式,比较好的方式是对日常工作中发现的性能问题和故障进行汇总分析,通过FMECA的方式搭建故障案例库,进而形成研发和测试规范。
监控分析工具:影响性能的因素是多种多样的,除了常见的基础资源监控,还应该考虑丰富链路追踪、堆栈分析、内存分析、线程分析以及缓存和数据库监控等各个方面的工具建设。
4、平台化
当性能测试融入到日常的软件研发迭代流程中,并且通过自动化的方式覆盖了大部分场景后,接下来就需要考虑将流程+执行+工具+案例融合为平台,将性能测试过程管控起来,通过平台对外提供标准完善的功能,
这个时候性能测试就可以视作是一种服务,为整个技术团队提供服务稳定性保障和技术效率的服务。
当然,落地平台化有几点需要考虑,比如团队规模大小、需求迭代频次、业务和系统复杂性以及技术团队本身的基础技术设施的建设程度。
如果团队规模较小,且技术团队的基础设施建设一般,平台化就不用考虑了。
5、详细TPS上不去的原因
1)网络带宽
在压力测试中,有时候要模拟大量的用户请求,如果单位时间内传递的数据包过大,超过了带宽的传输能力,就会造成网络资源竞争,导致服务端接收到的请求数达不到服务端的处理能力上限。
2)连接池
可用连接数太少,造成请求等待。连接池一般分为服务器连接池(比如Tomcat)和数据库连接池(或者理解为最大允许连接数也行),没有保持长连接,TCP 连接频繁中断
3)GC
如果堆内存分配的不合理,就会导致频繁的gc,gc会导致线程暂停。尤其是fullgc,会造成线程长时间暂停,代码故障,list 使用 contain 方法进行遍历去重,线程阻塞或者死锁
jvm 内存分配故障,fullgc 频繁,内存溢出
4)数据库配置
高并发情况下,如果请求数据需要写入数据库且需要写入多个表的时候,数据库的最大连接数不够,或者写入数据的SQL没有索引,或没有主从分离、读写分离,就会导致数据库事务处理过慢,还有数据库没加索引,db 缓存空间不足,也会影响到TPS。
5)硬件资源
包括CPU(配置、使用率等)、内存(占用率等)、磁盘(I/O、页交换等)
6)压力机
单机负载能力有限,如果需要模拟的用户请求数超过其负载极限,会影响TPS(这个时候就需要进行分布式压测来解决问题)
7)其他中间件
Nginx 负载均衡策略不当,压力分配不均
Redis 瓶颈。hash 未合并,缓存被击穿,单条命令耗时过长
8)硬件资源中CPU和内存
服务器资源不足,上下文切换过快,中断过高,swap 交换频繁
压力大的时候tps频繁抖动,导致总tps上不去。查看是否有fullgc(tail -f gc_mSrv1.log | grep full)
pacing设置太小也会导致tps上不去,对抖动大的交易多增加点用户即可。
tps抖动,单压抖动大的交易,发现很平稳,这时怀疑是不是压力太大导致,所以发容量的时候把压力最大的那只交易分到其他压力机,然后发现tps不抖动了。
注意:多台压力机只影响tps抖动,不会影响服务器的cpu。看响应时间有没有超时,看用户数够不够。
完整版!企业级性能测试实战,速通Jmeter性能测试到分布式集群压测教程
| 下面是我整理的2025年最全的软件测试工程师学习知识架构体系图 |
一、Python编程入门到精通
二、接口自动化项目实战
三、Web自动化项目实战
四、App自动化项目实战
五、一线大厂简历
六、测试开发DevOps体系
七、常用自动化测试工具
八、JMeter性能测试
九、总结(尾部小惊喜)
人生最耀眼的不是站在聚光灯下的瞬间,而是黑暗中依然前行的勇气。当你觉得撑不住时,请记住:每个伟大的突破都藏在"再坚持一天"的决定里。你的脚步,正在创造属于自己的传奇!
别被暂时的风雨模糊了视线!那些让你流泪的磨练,正在雕刻更璀璨的未来。当别人选择放弃时,你的坚持就是胜利的宣言。向前奔跑吧,整个世界都在等待你的光芒绽放!