针对gRPC协议的性能测试,重点是对Protobuf序列化和流式调用这两个重要特性的专业处理。
一、gRPC性能测试的方法
gRPC的性能测试不是简单的HTTP接口压测,主要方法如下:
二进制Protobuf:请求/响应为二进制流,无法像JSON一样直观构造和断言。必须依赖预编译的Protobuf消息类和Proto文件动态管理。
多路复用和长连接:HTTP/2连接可承载多个并发流,连接管理是性能重点。测试工具需原生支持HTTP/2连接池,并能模拟真实的长连接生命周期。
复杂的流式调用:不再是简单的请求-响应,而是不断的、双向的异步数据流。需要工具提供高级API来模拟客户端流、服务器流和双向流的交互思路。
强类型接口:调用依赖于生成的强类型客户端存根。测试脚本需要和业务代码共享Proto定义和客户端存根,或有动态生成能力。
二、测试方案对比
主要分为代码级集成和工具级代理两种。
代码级原生支持:Gatling (gRPC插件)、JMeter (gRPC插件),在测试代码中直接导入Proto文件,使用生成的客户端进行真实gRPC调用。高保真、高性能;支持全功能流式调用;可深度集成到CI/CD。学习成本高;需管理Proto依赖和编译。复杂流式情形、CI/CD集成、需要准确控制和标准的自研压测平台。
工具级代理/录制:BloomRPC、ghz、K6,通过GUI工具或CLI,加载Proto文件后直接发起调用或录制脚本。上手极快;无需编码;适合接口调试和快速证实。对流式调用支持有限或配置复杂;灵活性较低;难以模拟复杂业务思路。接口调试、简单压测、快速证实和基准测试。
三、方案一:代码级测试详解以 Gatling + Scala 为例
这是最专业、最灵活的方案。Gatling的gatling-grpc插件提供了原生支持。
1. 环境和依赖准备
在build.sbt中引入插件:
scala
libraryDependencies += "io.gatling" % "gatling-grpc" % "3.10.1" % "test"
2. 流程代码
步骤1:管理Proto文件
将你的 .proto 文件(如 hello.proto)放在 src/test/protobuf/ 目录下。创建工具(如sbt-protoc)会自动编译生成Scala/Java类。
步骤2:创建测试
scala
import io.gatling.core.Predef._
import io.gatling.grpc.Predef._
import io.grpc._ // 导入生成的gRPC类
import com.example.grpc._ // 导入生成的Protobuf消息类
class GrpcBasicSimulation extends Simulation {
// 1. 定义gRPC协议配置
val grpcConf = grpc(ManagedChannelBuilder.forTarget("localhost:50051").usePlaintext())
// 2. 定义请求:一元调用 (Unary Call)
val unaryCall = grpc("unary_request")
.rpc(HelloServiceGrpc.METHOD_GREET) // 指定调用的方法
.payload(HelloRequest.newBuilder().setName("GatlingUser").build()) // 构造Protobuf请求体
.extract(_.message.some)(_ saveAs "reply") // 从响应中提取字段
// 3. 定义情形
val scn = scenario("gRPC Basic Test")
.exec(unaryCall)
.exec(session => {
// 打印提取的响应
println(s"Server replied: ${session("reply").asOption[String]}")
session
})
// 4. 注入虚拟用户
setUp(
scn.inject(constantUsersPerSec(10).during(30.seconds))
).protocols(grpcConf)
}
3. 流式调用测试详解
这是gRPC测试的难点。gatling-grpc通过Stream抽象支持。
服务器端流 (Server Streaming)
scala
val serverStreamCall = grpc("server_stream")
.rpc(HelloServiceGrpc.METHOD_SERVER_STREAM_GREET)
.payload(HelloRequest.newBuilder().setName("StreamUser").build())
// 处理不断到来的多个响应消息
.stream(_.process( // 处理每个收到的消息
rpcResult => {
println(s"[${rpcResult.timestamp}] Received: ${rpcResult.value.message}")
Continue // 继续等待下一个消息
}
)
.consumeWithin(5.seconds) // 整个流的最大不断时间
.timeout(1.second) // 等待每个消息的超时时间
)
双向流 (Bidirectional Streaming)
scala
val bidiStreamCall = grpc("bidi_stream")
.rpc(HelloServiceGrpc.METHOD_BIDI_STREAM_GREET)
.stream(
_.start( // 流开始时,发送初始消息
HelloRequest.newBuilder().setName("Start").build()
)
.send( // 定义怎样不断发送消息
grpc("stream_message")
.send(HelloRequest.newBuilder().setName("Msg").build())
)
.process( // 处理接收到的消息
rpcResult => {
// ...处理思路...
Continue
}
)
.await(1.seconds) // 等待一段时间
.end(grpc("stream_end").end) // 优雅结束流
)
四、方案二:工具级测试详解以 ghz 为例
对于快速基准测试,ghz是优秀的命令行工具。
bash
# 基本用法:指定Proto文件、服务方法、请求数据(JSON格式,会自动转换为Protobuf)
ghz --proto=greeter.proto \
--call=helloworld.Greeter.SayHello \
-d '{"name":"World"}' \
-n 10000 \
-c 50 \
localhost:50051
# 输出详细的性能报告
# 包括:请求分布、延迟百分比(如p95, p99)、吞吐量(QPS)等
重要提示:需要将请求数据写成JSON格式,ghz会在内部将其转换为Protobuf二进制格式。对于复杂嵌套消息,JSON结构需和Protobuf定义完全一致。
五、性能测试标准
不管采用哪种工具,以下标准是考虑gRPC服务性能的重点:
吞吐量:QPS (Queries Per Second),即每秒成功处理的请求数。这是测量系统处理能力的重要。
延迟:重点重视尾部延迟,如 P95 (95th percentile) 和 P99 (99th percentile) 延迟。如,P99延迟为50ms,意味着99%的请求在50ms内完成。
连接数:模拟的HTTP/2长连接数量,观察服务端的连接保持能力。
流式调用特有标准:
消息往返时间:在双向流中,单个消息从发出到收到响应的延迟。
流生命周期:单个流从建立到关闭的不断时间和稳定性。
并发流数:单个HTTP/2连接上并发的流数量,测试多路复用能力。
总结
原型和压测分离:先用BloomRPC 或 grpcurl进行功能调试和接口证实,再用 Gatling 或 ghz 进行正式压测。
管理Proto依赖:将Proto文件作为项目的一部分进行版本管理,保证测试代码和服务器端使用完全相同的定义。
测试数据设计:针对Protobuf消息的每个字段,设计有效的边界值测试数据。可以利用代码(如Scala/Java)动态生成复杂的嵌套消息。
模拟真实情形:对于流式调用,需要模拟真实的数据交互节奏(如聊天室的“发送-暂停-接收”),而不是连续轰炸。
监控和观测:压测时务必同时监控服务端的资源标准(CPU、内存、网络IO)和应用标准(如gRPC server的线程池状态、正在处理的流数量),来定位短板。