LoadRunner配置对Windows和Linux服务器的性能监控是定位系统短板的重点。
Windows服务器监控:依赖内置的 PerfMon(性能监视器)及 RPC 服务,1. 开启 Remote Registry、 Remote Procedure Call 服务。2. 修改安全方法:本地安全方法 -> 本地方法 -> 安全选项,将“网络访问: 本地帐户的共享和安全模型”设为经典方式。在Controller中,添加 “Windows Resources” 图,添加目的服务器IP,选择平台为 Windows,然后添加具体计数器。% Processor Time, Available MBytes, Avg. Disk Queue Length等。
Linux服务器监控:依赖 rpc.rstatd 守护进程提供资源数据,1. 保证已安装并启动 rpc.rstatd 服务。2. 可使用 rpcinfo -p 命令检查服务状态。在Controller中,添加“Unix Resources”图,添加目的服务器IP,选择平台为对应Unix/Linux,然后添加具体计数器。Average load, CPU utilization, Paging rate 等。
详细配置
流程在LoadRunner Controller的运行视图中进行。
添加监控图:在左侧图区域,找到并右键点击Windows Resources或Unix Resources,选择添加到视图。
添加被监控服务器:在新添加的图上右键,选择 添加度量 。
输入服务器地址:在弹出的对话框中,点击添加,输入服务器的IP地址或主机名,并正确选择其操作系统平台(如Windows或Linux)。
选择性能计数器:在资源度量区域再次点击添加,从列表中选择需要监控的计数器。您可以按住Ctrl键多选。
性能计数器选择
选择正确的计数器是有效监控的重点。以下是两类系统的监控项:
Windows计数器:
Processor:% Processor Time,CPU使用率。如果不断 >75-80%,可能存在CPU短板。
Memory:Available MBytes,可用物理内存。需结合应用内存消耗判断。
PhysicalDisk:Avg. Disk Queue Length,平均磁盘队列长度。如果不断大于(磁盘主轴数*2),可能存在磁盘I/O短板。
Network Interface:Bytes Total/sec,网络适配器吞吐量。需和网卡带宽对比。
Linux/Unix 计数器:
Average load:系统平均负载。理想值应小于CPU核心数 * 0.7。
CPU utilization:CPU总使用率。和Windows类似,不断 >75-80% 需警惕。
Paging rate:系统分页率。如果不断在几百以上,可能表示物理内存不足。
Disk traffic:磁盘传输率。监控磁盘读写繁忙程度。
配置和监控
为了满足更复杂的监控需求:
调整采样频率:在工具 -> 选项 -> 监控器选项卡中,可以调整数据采样间隔。对于短时高并发测试,可以适当提高频率;对于长时间稳定性测试,则降低频率以减少负载。
自定义计数器:如需监控默认列表之外的计数器(如特定应用性能计数器),可以通过编辑LoadRunner安装目录下 dat 文件夹中的 res_mon.dft 文件来添加自定义计数器。
使用SiteScope/PerfMon进行深度监控:对于应用服务器(如Tomcat线程数)、数据库(如Oracle缓存命中率)或自定义业务标准,可通过集成Micro Focus SiteScope或Windows的PerfMon来实现更细粒度的监控,并在Controller中集成这些数据源。
故障排查
如果无法成功监控,请按顺序检查:
网络连通性:保证Controller主机和被监控服务器之间网络通畅。
服务和权限(Windows):
确定 Remote Registry 和 Remote Procedure Call 服务已启动。
确定本地安全方法已设置为经典 - 对本地用户进行身份证实。
尝试在Controller主机运行 \\[服务器IP]\C$,看是不是能访问(需输入有权限的账号密码)。
服务状态(Linux):在Linux服务器上执行 rpcinfo -p,确定 rstatd 服务已成功注册并监听。
防火墙:检查服务器防火墙是不是阻止了相关端口(Windows的RPC端口,Linux的rstatd端口,一般由portmapper分配)。
建议
将服务器性能监控集成到您的性能测试流程中,是保证测试有效性的基础。为了高效地开展测试:
确定监控目的:在测试前,根据系统架构和应用特点,确定需要监控的服务器和性能标准。
建立性能基线:在系统无负载或正常负载时进行一次监控,记录重点计数器的标准值,作为后续性能分析的参照。
结果关联分析:在分析测试结果时,必须将LoadRunner的事务响应时间、吞吐量等测试数据和服务器资源监控图进行时间轴上的关联分析,这是定位性能短板(如响应时间变长时CPU是不是饱和)的最有效方法。