公司新换了一台华为AR3260做核心出口路由器,上线前甲方要求按《YD/T 1098-2021 网络验收技术规范》走一遍测试流程。结果发现,很多工程师把‘验收’当成填表交差,一到ping通、能上网就点确认,最后上线三天,BGP邻居反复震荡,视频会议卡顿频发——问题不在设备,而在验收时根本没测对地方。
验收不是‘通不通’,是‘稳不稳、准不准’
比如路由收敛时间:规范里明确要求主备链路切换时,BGP路由收敛≤60秒,OSPF≤10秒。但很多人只用ping -t看是否断连,漏掉了show ip bgp summary里Peer State从Active变Established的耗时记录。更常见的是,测试时只打一个目的IP(比如8.8.8.8),却没覆盖关键业务网段(如财务系统的172.16.5.0/24)。一旦真实流量进来,策略路由没生效,下一跳指向了错误接口,故障就藏不住了。
带宽与丢包率,得用真实流量打
规范第5.3条强调‘在满载流量下验证QoS策略有效性’。可不少验收报告写‘使用iperf3跑通1Gbps’就完事。这不对。真正要测的是:当FTP上传占满上行带宽时,VoIP语音流是否仍保持≤1%丢包、≤150ms单向延迟?建议用两台终端同时发起流量:
iperf3 -c 192.168.10.200 -u -b 900M
iperf3 -c 192.168.10.200 -u -b 5M -p 5001再在路由器上抓VoIP端口(如5060/UDP)的tcpdump -i GigabitEthernet0/0/1 port 5060,直接看抖动和丢包点。ACL与策略路由,必须反向验证
验收最容易被忽略的一环:策略是否真按预期过滤或重定向。比如配置了‘禁止10.1.1.0/24访问外网’,验收时不能只查ACL列表,得从该网段内终端执行:
telnet www.baidu.com 80
curl -v http://www.qq.com同时在路由器上display acl all核对hit计数器是否递增。若计数为0,说明流量根本没过这条ACL——大概率是接口应用方向(in/out)配反了,或者策略被前面更高优先级的rule截断了。日志与SNMP,不是摆设
规范附录C要求‘关键事件日志留存≥90天,SNMP trap需覆盖linkDown/linkUp、CPU利用率>85%、内存<10%三项阈值’。但现场常看到SNMP只开了默认community,trap目标地址没填,或syslog服务器压根没开监听。建议验收时当场用snmpwalk -v2c -c public 192.168.1.1 1.3.6.1.2.1.2.2.1.8查接口状态OID,再手动shutdown一个接口,看监控平台是否30秒内收到trap——这才是真闭环。