上周帮朋友公司查网络卡顿,发现他们路由器配置全靠老张师傅‘凭经验改’:IP地址段随手分配、ACL规则写在便签纸上、QoS策略三年没动过。结果一换人,连WiFi密码都找不着在哪改——这不是运维,是玄学。
标准化不是填表格,是给日常操作定规矩
网络维护工作标准化,说白了就是把‘我觉得应该这样’变成‘按SOP必须这样’。比如路由调优里最常踩的坑:OSPF区域划分混乱、BGP邻居没加描述、ACL顺序写反导致策略失效。这些不是技术多难,而是没人统一记法、没人固定流程。
我们试过在一个中小型企业落地简易标准化清单:
• 所有接口描述统一格式:WAN-ISP-联通-202405 或 LAN-财务VLAN10-主干;
• 静态路由必须带description和track(如支持);
• 每次修改前先show run | inc route|access截图存档,改完立刻copy running-config startup-config。
从CLI命令开始,把习惯变成脚本
手动敲命令容易漏步骤,不如固化成可复用的小脚本。比如每次调整OSPF cost前,自动检查当前接口状态和邻居关系:
! Cisco IOSXE 示例
alias exec ospf-check show ip ospf neighbor detail | include Interface|State|Address
alias exec ospf-cost-show show ip ospf interface brief | include Gi1/0/1|Gi1/0/2再进一步,用Python+Netmiko批量推送标准ACL模板到所有核心路由设备,把‘改5台路由器’变成‘运行一次脚本’。别小看这一步——上个月某客户因ACL未同步导致VLAN间通信中断两小时,根源就是人工逐台粘贴时少敲了一个permit。
文档不是摆设,是故障时的第一反应指南
见过最实在的标准化文档,就贴在机房墙上:一张A4纸,分三栏——
左栏:常见问题(如‘内网访问外网慢’);
中栏:对应检查命令(show interface Gi0/0 | inc rate|error、show ip nat translations count);
右栏:标准修复动作(如‘确认NAT条目超限则清空并启用overload’)。没有术语堆砌,全是能照着敲的指令。
标准化真正的价值,不是让网络变多高大上,而是让新来的工程师第三天就能独立处理路由震荡,让夜班同事不用翻聊天记录猜上次是谁改了什么。它不消灭复杂性,只是把不确定性关进盒子里。