机房里添了一台新设备,网线插了,天线接了,电源灯也亮了。但怎么知道它真的在给网络里的设备提供时间?这个问题不少网管遇到过。那台黑色盒子的正式名字叫GPS网络时间服务器,功能是从GPS卫星获取标准时间,然后通过局域网分发给其他设备。装好了不算完,得会看它的工作状态,才知道它到底有没有在干活。
先说说怎么确认GPS网络时间服务器自己已经拿到了卫星时间。大多数设备在前面板有一块小屏幕或者一排指示灯。屏幕会显示当前时间、收星数量、同步状态。如果屏幕上显示“锁定"或者“Synced",收星数量在4颗以上(通常显示4到12颗不等),那就说明它已经成功接收到GPS信号并解出了标准时间。如果收星数量一直是0或者显示“搜星中",那就需要检查天线位置或者馈线连接了。
确认了GPS网络时间服务器自身同步正常之后,下一步是看它能不能给其他设备校时。在已经配置好NTP客户端的电脑上,打开命令行窗口。Windows系统输入“w32tm /query /status"可以查看当前的时间源地址,看是不是指向了这台GPS网络时间服务器的IP。Linux系统输入“ntpq -p"会列出时间服务器和客户端之间的同步关系,如果看到服务器IP前面有一个星号或者加号,表示客户端正在从这台服务器获取时间。
还有更直观的方法。把一台电脑的时间手动调偏两三分钟,然后在NTP配置里填上GPS网络时间服务器的IP,点立即更新。如果几秒钟后电脑时间跳回了正确的时间,说明校时通道是通的。如果没反应,检查一下防火墙设置,NTP用的是UDP 123端口,这个端口需要开放。另外确认电脑和服务器在同一个网段,或者路由可达。
GPS网络时间服务器的日志功能是排查问题的好帮手。登录服务器的管理界面,找到日志或者状态页面。里面会记录每一台客户端请求时间的记录,包括源IP、请求时间、设备与标准时间的偏差值。如果发现某个IP频繁请求时间,每分钟几十次甚至上百次,那台设备可能配置有问题,或者系统时间频繁跳变导致反复校时。正常的客户端一般每隔几分钟到几十分钟请求一次就够了。
天线状态需要定期留意。GPS网络时间服务器的天线通常装在楼顶或者窗外,风吹日晒久了,接口可能松动,天线内部也可能进水。面板上的收星数量如果从原来的8颗突然降到2颗甚至0颗,优先排查天线。可以尝试重新插拔馈线接头,看看收星数量是否恢复。如果恢复不了,需要请人上天线安装位置检查,看天线是否被遮挡、掉落或者损坏。天线有问题,整个GPS网络时间服务器就失去了时间源,只能靠内部晶振守时,时间久了会慢慢漂移。
日常巡检的时候,记几个关键指标就够了。看一眼收星数量,保持在4颗以上算正常。看一眼同步状态,显示锁定就行。看一眼网口指示灯,闪烁表示有数据收发。如果设备支持SNMP,还可以把它纳入机房的监控系统,收星数量掉线或者同步异常时自动告警,不用每天手动去看。
GPS网络时间服务器这东西,正常运行的时候确实没什么存在感,网管经常忘了它的存在。但它一旦出问题,网络里所有设备的时间就会慢慢走散,日志乱套、打卡错位、监控时间轴对不上。花几分钟学会看它的工作状态,比出了问题再翻半天日志要省事得多。
