Zabbixサーバのログ「zabbix_server.log」を参照していると、「on host (インターネット経由でのホスト) failed: first network error, wait for 15 seconds」がある程度頻繁に記録されていました。対策を記録しておきます。
想定理由
Zabbixでは、デフォルトで同じLAN上にある機器の監視を想定しているようで、Zabbix AgentやSNMPデバイス との通信におけるタイムアウトを「3秒」に設定されています。「3秒」は、インターネット経由での監視では少なすぎるのかもしれません。
対策
zabbix_server.conf で、「Timeout」を「30秒」に設定しました。実際の設定は以下のとおりです。
### Option: Timeout # Specifies how long we wait for agent, SNMP device or external check (in seconds). # # Mandatory: no # Range: 1-30 # Default: # Timeout=3 Timeout=30
その後、zabbix_server を再起動して対策は終了となります。
しばらくは注意して zabbix_server.log を見ておきたいと思います。