| Applikationen Probleme mit Anwendungsprogrammen aller Art gehören hier hin. |
Diskussion: Nagios und unregelmaessige Timeouts von NRPE im Forum Applikationen, in der Kategorie Software Home; Anzeige Ich habe hier ein ziemlich seltsames Problem mit NRPE und Nagios. In dem Netzwerk, das ich ja gerade grossteils ...
![]() |
| | #1 (permalink) |
| Moderator ![]() Registriert seit: 30.09.06 ![]() ![]() ![]() ![]() ![]() ![]() Likes: 441 | Anzeige Ich habe hier ein ziemlich seltsames Problem mit NRPE und Nagios. In dem Netzwerk, das ich ja gerade grossteils uebernehme, war bisher nur ein rudimentaeres Nagios am Laufen und dafuer viele andere Tools. Daher habe ich beschlossen es komplett neu aufzusetzen und jedem Server ein NRPE zu verpassen, damit ich Daten wie Anzahl eingeloggter User, HD-Space usw. monitoren kann um so verschiedene andere Monitoring-Tools abschaffen zu koennen. Soweit funktioniert das auch alles bestens, nur bekomme ich in unregelmaessigen Abstaenden immer wieder Timeouts einzelner NRPEs. In den Logs tauchen dann immer Meldungen folgender Art auf: Code: [1185279395] SERVICE ALERT: www3.domain.tld;USERS;CRITICAL;SOFT;1;CHECK_NRPE: Socket timeout after 10 seconds. Die nrpe.cfg ist auf den Webservern absolut identisch. Code: pid_file=/opt/nagios/var/nrpe.pid server_port=5666 server_address=0.0.0.0 nrpe_user=nagios nrpe_group=nagios allowed_hosts=127.0.0.1,10.0.61.162 dont_blame_nrpe=0 debug=0 command_timeout=60 command[check_users]=/opt/nagios/libexec/check_users -w 5 -c 10 command[check_load]=/opt/nagios/libexec/check_load -w 30,20,15 -c 60,50,40 command[check_disk_root]=/opt/nagios/libexec/check_disk -w 20 -c 10 -p / command[check_disk_home]=/opt/nagios/libexec/check_disk -w 20 -c 10 -p /home command[check_disk_var]=/opt/nagios/libexec/check_disk -w 20 -c 10 -p /var command[check_disk_tmp]=/opt/nagios/libexec/check_disk -w 20 -c 10 -p /tmp command[check_zombie_procs]=/opt/nagios/libexec/check_procs -w 5 -c 10 -s Z command[check_total_procs]=/opt/nagios/libexec/check_procs -w 170 -c 200 Am haeufigsten von den Timeouts ist die Abfrage der Zombie-Prozesse betroffen. Rufe ich das check_nrpe aber per Hand auf, gibt es keinerlei Probleme. Die Service-Definitionen sind ueblicherweise in folgender Art aufgebaut: Code: define service {
use generic-service
host_name www3.domain.tld
service_description ZOMBIES
is_volatile 0
check_period 24x7
max_check_attempts 3
normal_check_interval 5
retry_check_interval 3
contact_groups admins
notification_interval 0
notification_period 24x7
notification_options u,c
check_command check_nrpe_1arg!check_zombie_procs
} - Nagios 2.9 - Nagios-Plugins 1.4.9 - NRPE 2.8.1 also die aktuellsten, die derzeit verfuegbar sind. Alles ist aus dem Source installiert und alle Rechner laufen mit Debian Etch.
__________________ Mein Blog - Mein Job - Diaspora Der Ring uns zu knechten besteht aus 12 Sternen auf blauem Grund. Neue Beiträge im Habo via Twitter - Das HaBo auf FB - Das HaBo bei G+ |
| | |
![]() |
| - Anzeige - | |
| |
| Themen-Optionen | |
| Ansicht | |
| |
Ähnliche Themen | ||||
| Thema | Autor | Forum | Antworten | Letzter Beitrag |
| -Gelöst- Securepoint 2007nx...DNS extrem langsam(timeouts) | gucky | Network · LAN, WAN, Firewalls | 0 | 14.05.08 09:17 |
| Unregelmaessige Ausfaelle. | f100d | Hardware Probleme | 4 | 10.01.07 22:58 |