ndsad упал. а как же вотчдог?

Технические вопросы по UTM 5.0
Ответить
Mr.Black
Сообщения: 67
Зарегистрирован: Пн янв 31, 2005 17:03

ndsad упал. а как же вотчдог?

Сообщение Mr.Black »

Упал ндсад. Вот что было последнее в логах. И как это понимать. где же вотчдог? три дня не считало.

ndsad[14406]: Applying filter:net 10.0.0.0/8 or (src net 213.80.144.0/24 and dst net 213.80.144.0/24) to device:ppp5
ndsad[14406]: pcap_datalink(ppp5) = 113
ndsad[14406]: Set ppp offset = 16
ndsad[4476]: WatchDog: child[4477]: SIGKILL signal cought...

ndsad[4476]: WatchDog: terminating...
ndsad[4476]: Unable to open pidfile:
ndsad[4476]: /var/run/ndsad.pid
ndsad[4476]: No such file or directory
ndsad[4476]: Session closed on Sat Apr 30 15:47:49 2005

Mr.Black
Сообщения: 67
Зарегистрирован: Пн янв 31, 2005 17:03

Сообщение Mr.Black »

так и продолжает падать. почему вотчдог не работает. поддержкааа?

gtk
Сообщения: 232
Зарегистрирован: Пт янв 21, 2005 18:33

Сообщение gtk »

Mr.Black писал(а):так и продолжает падать. почему вотчдог не работает. поддержкааа?
И как часто он у тебя падает?

Mr.Black
Сообщения: 67
Зарегистрирован: Пн янв 31, 2005 17:03

Сообщение Mr.Black »

два раза в месяц.

Аватара пользователя
Lex
NetUP Team
Сообщения: 623
Зарегистрирован: Ср мар 09, 2005 12:12
Откуда: НетАП
Контактная информация:

Re: ndsad упал. а как же вотчдог?

Сообщение Lex »

Mr.Black писал(а):Упал ндсад. Вот что было последнее в логах. И как это понимать. где же вотчдог? три дня не считало.

ndsad[14406]: Applying filter:net 10.0.0.0/8 or (src net 213.80.144.0/24 and dst net 213.80.144.0/24) to device:ppp5
ndsad[14406]: pcap_datalink(ppp5) = 113
ndsad[14406]: Set ppp offset = 16
ndsad[4476]: WatchDog: child[4477]: SIGKILL signal cought...

ndsad[4476]: WatchDog: terminating...
ndsad[4476]: Unable to open pidfile:
ndsad[4476]: /var/run/ndsad.pid
ndsad[4476]: No such file or directory
ndsad[4476]: Session closed on Sat Apr 30 15:47:49 2005
Судя по всему, процесс завершается при получении сигнала SIGKILL, который не игнориуется, но обрабатывается и приводит к завершению процесса.
Если Вы уверены, что никто из имеющих соответствующий доступ к системе данный сигнал не посылает, то возможно, сигнал посылает операционная система (например из-за нехватки памяти). В этом случае соответствующее сообщение должно писться в dmesg и файлы журналов ОС.

Sagittarius A*
Сообщения: 29
Зарегистрирован: Пн май 23, 2005 12:24

Сообщение Sagittarius A* »

ndsad будет падать вечно - или догружать сервер до 100%, после чего падать.. видимо, заботливо встроенная опция.
пользовать ipcad, но иметь ввиду, что с ним utm5_core очень любит зависать безответно, до killall -9
решение проблем netflow5 - правда в билде 013 от зависаний *_core раз в ~10 суток не избавит...

cjcrazy
Сообщения: 497
Зарегистрирован: Чт янв 20, 2005 21:54

Сообщение cjcrazy »

Sagittarius A* писал(а): пользовать ipcad, но иметь ввиду, что с ним utm5_core очень любит зависать безответно, до killall -9
решение проблем netflow5 - правда в билде 013 от зависаний *_core раз в ~10 суток не избавит...
что же страшного в ipcad?
разве он не выплёвывает в сторону биллинга netflow5??

Sagittarius A*
Сообщения: 29
Зарегистрирован: Пн май 23, 2005 12:24

Сообщение Sagittarius A* »

неточно выразился.
в смысле поставить нормальную cisco, брать статистику по nf5 и выкинуть все эти ndsad-ipcad'ы.

cjcrazy
Сообщения: 497
Зарегистрирован: Чт янв 20, 2005 21:54

Сообщение cjcrazy »

кошки нет. статистику собирать надо.

Аватара пользователя
dalex
Сообщения: 1306
Зарегистрирован: Пт янв 21, 2005 11:54

Сообщение dalex »

скачайте с cvs свежайший ndsad скомпильте под себя. У нас ndsad уже давно не падает в принципе.

SergKz
Сообщения: 131
Зарегистрирован: Пн янв 24, 2005 09:09

Сообщение SergKz »

Программный WatchDog - это что-то новенькое....
Это значит что разработчики отчаялись отладить один кусок программы и поставили следить за ним другой...
Всегда сколько помню WatchDog означал АППАРАТНЫЙ таймер перезапуска системы (или программы), программные имитации только демонстрируют неотлаженность это самой программы. И где гарантия что этот самый "вотчдог" отлажен лучше чем та частьпрограммы которую он стережёт?

aospan
NetUP Team
Сообщения: 1639
Зарегистрирован: Чт янв 13, 2005 20:30

Сообщение aospan »

SergKz писал(а):Программный WatchDog - это что-то новенькое....
Это значит что разработчики отчаялись отладить один кусок программы и поставили следить за ним другой...
Всегда сколько помню WatchDog означал АППАРАТНЫЙ таймер перезапуска системы (или программы), программные имитации только демонстрируют неотлаженность это самой программы. И где гарантия что этот самый "вотчдог" отлажен лучше чем та частьпрограммы которую он стережёт?
Была одна проблема - ндсад вываливался из-за ошибки в libpcap и тут же поднимался при помощи "собаки" - практически никаких потерь. Какие есть варианты решения данной проблемы ? Предложите лучше - обязательно обдуемаем и реализуем ...
Насчет аппаратного таймера - это несколько преувеличено. Далеко за примерами ходить не надо - посмотрите как сделана работа базы данных mysql. Запускается специальный _программный_ ватчдок (safe_mysqld) , который следит за базой данных.

cjcrazy
Сообщения: 497
Зарегистрирован: Чт янв 20, 2005 21:54

Сообщение cjcrazy »

dalex писал(а):скачайте с cvs свежайший ndsad скомпильте под себя. У нас ndsad уже давно не падает в принципе.
вот только почему-то не все проходящие пакеты вылавливал ndsad. из-за этого был поставлен ipcad (на одном из роутеров)

gravis
Сообщения: 562
Зарегистрирован: Ср мар 16, 2005 15:31
Откуда: Село Красноярск

Сообщение gravis »

А что за проблемы были упомянуты про ipcad?
На какой системе и с какими библиотеками он якобы падает?

При использовании netflow5 с cisco у меня билд 013 не падал при нагрузках ~150 Гб в сутки.

Чего людям мозг пудрите?

2 Netup: прокомментируйте плз ситуацию с ipcad.

Ответить