utm версии 5.2.1-009rc3
redhat linux el6 64bit
Недавно перешли с версии 006 на 008u5 и обнаружили проблему:
ядро utm5_core стало подвисать с интервалом в 10 минут примерно.
При этом ядро перестает принимать новые подключения и старые тоже зависают (админка не реагирует ни на что).
Подумали что это версия глючная. Переустановили 009rc3. Подвисания прекратились. Вместо этого ядро просто валится в sergfault и рестартует через safe_utm5_core.
в /var/log/messages такие строки:
Sep 27 09:26:58 bill kernel: utm5_core[1980]: segfault at f5f21008 ip 0000000008269347 sp 00000000f5dfeec4 error 4 in utm5_core[8048000+683000]
Sep 27 09:38:47 bill kernel: utm5_core[2533]: segfault at f4221010 ip 0000000008269347 sp 00000000f5dfeec4 error 4 in utm5_core[8048000+683000]
Sep 27 09:51:26 bill kernel: utm5_core[3923]: segfault at f4321008 ip 0000000008269347 sp 00000000f60feec4 error 4 in utm5_core[8048000+683000]
Sep 27 10:03:52 bill kernel: utm5_core[4469]: segfault at f5f21010 ip 0000000008269347 sp 00000000f5dfeec4 error 4 in utm5_core[8048000+683000]
Sep 27 10:15:28 bill kernel: utm5_core[5088]: segfault at f5f21010 ip 0000000008269347 sp 00000000f5dfeec4 error 4 in utm5_core[8048000+683000]
Sep 27 10:26:56 bill kernel: utm5_core[5613]: segfault at f4221008 ip 0000000008269347 sp 00000000f5dfeec4 error 4 in utm5_core[8048000+683000]
В main.log такие строки:
ERROR : Sep 27 10:34:27 f6794b70 RfwPlugin: process_session: slink_id==0
ERROR : Sep 27 10:34:49 f6794b70 RfwPlugin: process_session: slink_id==0
ERROR : Sep 27 10:34:58 f6794b70 RfwPlugin: process_session: slink_id==0
ERROR : Sep 27 10:35:15 f55feb70 BusPeriodic: negative time_t -206422288 for event, action_type block_start for 5442
ERROR : Sep 27 10:35:15 f55feb70 BusPeriodic: negative time_t -163516864 for event, action_type block_start for 5133
ERROR : Sep 27 10:35:15 f55feb70 BusPeriodic: negative time_t -1 for event, action_type block_end for 5442
ERROR : Sep 27 10:35:15 f6794b70 RfwPlugin: process_session: slink_id==0
ERROR : Sep 27 10:35:42 f6794b70 RfwPlugin: process_session: slink_id==0
ERROR : Sep 27 10:35:45 f6794b70 RfwPlugin: process_session: slink_id==0
ERROR : Sep 27 10:36:15 f6794b70 RfwPlugin: process_session: slink_id==0
ERROR : Sep 27 10:36:24 f6794b70 RfwPlugin: process_session: slink_id==0
ERROR : Sep 27 10:36:25 f6794b70 RfwPlugin: process_session: slink_id==0
ERROR : Sep 27 10:37:05 f6794b70 RfwPlugin: process_session: slink_id==0
ERROR : Sep 27 10:37:11 f6794b70 RfwPlugin: process_session: slink_id==0
ERROR : Sep 27 10:37:22 f6794b70 RfwPlugin: process_session: slink_id==0
ERROR : Sep 27 10:37:32 f6794b70 RfwPlugin: process_session: slink_id==0
ERROR : Sep 27 10:37:42 f6794b70 RfwPlugin: process_session: slink_id==0
ERROR : Sep 27 10:38:03 f6794b70 RfwPlugin: process_session: slink_id==0
------ и вот пошла перезагрузка -------
Info : Sep 27 10:38:33 f77a4740 UTM5 Logger: New ` Info : ' stream: /netup/utm5/log/main.log
Info : Sep 27 10:38:33 f77a4740 DBA:Ctx: Creating 10 user DB connections
Info : Sep 27 10:38:33 f77a4740 DBA:Ctx: Creating 10 system DB connections
Notice: Sep 27 10:38:33 f77a4740 ModMap: Sub-Module 'dba:ctx' inserted...
Info : Sep 27 10:38:33 f77a4740 UTM5 Core: New traffic classification mechanism enabled
Админка при этом требует переподключения.
Методом перебора было установлено, что если отключить заливку трафика в базу (через netflow) то segfault'ы пропадают. Отключения utm5_radius и utm5_rfw не помогают. Если увеличить trafic_aggregation_interval то падать ядро станет реже, но не перестает.
Попытались заменить библиотеки из пакета glibc-2.12 (по умолчанию в redhat el6). Пробовали все варианты от 2.5 (работало ранее на 006 версии) до 2.14 (последнее что есть). Это не помогло.
libssl и libcrypto тоже меняли (0.9.8g, 0.9.8e, 0.9.8 просто, пробовали даже 1.0.0). Не помогает.
Никто не в курсе, что это может быть?