Linux OOM-убить почему?

, Приветствую, товарищи админы. Я пишу в надежде пролить свет на убийства ООМ, которые преследуют одну из машин моей компании. Я не могу решить, являются ли они законными ООМ или нет.

Это Centos 6.x с ядром 2.6.32-279.1.1.el6.x86_64.

Ram 8 ГБ, процессор Athlon2-X4.

Крупными процессами являются mysql и vmw are player 4, где постоянно выделяется максимум 2 и 4 ГБ оперативной памяти плюс некоторые накладные расходы. (Vmw are - тот, который убит из-за его большего размера.)

Там работают демоны, отличные от этих 2, но они очень маленькие и очень слабо загружены, поэтому я не понимаю, куда исчезнет оставшийся 1 / 1,5 гигабайт оперативной памяти, не считая огромного обмена...

Кроме того, убийства происходят только тогда, когда он запускает резервные cronjobs ночью. (Это простые сценарии оболочки со стандартными инструментами, которые сбрасывают некоторые базы данных и архивируют некоторые веб-каталоги и каталоги почтовых ящиков.)

Вот, например, он делал mysqldump - и это впервые происходит с этой конкретной задачей. Это происходило почти каждый раз, также в сочетании с "ошибкой выделения страницы", когда я запускал rsyncs или zip s большого дерева каталогов (~1 миллион маленьких файлов). НО я перенес все это на другую машину с zfs: после этой операции убийца ненадолго оставил меня в покое...

Я ненавижу, что после нескольких месяцев манипулирования проблемой, чтения и перечитывания каждой темы в Интернете я все еще не могу связать информацию с моим делом. Есть своп, почему он не поменяется вместо убийства? И кто все равно принимает все барана? (В начале было несколько законных индикаторов памяти, и я получил их.) Также не может быть фрагментации, поскольку неудавшиеся запросы имеют нулевой порядок.

Я вставляю некоторые данные до фактического уничтожения журналов:

vm.sw appiness = 100
vm.vfs_cache_pressure = 5000
vm.min_free_kbytes = 262144

(я добавил это, чтобы попытаться исправить это, они, вероятно, немного экстремальны, но в любом случае они работают плавно)

Я тщетно экспериментировал с overcommit_memory=2 тоже. Разве это не должно отключить убийцу?

Это нормальное состояние памяти системы. Обратите внимание, что оперативная память vmw are считается кешем из-за mmap-ed vmem. И, между прочим, vmware настроен на восстановление / замену памяти vm. И он этого не делает, никогда.

           общее количество использованных свободных общих буферов в кеше
Mem:       7800792    7400032     400760          0      61100    4449196
-/+ буферы / кэш: 2889736 4911056
Своп: 8388600 761588 7627012

SwapCached:       286648 кБ
PageTables:        40200 кБ
CommitLimit:    15409312 кБ
Committed_AS:    8099460 КБ
AnonHugePages:    192512 кБ

Узел 0, зона DMA      4      1      1      3      1      1      0      0      1      1      3 
Узел 0, зона DMA32    378   1476   2541   1491    328    240     74     28      8      0      0 
Узел 0, зона Нормальная 1555 124 956 1825 659 175 54 31 15 0 0 

Наконец, ООМ:



2 января 21:37:38: vmware-vmx вызвал oom-killer: gfp_mask=0xd0, order=0, oom_adj=0, oom_score_adj=0 2 января 21:37:38: vmware-vmx cpuset=/ mems_allowed=0 2 января 21:37:38: Pid: 19635, comm: vmware-vmx Не испорчен 2.6.32-279.1.1.el6.x86_64 #1
Jan  2 21:37:38: Отслеживание вызовов: 2 января 21:37:38: []? cpuset_print_task_mems_allowed+0x91/0xb0 2 января 21:37:38: []? dump_header+0x90/0x1b0 2 января 21:37:38: []? __delayacct_freepages_end+0x2e/0x30 2 января 21:37:38: []? security_real_capable_noaudit+0x3c/0x70 2 января 21:37:38: []? oom_kill_process+0x82/0x2a0 2 января 21:37:38: []? select_bad_process+0xe1/0x120 2 января 21:37:38: []? out_of_memory+0x220/0x3c0 2 января 21:37:38: []? __alloc_pages_nodemask+0x89e/0x940 2 января 21:37:38: []? alloc_pages_current+0xaa/0x110 2 января 21:37:38: []? __get_free_pages+0xe/0x50 2 января 21:37:38: []? __pollwait+0xb4/0xf0 2 января 21:37:38: []? eventfd_poll+0x7d/0x80 2 января 21:37:38: []? do_sys_poll+0x29b/0x520 2 января 21:37:38: []? __pollwait+0x0/0xf0 2 января 21:37:38: []? pollwake+0x0/0x60 2 января 21:37:38: []? pollwake+0x0/0x60 2 января 21:37:38: []? pollwake+0x0/0x60 2 января 21:37:38: []? pollwake+0x0/0x60 2 января 21:37:38: []? pollwake+0x0/0x60 2 января 21:37:38: []? pollwake+0x0/0x60 2 января 21:37:38: []? pollwake+0x0/0x60 2 января 21:37:38: []? pollwake+0x0/0x60 2 января 21:37:38: []? pollwake+0x0/0x60 2 января 21:37:38: []? read_tsc+0x9/0x20 2 января 21:37:38: []? ktime_get_ts+0xa9/0xe0 2 января 21:37:38: []? poll_select_set_timeout+0x8d/0xa0 2 января 21:37:38: []? sys_ppoll+0x4c/0x180 2 января 21:37:38: []? system_call_fastpath+0x16/0x1b 2 января 21:37:38: Mem-Info: 2 января 21:37:38: узел 0 прямого доступа к памяти на процессор: 2 января 21:37:38: процессор 0: привет: 0, btch: 1 usd: 0 Jan  2 21:37:38: CPU 1: hi:    0, btch:   1 usd:   0
Jan  2 21:37:38: CPU 2: hi: 0, btch: 1 usd: 0 Jan 2 21:37: 38: CPU 3: hi: 0, btch: 1 usd: 0 Jan 2 21:37:38: узел 0 DMA32 на процессор:
Jan  2 21:37:38: CPU    0: hi:  186, btch:  31 usd: 175
Jan  2 21:37:38: CPU    1: hi:  186, btch:  31 usd:  40
Jan  2 21:37:38: CPU    2: hi:  186, btch:  31 usd: 180
Jan  2 21:37:38: CPU    3: hi:  186, btch:  31 usd: 152
Jan  2 21:37:38: Node 0 Normal per-cpu:
Jan  2 21:37:38: CPU    0: hi:  186, btch:  31 usd: 170 Янв 2 21:37:38: ЦП 1: привет: 186, btch: 31 usd: 67 Янв 2 21:37:38: ЦП 2: привет: 186, btch: 31 usd: 108 2 января 21:37:38: CPU 3: hi:  186, btch:  31 usd:  63 2 января 21:37:38: активный_анон:1467089 inactive_anon:263165 изолированный_анон: 64 2 января 21:37:38: активный_файл: 12404 неактивный_файл: 65792 изолированный_файл: 96 2 января 21:37:38: univictable:2 dirty:66080 обратная запись:1 unstable:0
Jan  2 21:37:38: free:73888 slab_reclaimable:8971 slab_unreclaimable:10661
Jan  2 21:37:38: сопоставлено: 780904 shmem: 1035969 страниц: 10566 отскок: 0 Jan 2 21:37:38: узел 0 DMA свободен:15688kB мин.:500kB низко:624kB высоко:748kB active_anon:0kB inactive_anon:0kB active_file:0kB неактивный_файл: 0kB невидимый: 0kB изолированный (anon):0kB изолированный (файл):0kB присутствует: 15284kB заблокирован: 0kB грязный: 0kB обратная запись: 0kB сопоставлен: 0kB slablebrec: 0 0kB kernel_stack: 0kB pagetables:0kB unstable:0kB bounce:0kB writeback_tmp:0kB pages_scanned:0 all_unreclaimable? да 2 января 21:37:38: lowmem_reserve[]: 0 3254 7799 7799 2 января 21:37:38: Узел 0 DMA32 свободен: 127608 КБ, мин: 109180 КБ, низкий: 136472 КБ, высокий: 163768 КБ active_anon:2209600 КБ, inactive_anon:441980 КБ: 207948 КБ, невидимый: 8 КБ изолирован (без подключения):0 КБ изолирован (файл):256 КБ присутствует: 3333024 КБ заблокирован: 8 КБ грязный: 211888 КБ обратная запись: 0 КБ сопоставлен: 955900 КБ shmem: 1376604 КБ slab_reclaimable:20276 КБ: недоброкачественная папка на двоих: папка 85: 60:BBB5BBRK: восстанавливать bounce:0kB writeback_tmp:0kB pages_scanned:580800 all_unreclaimable? нет 2 января 21:37:38: lowmem_reserve[]: 0 0 4545 4545 2 января 21:37:38: Узел 0 Нормальный уровень: 152256 КБ, мин: 152456 КБ, низкий: 190568 КБ, высокий: 228684 КБ: 55220 КБ, необратимый: 0 КБ изолирован (анон):256 КБ изолирован (файл):128 КБ присутствует: 4654080 КБ заблокирован: 0 КБ грязный: 52432 КБ запись: 4 КБ сопоставлен: 2167716 КБ shmem: 2767272 КБ bounce: 0kB writeback_tmp: 0kB pages_scanned: 410848 all_unreclaimable? нет янв 2 21:37:38: lowmem_reserve[]: 0 0 0 0 янв 2 21:37:38: узел 0 DMA: 4*4 кБ 1*8 кБ 1*16 кБ 3*32 кБ 1*64 кБ 1*128 кБ 0*256 кБ 0*512 КБ 1*1024 КБ 1*2048 КБ 3*4096 КБ = 15688 КБ 2 января 21:37:38: Узел 0 DMA32: 240*4 КБ 925*8 КБ 1553*16 КБ 748*32 КБ 253*64 КБ 152*128 КБ 56*256 КБ 28*512 КБ 6*1024 КБ 0 * 2048 КБ 0 * 4096 КБ = 127608 КБ 2 января 21:37:38: Узел 0 Нормальный: 1155 * 4 КБ 1362 * 8 КБ 2962 * 16 КБ 860 * 32 КБ 330 * 64 КБ 113 * 128 КБ 23 * 256 КБ 18 * 512 КБ 9 * 1024 КБ 1*2048kB 0*4096kB = 152380kB 2 января 21:37:38: 1162322 всего страниц кэша страниц 2 января 21:37:38: 48040 страниц в кэш-памяти подкачки 2 января 21:37:38: статистика кэш-памяти подкачки: добавьте 3148787, удалите 3100747, найти 1726176/2015458 2 января 21:37:38: свободный обмен = 7750696kB 2 января: 21:37:38: общий обмен = 8388600kB 2 января 21:37:38: 2031600 страниц RAM 2 января 21:37:38: 81402 страницы зарезервировано 2 января 21:37:38: 1987047 страниц поделено 2 января 21:37:38: 707527 страниц не передано 2 января 21:37:38: [ pid ]   uid  tgid total_vm      rss процессор oom_adj oom_score_adj name 2 января 21:37:38: [  457]     0   457     2673       90   1     -17         -1000 удевд 2 января 21:37:38: [ 1261]     0  1261    62271      293   0       0             0 rsyslogd 2 января 21:37:38: [1275] 0 1275 1171 91 0 0 0 mdadm 2 января 21:37:38: [ 1284]    81  1284     5382      159   1       0             0 dbus-daemon 2 января 21:37:38: [ 1295]    70  1295     6946      160   2       0             0 avahi-daemon 2 января 21:37:38: [ 1296]    70  1296     6914       27   1       0             0 avahi-демон Jan  2 21:37:38: [ 1344]    68  1344     6292      346   0       0             0 hald
Jan  2 21:37:38: [ 1345]     0  1345     4524      152   0       0             0 hald-runner 2 января 21:37:38: [ 1391]     0  1391     5053       87   2       0             0 hald-addon-inpu 2 января 21:37:38: [ 1406]     0  1406     6014      103   2       0             0 vmware-usbarbit 2 января 21:37:38: [ 1420]     0  1420    16028      119   1     -17         -1000 sshd 2 января 21:37:38: [1439] 38 1439 7539 146 0 0 0 ntpd 2 января 21:37:38: [1483] 0 1483 29309 135 2 0 0 crond 2 января 21:37:38: [1494] 0 1494 5362 47 2 0 0 atd 2 января 21:37:38: [ 1511]   501  1511    25371     5751   1       0             0 Xvnc 2 января 21:37:38: [1521] 501 1521 26513 66 0 0 0 ш Ян 2 21:37:38: [ 1532]   512  1532    21634      461   0       0             0 Xvnc 2 января 21:37:38: [1541] 501 1541 5006 82 10 0             0 dbus-launch 2 января 21:37:38: [ 1542]   501  1542     5382      141   2       0             0 dbus-daemon 2 января 21:37:38: [ 1546]   501  1546     5629      283   0       0             0 xfconfd 2 января 21:37:38: [ 1551]   501  1551    28034       71   3       0             0 gpg-agent 2 января 21:37:38: [ 1561]   501  1561    57668      351   1       0             0 xfce4-сессия 2 января 21:37:38: [ 1565]   501  1565    49604      290   2       0             0 xfsettingsd 2 января 21:37:38: [ 1567]   501  1567    55385      549   1       0             0 xfwm4 2 января 21:37:38: [ 1569]   501  1569    59719     1148   2       0             0 xfce4-panel 2 января 21:37:38: [1571] 501 1571 56642 311 1 0 0 Тунар 2 января 21:37:38: [ 1573]   501  1573    81823      695   3       0             0 xfdesktop
Jan  2 21:37:38: [ 1582]   501  1582    56799      339   1       0             0 xfce4-settings-
Jan  2 21:37:38: [ 1584]     0  1584   520550      188   1       0             0 console-kit-dae
Jan  2 21:37:38: [ 1650]   501  1650    55456      487   3       0             0 panel-6-systray
Jan  2 21:37:38: [ 1654]   512  1654    26513       65   0       0             0 sh
Jan  2 21:37:38: [ 1669]   512  1669     5006       68   2       0             0 dbus-launch
Jan  2 21:37:38: [ 1670]   512  1670     5383      135   0       0             0 dbus-daemon
Jan  2 21:37:38: [ 1674]   512  1674     5629      264   3       0             0 xfconfd
Jan  2 21:37:38: [ 1680]   512  1680    28034       70   3       0             0 gpg-agent
Jan  2 21:37:38: [ 1683]   500  1683    27549     6909   2       0             0 Xvnc
Jan  2 21:37:38: [ 1694]   512  1694    57667      346   2       0             0 xfce4-session
Jan  2 21:37:38: [ 1699]   512  1699    55386      461   1       0             0 xfwm4
Jan  2 21:37:38: [ 1701]   512  1701    66152     1404   2       0             0 xfce4-panel
Jan  2 21:37:38: [ 1703]   512  1703    56617      235   0       0             0 Thunar
Jan  2 21:37:38: [ 1705]   512  1705    85537      529   1       0             0 xfdesktop
Jan  2 21:37:38: [ 1707]   512  1707    49604      285   1       0             0 xfsettingsd
Jan  2 21:37:38: [ 1715]   512  1715    56799      312   0       0             0 xfce4-settings-
Jan  2 21:37:38: [ 1717]   512  1717    55456      438   3       0             0 panel-4-systray
Jan  2 21:37:38: [ 1721]   500  1721    26513       66   0       0             0 sh
Jan  2 21:37:38: [ 1740]   500  1740     5006       68   1       0             0 dbus-launch
Jan  2 21:37:38: [ 1741]   500  1741     5383      167   2       0             0 dbus-daemon
Jan  2 21:37:38: [ 1745]   500  1745     5629      275   1       0             0 xfconfd
Jan  2 21:37:38: [ 1757]   500  1757    28070      139   3       0             0 gpg-agent
Jan  2 21:37:38: [ 1758]     0  1758     1542       83   3       0             0 pptpd
Jan  2 21:37:38: [ 1774]   500  1774    57667      356   0       0             0 xfce4-session
Jan  2 21:37:38: [ 1779]   500  1779    55674      785   2       0             0 xfwm4
Jan  2 21:37:38: [ 1781]   500  1781    65790     1363   1       0             0 xfce4-panel
Jan  2 21:37:38: [ 1783]   500  1783    82194      451   0       0             0 Thunar
Jan  2 21:37:38: [ 1785]   500  1785    85642      813   2       0             0 xfdesktop
Jan  2 21:37:38: [ 1790]   500  1790    49604      283   2       0             0 xfsettingsd
Jan  2 21:37:38: [ 1800]   500  1800    38863      313   3       0             0 xterm
Jan  2 21:37:38: [ 1807]   500  1807    56798      353   3       0             0 xfce4-settings-
Jan  2 21:37:38: [ 1808]   500  1808    55456      470   1       0             0 panel-6-systray
Jan  2 21:37:38: [ 1811]   500  1811    27074       69   2       0             0 bash
Jan  2 21:37:38: [ 1823]     0  1823     4704      145   0       0             0 smartd
Jan  2 21:37:38: [ 1831]     0  1831     1014       48   2       0             0 mingetty
Jan  2 21:37:38: [ 1833]     0  1833     1014       48   0       0             0 mingetty
Jan  2 21:37:38: [ 1835]     0  1835     1014       48   1       0             0 mingetty
Jan  2 21:37:38: [ 1837]     0  1837     1014       48   2       0             0 mingetty
Jan  2 21:37:38: [ 1839]     0  1839     1014       49   3       0             0 mingetty
Jan  2 21:37:38: [ 1843]     0  1843     1014       48   0       0             0 mingetty
Jan  2 21:37:38: [ 2025]     0  2025    25340       59   2       0             0 vmnet-bridge
Jan  2 21:37:38: [ 2033]     0  2033    25333       15   1       0             0 vmnet-netifup
Jan  2 21:37:38: [ 2058]     0  2058    27069      101   0       0             0 vmnet-natd
Jan  2 21:37:38: [ 2060]     0  2060    25333       15   1       0             0 vmnet-netifup
Jan  2 21:37:38: [ 2097]     0  2097    30105       82   2       0             0 vmware-authdlau
Jan  2 21:37:38: [ 2981]   500  2981    36335       76   0       0             0 su
Jan  2 21:37:38: [ 2984]     0  2984    27074      233   1       0             0 bash
Jan  2 21:37:38: [ 6347]   500  6347    39207      406   2       0             0 xterm
Jan  2 21:37:38: [ 6349]   500  6349    27074       70   0       0             0 bash
Jan  2 21:37:38: [ 6407]   500  6407    36335       77   0       0             0 su
Jan  2 21:37:38: [ 6410]     0  6410    27074      251   0       0             0 bash
Jan  2 21:37:38: [ 6481]     0  6481    57857      154   0       0             0 mysql
Jan  2 21:37:38: [ 6911]     0  6911    19820      120   1       0             0 master
Jan  2 21:37:38: [ 6914]    89  6914    19889      122   0       0             0 qmgr
Jan  2 21:37:38: [ 6918]    89  6918    19839      141   0       0             0 tlsmgr
Jan  2 21:37:38: [17572]     0 17572   103460     2142   3       0             0 Thunar
Jan  2 21:37:38: [21227]   500 21227    38801      594   0       0             0 xterm
Jan  2 21:37:38: [21229]   500 21229    27074       73   0       0             0 bash
Jan  2 21:37:38: [29713]   500 29713    36870      214   3       0             0 lftp
Jan  2 21:37:38: [32170]   500 32170    38815      184   0       0             0 xterm
Jan  2 21:37:38: [32172]   500 32172    27074       77   1       0             0 bash
Jan  2 21:37:38: [32189]   500 32189    36335       86   1       0             0 su
Jan  2 21:37:38: [32197]     0 32197    27074       93   1       0             0 bash
Jan  2 21:37:38: [16025]     0 16025     2070       89   3       0             0 pptpctrl
Jan  2 21:37:38: [16026]     0 16026     5544      108   1       0             0 pppd
Jan  2 21:37:38: [31174]     0 31174    27073      175   1       0             0 mysqld_safe
Jan  2 21:37:38: [31909]    27 31909  1143356   587238   1       0             0 mysqld
Jan  2 21:37:38: [32037]     0 32037    26546      169   0       0             0 mysqld_safe
Jan  2 21:37:38: [32437]   495 32437   136524     7673   1       0             0 mysqld
Jan  2 21:37:38: [32449]     0 32449    26546      169   2       0             0 mysqld_safe
Jan  2 21:37:38: [  368]   493   368   211813     3831   0       0             0 mysqld
Jan  2 21:37:38: [  884]   500   884    27074      310   1       0             0 bash
Jan  2 21:37:38: [ 1065]   501  1065   122130     2881   3       0             0 vmplayer
Jan  2 21:37:38: [ 2031]   500  2031    38570      281   0       0             0 xterm
Jan  2 21:37:38: [ 2034]   500  2034    27074      180   0       0             0 bash
Jan  2 21:37:38: [ 2051]   500  2051    36335      140   0       0             0 su
Jan  2 21:37:38: [ 2055]     0  2055    27074      181   2       0             0 bash
Jan  2 21:37:38: [16591]   501 16591    77851      712   3       0             0 vmware-unity-he
Jan  2 21:37:38: [16803]     0 16803    26883      237   1       0             0 watch
Jan  2 21:37:38: [19635]   501 19635  1693624   793343   1       0             0 vmware-vmx
Jan  2 21:37:38: [ 2186]     0  2186    38139      158   0       0             0 proftpd
Jan  2 21:37:38: [ 5289]   500  5289    38992      979   3       0             0 xterm
Jan  2 21:37:38: [ 5291]   500  5291    27074      188   2       0             0 bash
Jan  2 21:37:38: [ 5344]   500  5344    36335      148   1       0             0 su
Jan  2 21:37:38: [ 5361]     0  5361    27074      350   0       0             0 bash
Jan  2 21:37:38: [18529]   500 18529    26514      227   0       0             0 mysql-workbench
Jan  2 21:37:38: [18534]   500 18534    26514      226   1       0             0 catchsegv
Jan  2 21:37:38: [18536]   500 18536    26514       77   2       0             0 catchsegv
Jan  2 21:37:38: [18537]   500 18537   227088     7571   2       0             0 mysql-workbench
Jan  2 21:37:38: [  409]     0   409   131527     1556   1       0             0 geany
Jan  2 21:37:38: [  410]     0   410     2054       92   2       0             0 gnome-pty-helpe
Jan  2 21:37:38: [  411]     0   411    27074      238   1       0             0 bash
Jan  2 21:37:38: [ 5750]     0  5750     2672       92   0     -17         -1000 udevd
Jan  2 21:37:38: [ 5753]     0  5753     2672       87   0     -17         -1000 udevd
Jan  2 21:37:38: [ 5788]     0  5788    10640      594   3       0             0 openvpn
Jan  2 21:37:38: [ 5792]     0  5792    10640      598   3       0             0 openvpn
Jan  2 21:37:38: [ 5800]    99  5800    11135      587   3       0             0 openvpn
Jan  2 21:37:38: [21552]     0 21552   110137     2111   1       0             0 httpd
Jan  2 21:37:38: [21555]    48 21555   139593     7684   3       0             0 httpd
Jan  2 21:37:38: [21558]    48 21558   140002     8513   3       0             0 httpd
Jan  2 21:37:38: [23283]   497 23283     9846      193   1       0             0 dkim-filter
Jan  2 21:37:38: [23284]   497 23284    33979      524   1       0             0 dkim-filter
Jan  2 21:37:38: [ 6819]     0  6819     2070      152   3       0             0 pptpctrl
Jan  2 21:37:38: [ 6820]     0  6820     5544      237   1       0             0 pppd
Jan  2 21:37:39: [17208]    48 17208   112903     4566   0       0             0 httpd
Jan  2 21:37:39: [17209]    48 17209   138359     5895   0       0             0 httpd
Jan  2 21:37:39: [17210]    48 17210   138693     7341   3       0             0 httpd
Jan  2 21:37:39: [ 1255]     0  1255    24571      713   0       0             0 sshd
Jan  2 21:37:39: [ 1278]     0  1278    13874      396   1       0             0 sftp-server
Jan  2 21:37:39: [14064]    48 14064   138202     6622   3       0             0 httpd
Jan  2 21:37:39: [14065]    48 14065   139625     7776   1       0             0 httpd
Jan  2 21:37:39: [16899]    48 16899   138543     7523   3       0             0 httpd
Jan  2 21:37:39: [32639]    89 32639    19924      722   0       0             0 pickup
Jan  2 21:37:39: [ 4973]    48  4973   136179     4973   3       0             0 httpd
Jan  2 21:37:39: [ 4976]    48  4976   138478     7371   0       0             0 httpd
Jan  2 21:37:39: [ 4977]    48  4977   136173     4777   3       0             0 httpd
Jan  2 21:37:39: [ 5662]     0  5662    35030      336   0       0             0 crond
Jan  2 21:37:39: [ 5663]     0  5663     2297      282   2       0             0 sh
Jan  2 21:37:39: [ 5664]     0  5664     2298      302   0       0             0 bash
Jan  2 21:37:39: [ 5665]     0  5665    15910      437   0       0             0 mutt
Jan  2 21:37:39: [ 5947]     0  5947     2298      337   1       0             0 bash
Jan  2 21:37:39: [ 6416]    48  6416   110170     2070   3       0             0 httpd
Jan  2 21:37:39: [ 6625]    48  6625   110170     1895   0       0             0 httpd
Jan  2 21:37:39: [ 6642]     0  6642    32679     1632   2       0             0 mysqldump
Jan  2 21:37:39: Out of memory: Kill process 19635 (vmware-vmx) score 199 or sacrifice child
Jan  2 21:37:39: Killed process 19635, UID 501, (vmware-vmx) total-vm:6774496kB, anon-rss:74020kB, file-rss:3099352kB 

1 ответ

Ну, я думаю, что ваши min_free_kbytes действительно высоки. У меня есть машина на 16 ГБ, и мой минимум 67584 КБ.

Обратите внимание, что RAM-память vmware считается кешем из-за mmap-ed vmem

Это не всегда правда. Только если файл mmapped() открыт в MAP_SHARED, это правда. Остальные грязные страницы подкачаны. Кажется, что это для вас. Если вы сложите отчет об использовании этого процесса в нижней части вашего вывода и преобразуете его в страницы (4k). Он равен RSS, указанному в дампе задачи для этого процесса.

rss:74020kB, file-rss:3099352kB
74020 + 3099352 = 3173372
3173372 / 4 = 793343

равно..

[19635]   501 19635  1693624   793343   1       0        0 vmware-vmx

Что касается того, почему вы убиваете. Ну, это немного сложнее.

Когда вы достигнете min ядро хочет восстановить память до high байты водяного знака. Таким образом, ядро ​​имеет проверку; если объем памяти, доступный для восстановления из файлового кэша, будет недостаточным, чтобы вернуть вас в high Водяной знак этой зоны, он не потрудится освободить файловый кеш и сразу перейти к восстановлению из анонимной памяти.

Мы никогда не возвращаемся из active, Так -

if (file_inactive > zone_high - free_mem) then
   reclaim (zone_high - free_mem) file inactive pages
else
   reclaim from anonymous pool

В вашем случае это 55220 is not greater than 228684-152456 (76428),

Причина в том, что это OOM-Kill, а не обмен, потому что когда вы нарушаете min водяной знак ядро ​​переходит в direct_reclaim Режим. В этом режиме выполнение ввода-вывода для освобождения памяти невозможно, поскольку это может привести к тупику.

Ваш хост в тот момент менялся, но ваш хост распределялся быстрее, чем он мог поменяться.

Лучший способ исправить это - уменьшить min Водяной знак на что-то ниже - или лучше все же получить больше памяти и / или уменьшить количество вещей, которые вы запускаете на машине.

Другие вопросы по тегам