Re: memory-cgroup bug

(off-list ancestor, not in this archive)
Re: memory-cgroup bug · Michal Hocko <hidden> · 2012-11-22
Re: memory-cgroup bug · azurIt <hidden> · 2012-11-22
Re: memory-cgroup bug · Michal Hocko <hidden> · 2012-11-22
Re: memory-cgroup bug · azurIt <hidden> · 2012-11-22
Re: memory-cgroup bug · Michal Hocko <hidden> · 2012-11-23
Re: memory-cgroup bug · azurIt <hidden> · 2012-11-23
Re: memory-cgroup bug · Michal Hocko <hidden> · 2012-11-23
Re: memory-cgroup bug · azurIt <hidden> · 2012-11-23
Re: memory-cgroup bug · Michal Hocko <hidden> · 2012-11-23
Re: memory-cgroup bug · Glauber Costa <hidden> · 2012-11-23
Re: memory-cgroup bug · Michal Hocko <hidden> · 2012-11-23
Re: memory-cgroup bug · azurIt <hidden> · 2012-11-23
Re: memory-cgroup bug · Michal Hocko <hidden> · 2012-11-25
Re: memory-cgroup bug · azurIt <hidden> · 2012-11-25
Re: memory-cgroup bug · Michal Hocko <hidden> · 2012-11-25
Re: memory-cgroup bug · azurIt <hidden> · 2012-11-25
Re: memory-cgroup bug · Michal Hocko <hidden> · 2012-11-25
Re: memory-cgroup bug · azurIt <hidden> · 2012-11-25
Re: memory-cgroup bug · Michal Hocko <hidden> · 2012-11-25
Re: memory-cgroup bug · azurIt <hidden> · 2012-11-25
Re: memory-cgroup bug · Michal Hocko <hidden> · 2012-11-25
Re: memory-cgroup bug · azurIt <hidden> · 2012-11-26
Re: memory-cgroup bug · Michal Hocko <hidden> · 2012-11-26
[PATCH -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-26
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-26
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-11-26
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-11-30
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-11-30
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-30
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-11-30
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-11-30
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-30
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-30
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-30
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-11-30
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-30
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-11-30
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-30
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-11-30
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-30
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-11-30
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-12-03
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-12-05
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-12-05
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-12-06
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-12-06
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-12-06
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-12-06
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-12-10
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-12-10
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-12-10
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-12-10
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-12-10
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-12-17
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-12-17
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-12-17
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-12-17
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-12-18
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-12-18
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-12-24
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-12-28
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-12-30
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-12-30
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2013-01-25
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2013-01-25
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2013-02-05
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2013-02-05
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2013-02-05
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2013-02-05
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2013-02-06
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2013-02-06
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2013-02-06
[PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · Michal Hocko <hidden> · 2013-02-06
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · azurIt <hidden> · 2013-02-08
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · Michal Hocko <hidden> · 2013-02-08
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · azurIt <hidden> · 2013-02-08
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · Michal Hocko <hidden> · 2013-02-08
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · azurIt <hidden> · 2013-02-08
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · Michal Hocko <hidden> · 2013-02-08
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · Michal Hocko <hidden> · 2013-02-08
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · azurIt <hidden> · 2013-02-08
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · Michal Hocko <hidden> · 2013-02-08
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · azurIt <hidden> · 2013-02-08
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · Michal Hocko <hidden> · 2013-02-10
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · azurIt <hidden> · 2013-02-10
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · Michal Hocko <hidden> · 2013-02-11
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · azurIt <hidden> · 2013-02-22
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · Michal Hocko <hidden> · 2013-02-22
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · azurIt <hidden> · 2013-02-22
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · Michal Hocko <hidden> · 2013-02-22
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · Michal Hocko <hidden> · 2013-06-06
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · azurIt <hidden> · 2013-06-06
[PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · Michal Hocko <hidden> · 2013-06-07
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · azurIt <hidden> · 2013-06-17
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · Michal Hocko <hidden> · 2013-06-19
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · azurIt <hidden> · 2013-06-22
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · Johannes Weiner <hannes@cmpxchg.org> · 2013-06-24
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · azurIt <hidden> · 2013-06-28
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · Johannes Weiner <hannes@cmpxchg.org> · 2013-07-05
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · azurIt <hidden> · 2013-07-05
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · Johannes Weiner <hannes@cmpxchg.org> · 2013-07-05
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · azurIt <hidden> · 2013-07-07
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · Michal Hocko <hidden> · 2013-07-09
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · azurIt <hidden> · 2013-07-09
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · Michal Hocko <hidden> · 2013-07-09
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · azurIt <hidden> · 2013-07-10
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · Michal Hocko <hidden> · 2013-07-11
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · azurIt <hidden> · 2013-07-13
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · azurIt <hidden> · 2013-07-13
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · Michal Hocko <hidden> · 2013-07-15
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · Michal Hocko <hidden> · 2013-07-15
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · Johannes Weiner <hannes@cmpxchg.org> · 2013-07-16
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · Michal Hocko <hidden> · 2013-07-16
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · Johannes Weiner <hannes@cmpxchg.org> · 2013-07-16
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · Johannes Weiner <hannes@cmpxchg.org> · 2013-07-19
[patch 1/5] mm: invoke oom-killer from remaining unconverted page fault handlers · Johannes Weiner <hannes@cmpxchg.org> · 2013-07-19
[patch 2/5] mm: pass userspace fault flag to generic fault handler · Johannes Weiner <hannes@cmpxchg.org> · 2013-07-19
[patch 3/5] x86: finish fault error path with fatal signal · Johannes Weiner <hannes@cmpxchg.org> · 2013-07-19
Re: [patch 3/5] x86: finish fault error path with fatal signal · Johannes Weiner <hannes@cmpxchg.org> · 2013-07-24
Re: [patch 3/5] x86: finish fault error path with fatal signal · KOSAKI Motohiro <hidden> · 2013-07-25
Re: [patch 3/5] x86: finish fault error path with fatal signal · Johannes Weiner <hannes@cmpxchg.org> · 2013-07-25
[patch 4/5] memcg: do not trap chargers with full callstack on OOM · Johannes Weiner <hannes@cmpxchg.org> · 2013-07-19
[patch 5/5] mm: memcontrol: sanity check memcg OOM context unwind · Johannes Weiner <hannes@cmpxchg.org> · 2013-07-19
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · azurIt <hidden> · 2013-07-19
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · azurIt <hidden> · 2013-07-14
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · Michal Hocko <hidden> · 2013-07-09
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · Michal Hocko <hidden> · 2013-07-09
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · Michal Hocko <hidden> · 2013-07-09
Re: [PATCH for 3.2] memcg: do not trap chargers with full callstack on OOM · azurIt <hidden> · 2013-06-24
Re: [PATCH for 3.2.34] memcg: do not trigger OOM if PF_NO_MEMCG_OOM is set · azurIt <hidden> · 2013-02-22
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Kamezawa Hiroyuki <hidden> · 2013-02-07
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2013-02-07
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Kamezawa Hiroyuki <hidden> · 2013-02-08
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Kamezawa Hiroyuki <hidden> · 2013-02-08
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2013-02-08
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2013-02-05
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-12-24
Re: [PATCH for 3.2.34] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-12-28
Re: [PATCH -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Johannes Weiner <hannes@cmpxchg.org> · 2012-11-26
Re: [PATCH -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-26
Re: [PATCH -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Johannes Weiner <hannes@cmpxchg.org> · 2012-11-26
Re: [PATCH -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-26
Re: [PATCH -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Johannes Weiner <hannes@cmpxchg.org> · 2012-11-26
Re: [PATCH -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-26
Re: [PATCH -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Johannes Weiner <hannes@cmpxchg.org> · 2012-11-26
Re: [PATCH -mm] memcg: do not trigger OOM from add_to_page_cache_locked · azurIt <hidden> · 2012-11-26
Re: [PATCH -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Johannes Weiner <hannes@cmpxchg.org> · 2012-11-26
Re: [PATCH -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-26
Re: [PATCH -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Kamezawa Hiroyuki <hidden> · 2012-11-27
Re: [PATCH -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-27
Re: [PATCH -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Johannes Weiner <hannes@cmpxchg.org> · 2012-11-27
[PATCH -v2 -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-27
Re: [PATCH -v2 -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-27
Re: [PATCH -v2 -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Johannes Weiner <hannes@cmpxchg.org> · 2012-11-28
Re: [PATCH -v2 -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-28
Re: [PATCH -v2 -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Johannes Weiner <hannes@cmpxchg.org> · 2012-11-28
Re: [PATCH -v2 -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-28
Re: [PATCH -v2 -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-28
Re: [PATCH -v2 -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Johannes Weiner <hannes@cmpxchg.org> · 2012-11-28
Re: [PATCH -v2 -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Hugh Dickins <hughd@google.com> · 2012-11-28
Re: [PATCH -v2 -mm] memcg: do not trigger OOM from add_to_page_cache_locked · Michal Hocko <hidden> · 2012-11-29

From: azurIt <hidden>
Date: 2012-11-23 14:59:10
Also in: linux-mm, lkml

If you could instrument mem_cgroup_handle_oom with some printks (before
we take the memcg_oom_lock, before we schedule and into
mem_cgroup_out_of_memory)


If you send me patch i can do it. I'm, unfortunately, not able to code it.

quoted

It, luckily, happend again so i have more info.

 - there wasn't any logs in kernel from OOM for that cgroup
 - there were 16 processes in cgroup
 - processes in cgroup were taking togather 100% of CPU (it
   was allowed to use only one core, so 100% of that core)
 - memory.failcnt was groving fast
 - oom_control:
oom_kill_disable 0
under_oom 0 (this was looping from 0 to 1)

So there was an OOM going on but no messages in the log? Really strange.
Kame already asked about oom_score_adj of the processes in the group but
it didn't look like all the processes would have oom disabled, right?


There were no messages telling that some processes were killed because of OOM.

quoted

 - limit_in_bytes was set to 157286400
 - content of stat (as you can see, the whole memory limit was used):
cache 0
rss 0

This looks like a top-level group for your user.


Yes, it was from /cgroup/<user-id>/

quoted

mapped_file 0
pgpgin 0
pgpgout 0
swap 0
pgfault 0
pgmajfault 0
inactive_anon 0
active_anon 0
inactive_file 0
active_file 0
unevictable 0
hierarchical_memory_limit 157286400
hierarchical_memsw_limit 157286400
total_cache 0
total_rss 157286400

OK, so all the memory is anonymous and you have no swap so the oom is
the only thing to do.


What will happen if the same situation occurs globally? No swap, every bit of memory used. Will kernel be able to start OOM killer? Maybe the same thing is happening in cgroup - there's simply no space to run OOM killer. And maybe this is why it's happening rarely - usually there are still at least few KBs of memory left to start OOM killer.

Hmm, all processes waiting for oom are stuck at the very same place:
$ grep mem_cgroup_handle_oom -r [0-9]*
30858/stack:[<ffffffff8110a9c1>] mem_cgroup_handle_oom+0x241/0x3b0
30859/stack:[<ffffffff8110a9c1>] mem_cgroup_handle_oom+0x241/0x3b0
30860/stack:[<ffffffff8110a9c1>] mem_cgroup_handle_oom+0x241/0x3b0
30892/stack:[<ffffffff8110a9c1>] mem_cgroup_handle_oom+0x241/0x3b0
30898/stack:[<ffffffff8110a9c1>] mem_cgroup_handle_oom+0x241/0x3b0
31588/stack:[<ffffffff8110a9c1>] mem_cgroup_handle_oom+0x241/0x3b0
32044/stack:[<ffffffff8110a9c1>] mem_cgroup_handle_oom+0x241/0x3b0
32358/stack:[<ffffffff8110a9c1>] mem_cgroup_handle_oom+0x241/0x3b0
6031/stack:[<ffffffff8110a9c1>] mem_cgroup_handle_oom+0x241/0x3b0
6534/stack:[<ffffffff8110a9c1>] mem_cgroup_handle_oom+0x241/0x3b0
7020/stack:[<ffffffff8110a9c1>] mem_cgroup_handle_oom+0x241/0x3b0

We are taking memcg_oom_lock spinlock twice in that function + we can
schedule. As none of the tasks is scheduled this would suggest that you
are blocked at the first lock. But who got the lock then?
This is really strange.
Btw. is sysrq+t resp. sysrq+w showing the same traces as
/proc/<pid>/stat?


Unfortunately i'm connecting remotely to the servers (SSH).

quoted

Notice that stack is different for few processes.

Yes others are in VFS resp ext3. ext3_write_begin looks a bit dangerous
but it grabs the page before it really starts a transaction.


Maybe these processes were throttled by cgroup-blkio at the same time and are still keeping the lock? So the problem occurs when there are low on memory and cgroup is doing IO out of it's limits. Only guessing and telling my thoughts.

quoted

Stack for all processes were NOT chaging and was still the same.

Could you take few snapshots over time?


Will do next time but i can't keep services freezed for a long time or customers will be angry.

quoted

didn't checked if cgroup was freezed but i suppose it wasn't):
none            /cgroups        cgroup  defaults,cpuacct,cpuset,memory,freezer,task,blkio 0 0

Do you see the same issue if only memory controller was mounted (resp.
cpuset which you seem to use as well from your description).


Uh, we are using all mounted subsystems :( I will be able to umount only freezer and maybe blkio for some time. Will it help?

I know you said booting into a vanilla kernel would be problematic but
could you at least rule out te cgroup patches that you have mentioned?
If you need to move a task to a group based by an uid you can use
cgrules daemon (libcgroup1 package) for that as well.


We are using cgroup-uid cos it's MUCH MUCH MUCH more efective and better. For example, i don't believe that cgroup-task will work with that daemon. What will happen if cgrules won't be able to add process into cgroup because of task limit? Process will probably continue and will run outside of any cgroup which is wrong. With cgroup-task + cgroup-uid, such processes cannot be even started (and this is what we need).

`h`	back out one level
`j`	next message in thread
`k`	previous message in thread
`l`	drill in
`Esc`	close help / fold thread tree
`?`	toggle this help