Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks)

BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Ben Greear <hidden> · 2006-12-20
[PATCH] igmp: spin_lock_bh in timer (Re: BUG: soft lockup detected on CPU#0!) · Jarek Poplawski <hidden> · 2006-12-22
Re: [PATCH] igmp: spin_lock_bh in timer (Re: BUG: soft lockup detected on CPU#0!) · Jarek Poplawski <hidden> · 2006-12-22
Re: [PATCH] igmp: spin_lock_bh in timer (Re: BUG: soft lockup detected on CPU#0!) · Ben Greear <hidden> · 2006-12-22
Re: [PATCH] igmp: spin_lock_bh in timer (Re: BUG: soft lockup detected on CPU#0!) · Ben Greear <hidden> · 2006-12-22
Re: [PATCH] igmp: spin_lock_bh in timer (Re: BUG: soft lockup detected on CPU#0!) · Jarek Poplawski <hidden> · 2006-12-27
Re: [PATCH] igmp: spin_lock_bh in timer (Re: BUG: soft lockup detected on CPU#0!) · Ben Greear <hidden> · 2006-12-27
Re: [PATCH] igmp: spin_lock_bh in timer (Re: BUG: soft lockup detected on CPU#0!) · Jarek Poplawski <hidden> · 2006-12-28
Re: [PATCH] igmp: spin_lock_bh in timer (Re: BUG: soft lockup detected on CPU#0!) · Jarek Poplawski <hidden> · 2006-12-29
Re: [PATCH] igmp: spin_lock_bh in timer (Re: BUG: soft lockup detected on CPU#0!) · Jarek Poplawski <hidden> · 2006-12-22
Re: [PATCH] igmp: spin_lock_bh in timer (Re: BUG: soft lockup detected on CPU#0!) · Herbert Xu <herbert@gondor.apana.org.au> · 2006-12-22
Re: [PATCH] igmp: spin_lock_bh in timer (Re: BUG: soft lockup detected on CPU#0!) · Jarek Poplawski <hidden> · 2006-12-22
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Ben Greear <hidden> · 2007-01-02
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Jarek Poplawski <hidden> · 2007-01-02
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Jarek Poplawski <hidden> · 2007-01-02
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Jarek Poplawski <hidden> · 2007-01-02
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · David Stevens <hidden> · 2007-01-02
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Ben Greear <hidden> · 2007-01-02
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Jarek Poplawski <hidden> · 2007-01-03
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Jarek Poplawski <hidden> · 2007-01-03
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Ben Greear <hidden> · 2007-01-03
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · David Stevens <hidden> · 2007-01-03
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · David Stevens <hidden> · 2007-01-03
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Ben Greear <hidden> · 2007-01-03
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · David Stevens <hidden> · 2007-01-03
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Herbert Xu <herbert@gondor.apana.org.au> · 2007-01-04
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Ben Greear <hidden> · 2007-01-04
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Herbert Xu <herbert@gondor.apana.org.au> · 2007-01-04
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · David Stevens <hidden> · 2007-01-04
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · David Stevens <hidden> · 2007-01-04
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Herbert Xu <herbert@gondor.apana.org.au> · 2007-01-04
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Jarek Poplawski <hidden> · 2007-01-04
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Herbert Xu <hidden> · 2007-01-04
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Jarek Poplawski <hidden> · 2007-01-04
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Herbert Xu <hidden> · 2007-01-04
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Jarek Poplawski <hidden> · 2007-01-04
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Ben Greear <hidden> · 2007-01-04
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Jarek Poplawski <hidden> · 2007-01-05
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · David Miller <davem@davemloft.net> · 2007-01-04
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Jarek Poplawski <hidden> · 2007-01-05
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Herbert Xu <herbert@gondor.apana.org.au> · 2007-01-05
[PATCH] devinet: inetdev_init out label moved after RCU assignment · Jarek Poplawski <hidden> · 2007-01-05
Re: [PATCH] devinet: inetdev_init out label moved after RCU assignment · Herbert Xu <herbert@gondor.apana.org.au> · 2007-01-05
Re: [PATCH] devinet: inetdev_init out label moved after RCU assignment · Jarek Poplawski <hidden> · 2007-01-05
Re: [PATCH] devinet: inetdev_init out label moved after RCU assignment · David Miller <davem@davemloft.net> · 2007-01-09
Re: [PATCH] devinet: inetdev_init out label moved after RCU assignment · David Stevens <hidden> · 2007-01-05
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Ben Greear <hidden> · 2007-01-05
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · David Miller <davem@davemloft.net> · 2007-01-05
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Jarek Poplawski <hidden> · 2007-01-08
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Ben Greear <hidden> · 2007-01-08
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Stephen Hemminger <hidden> · 2007-01-08
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Jarek Poplawski <hidden> · 2007-01-09
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Jarek Poplawski <hidden> · 2007-01-10
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Jarek Poplawski <hidden> · 2007-01-10
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Stephen Hemminger <hidden> · 2007-01-10
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Jarek Poplawski <hidden> · 2007-01-11
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · David Miller <davem@davemloft.net> · 2007-01-11
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Jarek Poplawski <hidden> · 2007-01-11
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Jarek Poplawski <hidden> · 2007-01-11
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Jarek Poplawski <hidden> · 2007-01-11
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · David Miller <davem@davemloft.net> · 2007-01-11
Re: BUG: soft lockup detected on CPU#0! (2.6.18.2 plus hacks) · Jarek Poplawski <hidden> · 2007-01-11
RCU info · Stephen Hemminger <hidden> · 2007-01-11
Re: RCU info · Jarek Poplawski <hidden> · 2007-01-12

From: Ben Greear <hidden>
Date: 2007-01-05 20:35:08

David Miller wrote:

From: Herbert Xu <herbert@gondor.apana.org.au>
Date: Thu, 04 Jan 2007 17:26:27 +1100

quoted

David Stevens [off-list ref] wrote:

quoted

       You're right, I don't know whether it'll fix the problem Ben saw
or not, but it looks like the original code can do a receive before the
in_device is fully initialized, and that, of course, is bad.
       If the device for ip_rcv() is not the same one we were
initializing when the receive interrupted, then the patch should have
no effect either way -- I don't think it'll hide other problems.
       If it's hard to reproduce (which I guess is true), then you're
right, no soft lockup doesn't really tell us if it's fixed or not.

Actually I missed your point that the multicast locks aren't even
initialised at that point.  So this does explain the soft lock-up
and therefore your patch is clearly the correct solution.

I agree too, therefore I've added David's patch as below.

I'll push this to the -stable branches as well.  This fix is
correct even if it does not entirely clear up the soft lockup
bug being discussed in this thread, but I think it will :-)

We were able to reproduce the problem twice on the un-patched 2.6.18.2 kernel in about
2 hours of our stress test yesterday.  I applied this patch (well, the
ipv4 part..the ipv6 won't apply to 2.6.18.2), and it has run the stress
test clean for a total of about 8 hours.

So, I do believe this was the problem we were hitting, and it seems fixed.

Thanks!
Ben

-- 
Ben Greear [off-list ref]
Candela Technologies Inc  http://www.candelatech.com

`h`	back out one level
`j`	next message in thread
`k`	previous message in thread
`l`	drill in
`Esc`	close help / fold thread tree
`?`	toggle this help