[PATCH 2/9] locking/qrwlock: avoid redundant atomic_add_return on read_lock_slowpath

[PATCH 0/9] locking/qrwlock: get qrwlocks up and running on arm64 · Will Deacon <hidden> · 2015-07-07
[PATCH 1/9] locking/qrwlock: include <linux/spinlock.h> for arch_spin_{lock, unlock} · Will Deacon <hidden> · 2015-07-07
[PATCH 2/9] locking/qrwlock: avoid redundant atomic_add_return on read_lock_slowpath · Will Deacon <hidden> · 2015-07-07
[PATCH 2/9] locking/qrwlock: avoid redundant atomic_add_return on read_lock_slowpath · Waiman Long <hidden> · 2015-07-07
[PATCH 2/9] locking/qrwlock: avoid redundant atomic_add_return on read_lock_slowpath · Will Deacon <hidden> · 2015-07-07
[PATCH 2/9] locking/qrwlock: avoid redundant atomic_add_return on read_lock_slowpath · Waiman Long <hidden> · 2015-07-07
[PATCH 2/9] locking/qrwlock: avoid redundant atomic_add_return on read_lock_slowpath · peterz@infradead.org (Peter Zijlstra) · 2015-07-08
[PATCH 2/9] locking/qrwlock: avoid redundant atomic_add_return on read_lock_slowpath · Will Deacon <hidden> · 2015-07-08
[PATCH 2/9] locking/qrwlock: avoid redundant atomic_add_return on read_lock_slowpath · peterz@infradead.org (Peter Zijlstra) · 2015-07-07
[PATCH 3/9] locking/qrwlock: tidy up rspin_until_writer_unlock · Will Deacon <hidden> · 2015-07-07
[PATCH 4/9] locking/qrwlock: implement queue_write_unlock using smp_store_release · Will Deacon <hidden> · 2015-07-07
[PATCH 4/9] locking/qrwlock: implement queue_write_unlock using smp_store_release · peterz@infradead.org (Peter Zijlstra) · 2015-07-08
[PATCH 5/9] locking/qrwlock: remove redundant cmpxchg barriers on writer slow-path · Will Deacon <hidden> · 2015-07-07
[PATCH 5/9] locking/qrwlock: remove redundant cmpxchg barriers on writer slow-path · peterz@infradead.org (Peter Zijlstra) · 2015-07-08
[PATCH 5/9] locking/qrwlock: remove redundant cmpxchg barriers on writer slow-path · Will Deacon <hidden> · 2015-07-08
[PATCH 6/9] locking/qrwlock: allow architectures to hook in to contended paths · Will Deacon <hidden> · 2015-07-07
[PATCH 6/9] locking/qrwlock: allow architectures to hook in to contended paths · peterz@infradead.org (Peter Zijlstra) · 2015-07-08
[PATCH 6/9] locking/qrwlock: allow architectures to hook in to contended paths · Will Deacon <hidden> · 2015-07-08
[PATCH 7/9] locking/qrwlock: expose internal lock structure in qrwlock definition · Will Deacon <hidden> · 2015-07-07
[PATCH 8/9] arm64: cmpxchg: implement cmpxchg_relaxed · Will Deacon <hidden> · 2015-07-07
[PATCH 9/9] arm64: locking: replace read/write locks with generic qrwlock code · Will Deacon <hidden> · 2015-07-07

STALE3991d

From: peterz@infradead.org (Peter Zijlstra)
Date: 2015-07-07 21:30:01
Also in: linux-arch

On Tue, Jul 07, 2015 at 01:51:54PM -0400, Waiman Long wrote:

quoted

-	cnts = atomic_add_return(_QR_BIAS,&lock->cnts) - _QR_BIAS;
+	atomic_add(_QR_BIAS,&lock->cnts);
+	cnts = smp_load_acquire((u32 *)&lock->cnts);
 	rspin_until_writer_unlock(lock, cnts);

 	/*

Atomic add in x86 is actually a full barrier too. The performance difference
between "lock add" and "lock xadd" should be minor. The additional load,
however, could potentially cause an additional cacheline load on a contended
lock. So do you see actual performance benefit of this change in ARM?

Yes, atomic_add() does not imply (and does not have) any memory barriers
on ARM.

`h`	back out one level
`j`	next message in thread
`k`	previous message in thread
`l`	drill in
`Esc`	close help / fold thread tree
`?`	toggle this help