Re: [PATCH net-next v7 0/5] net: devmem: improve cpu cost of RX token management

[PATCH net-next v7 0/5] net: devmem: improve cpu cost of RX token management · Bobby Eshleman <hidden> · 2025-11-20
[PATCH net-next v7 1/5] net: devmem: rename tx_vec to vec in dmabuf binding · Bobby Eshleman <hidden> · 2025-11-20
[PATCH net-next v7 2/5] net: devmem: refactor sock_devmem_dontneed for autorelease split · Bobby Eshleman <hidden> · 2025-11-20
[PATCH net-next v7 3/5] net: devmem: implement autorelease token management · Bobby Eshleman <hidden> · 2025-11-20
Re: [PATCH net-next v7 3/5] net: devmem: implement autorelease token management · Paolo Abeni <pabeni@redhat.com> · 2025-11-20
Re: [PATCH net-next v7 3/5] net: devmem: implement autorelease token management · Bobby Eshleman <hidden> · 2025-11-20
Re: [PATCH net-next v7 3/5] net: devmem: implement autorelease token management · Stanislav Fomichev <hidden> · 2025-11-21
Re: [PATCH net-next v7 3/5] net: devmem: implement autorelease token managementy · Bobby Eshleman <hidden> · 2025-11-21
Re: [PATCH net-next v7 3/5] net: devmem: implement autorelease token management · Simon Horman <horms@kernel.org> · 2025-11-26
[PATCH net-next v7 4/5] net: devmem: document NETDEV_A_DMABUF_AUTORELEASE netlink attribute · Bobby Eshleman <hidden> · 2025-11-20
[PATCH net-next v7 5/5] selftests: drv-net: devmem: add autorelease tests · Bobby Eshleman <hidden> · 2025-11-20
Re: [PATCH net-next v7 5/5] selftests: drv-net: devmem: add autorelease tests · Simon Horman <horms@kernel.org> · 2025-11-26
Re: [PATCH net-next v7 0/5] net: devmem: improve cpu cost of RX token management · Bobby Eshleman <hidden> · 2025-12-09
Re: [PATCH net-next v7 0/5] net: devmem: improve cpu cost of RX token management · Mina Almasry <hidden> · 2025-12-09

From: Mina Almasry <hidden>
Date: 2025-12-09 19:55:21
Also in: linux-arch, linux-doc, linux-kselftest, lkml

On Tue, Dec 9, 2025 at 11:52 AM Bobby Eshleman [off-list ref] wrote:

On Wed, Nov 19, 2025 at 07:37:07PM -0800, Bobby Eshleman wrote:

quoted

This series improves the CPU cost of RX token management by adding an
attribute to NETDEV_CMD_BIND_RX that configures sockets using the
binding to avoid the xarray allocator and instead use a per-binding niov
array and a uref field in niov.

Improvement is ~13% cpu util per RX user thread.

Using kperf, the following results were observed:

Before:
      Average RX worker idle %: 13.13, flows 4, test runs 11
After:
      Average RX worker idle %: 26.32, flows 4, test runs 11

Two other approaches were tested, but with no improvement. Namely, 1)
using a hashmap for tokens and 2) keeping an xarray of atomic counters
but using RCU so that the hotpath could be mostly lockless. Neither of
these approaches proved better than the simple array in terms of CPU.

The attribute NETDEV_A_DMABUF_AUTORELEASE is added to toggle the
optimization. It is an optional attribute and defaults to 0 (i.e.,
optimization on).

[...]

quoted

Changes in v7:
- use netlink instead of sockopt (Stan)
- restrict system to only one mode, dmabuf bindings can not co-exist
  with different modes (Stan)
- use static branching to enforce single system-wide mode (Stan)
- Link to v6: https://lore.kernel.org/r/20251104-scratch-bobbyeshleman-devmem-tcp-token-upstream-v6-0-ea98cf4d40b3@meta.com (local)

Mina, I was wondering if you had any feedback on this approach?

Sorry for the delay, I'll take a look shortly.


-- 
Thanks,
Mina

`h`	back out one level
`j`	next message in thread
`k`	previous message in thread
`l`	drill in
`Esc`	close help / fold thread tree
`?`	toggle this help