Re: [0/14] GRO: Lots of microoptimisations

[0/14] GRO: Lots of microoptimisations · Herbert Xu <herbert@gondor.apana.org.au> · 2009-05-27
[PATCH 6/14] tcp: Remove unnecessary window comparisons for GRO · Herbert Xu <herbert@gondor.apana.org.au> · 2009-05-27
[PATCH 7/14] tcp: Optimise len/mss comparison · Herbert Xu <herbert@gondor.apana.org.au> · 2009-05-27
[PATCH 8/14] gro: Optimise length comparison in skb_gro_header · Herbert Xu <herbert@gondor.apana.org.au> · 2009-05-27
[PATCH 13/14] gro: Store shinfo in local variable in skb_gro_receive · Herbert Xu <herbert@gondor.apana.org.au> · 2009-05-27
[PATCH 9/14] gro: Avoid unnecessary comparison after skb_gro_header · Herbert Xu <herbert@gondor.apana.org.au> · 2009-05-27
[PATCH 11/14] gro: Open-code final pskb_may_pull · Herbert Xu <herbert@gondor.apana.org.au> · 2009-05-27
[PATCH 4/14] gro: Only use skb_gro_header for completely non-linear packets · Herbert Xu <herbert@gondor.apana.org.au> · 2009-05-27
[PATCH 5/14] tcp: Optimise GRO port comparisons · Herbert Xu <herbert@gondor.apana.org.au> · 2009-05-27
[PATCH 3/14] gro: Localise offset/headlen in skb_gro_offset · Herbert Xu <herbert@gondor.apana.org.au> · 2009-05-27
[PATCH 2/14] gro: Inline skb_gro_header and cache frag0 virtual address · Herbert Xu <herbert@gondor.apana.org.au> · 2009-05-27
[PATCH 1/14] gro: Open-code frags copy in skb_gro_receive · Herbert Xu <herbert@gondor.apana.org.au> · 2009-05-27
[PATCH 12/14] gro: Nasty optimisations for page frags in skb_gro_receive · Herbert Xu <herbert@gondor.apana.org.au> · 2009-05-27
[PATCH 10/14] ipv4: Use 32-bit loads for ID and length in GRO · Herbert Xu <herbert@gondor.apana.org.au> · 2009-05-27
Re: [PATCH 10/14] ipv4: Use 32-bit loads for ID and length in GRO · Andi Kleen <hidden> · 2009-05-27
Re: [PATCH 10/14] ipv4: Use 32-bit loads for ID and length in GRO · Herbert Xu <herbert@gondor.apana.org.au> · 2009-05-27
[PATCH 14/14] tcp: Do not check flush when comparing options for GRO · Herbert Xu <herbert@gondor.apana.org.au> · 2009-05-27
Re: [0/14] GRO: Lots of microoptimisations · David Miller <davem@davemloft.net> · 2009-05-27
Re: [0/14] GRO: Lots of microoptimisations · Benjamin LaHaise <hidden> · 2009-05-27
Re: [0/14] GRO: Lots of microoptimisations · Herbert Xu <herbert@gondor.apana.org.au> · 2009-05-27
Re: [0/14] GRO: Lots of microoptimisations · Benjamin LaHaise <hidden> · 2009-05-28
Re: [0/14] GRO: Lots of microoptimisations · Herbert Xu <herbert@gondor.apana.org.au> · 2009-05-29
Re: [0/14] GRO: Lots of microoptimisations · Herbert Xu <herbert@gondor.apana.org.au> · 2009-05-29
Re: [0/14] GRO: Lots of microoptimisations · Benjamin LaHaise <hidden> · 2009-05-29
Re: [0/14] GRO: Lots of microoptimisations · Herbert Xu <herbert@gondor.apana.org.au> · 2009-06-10
Re: [0/14] GRO: Lots of microoptimisations · Benjamin LaHaise <hidden> · 2009-06-12
Re: [0/14] GRO: Lots of microoptimisations · David Miller <davem@davemloft.net> · 2009-06-12
Re: [0/14] GRO: Lots of microoptimisations · Benjamin LaHaise <hidden> · 2009-06-16
Re: [0/14] GRO: Lots of microoptimisations · Herbert Xu <herbert@gondor.apana.org.au> · 2009-06-16
Re: [0/14] GRO: Lots of microoptimisations · Herbert Xu <herbert@gondor.apana.org.au> · 2009-06-17
Re: [0/14] GRO: Lots of microoptimisations · Herbert Xu <herbert@gondor.apana.org.au> · 2009-06-17
Re: [0/14] GRO: Lots of microoptimisations · Rick Jones <hidden> · 2009-06-17

From: Benjamin LaHaise <hidden>
Date: 2009-06-16 16:35:53

On Fri, Jun 12, 2009 at 04:48:33PM -0700, David Miller wrote:

I find a 500Mbps difference, due to just one single cache miss on
every packet, simply astounding and unbelievable.  But hey, it is
what you are seeing, so something has to account for it. :)

The cache miss only accounts for ~50Mbpsi, it'd be nice if there was an 
easy way to get the whole 500Mbps back.  The rest seems to be in the 
general overhead of the GRO code vs the normal NAPI rx path.  The P4 
Xeon is substantially worse at string operations than the Core 2 / Core i7 
based Xeons, so I'm hoping to test and see if they do any better with the 
GRO code when I get access to a new machine soon.

		-ben

`h`	back out one level
`j`	next message in thread
`k`	previous message in thread
`l`	drill in
`Esc`	close help / fold thread tree
`?`	toggle this help