Re: [v3 0/9] parallelized "struct page" zeroing

[v3 0/9] parallelized "struct page" zeroing · Pavel Tatashin <hidden> · 2017-05-05
[v3 6/9] sparc64: teach sparc not to zero struct pages memory · Pavel Tatashin <hidden> · 2017-05-05
[v3 7/9] x86: teach x86 not to zero struct pages memory · Pavel Tatashin <hidden> · 2017-05-05
[v3 1/9] sparc64: simplify vmemmap_populate · Pavel Tatashin <hidden> · 2017-05-05
[v3 4/9] mm: do not zero vmemmap_buf · Pavel Tatashin <hidden> · 2017-05-05
[v3 5/9] mm: zero struct pages during initialization · Pavel Tatashin <hidden> · 2017-05-05
[v3 2/9] mm: defining memblock_virt_alloc_try_nid_raw · Pavel Tatashin <hidden> · 2017-05-05
[v3 8/9] powerpc: teach platforms not to zero struct pages memory · Pavel Tatashin <hidden> · 2017-05-05
[v3 9/9] s390: teach platforms not to zero struct pages memory · Pavel Tatashin <hidden> · 2017-05-05
Re: [v3 9/9] s390: teach platforms not to zero struct pages memory · Heiko Carstens <hidden> · 2017-05-08
Re: [v3 9/9] s390: teach platforms not to zero struct pages memory · Pasha Tatashin <hidden> · 2017-05-15
Re: [v3 9/9] s390: teach platforms not to zero struct pages memory · Heiko Carstens <hidden> · 2017-05-15
Re: [v3 9/9] s390: teach platforms not to zero struct pages memory · Pasha Tatashin <hidden> · 2017-05-16
[v3 3/9] mm: add "zero" argument to vmemmap allocators · Pavel Tatashin <hidden> · 2017-05-05
Re: [v3 3/9] mm: add "zero" argument to vmemmap allocators · kbuild test robot <hidden> · 2017-05-13
Re: [v3 0/9] parallelized "struct page" zeroing · Michal Hocko <mhocko@kernel.org> · 2017-05-09
Re: [v3 0/9] parallelized "struct page" zeroing · Pasha Tatashin <hidden> · 2017-05-09
Re: [v3 0/9] parallelized "struct page" zeroing · Michal Hocko <mhocko@kernel.org> · 2017-05-10
Re: [v3 0/9] parallelized "struct page" zeroing · Pasha Tatashin <hidden> · 2017-05-10
Re: [v3 0/9] parallelized "struct page" zeroing · Michal Hocko <mhocko@kernel.org> · 2017-05-10
Re: [v3 0/9] parallelized "struct page" zeroing · Pasha Tatashin <hidden> · 2017-05-10
Re: [v3 0/9] parallelized "struct page" zeroing · David Miller <davem@davemloft.net> · 2017-05-10
Re: [v3 0/9] parallelized "struct page" zeroing · Pasha Tatashin <hidden> · 2017-05-11
Re: [v3 0/9] parallelized "struct page" zeroing · Pasha Tatashin <hidden> · 2017-05-11
Re: [v3 0/9] parallelized "struct page" zeroing · David Miller <davem@davemloft.net> · 2017-05-12
Re: [v3 0/9] parallelized "struct page" zeroing · Pasha Tatashin <hidden> · 2017-05-12
Re: [v3 0/9] parallelized "struct page" zeroing · David Miller <davem@davemloft.net> · 2017-05-12
Re: [v3 0/9] parallelized "struct page" zeroing · Benjamin Herrenschmidt <hidden> · 2017-05-16
Re: [v3 0/9] parallelized "struct page" zeroing · David Miller <davem@davemloft.net> · 2017-05-12
Re: [v3 0/9] parallelized "struct page" zeroing · David Miller <davem@davemloft.net> · 2017-05-10
Re: [v3 0/9] parallelized "struct page" zeroing · Matthew Wilcox <willy@infradead.org> · 2017-05-10
Re: [v3 0/9] parallelized "struct page" zeroing · David Miller <davem@davemloft.net> · 2017-05-10
Re: [v3 0/9] parallelized "struct page" zeroing · Matthew Wilcox <willy@infradead.org> · 2017-05-10
Re: [v3 0/9] parallelized "struct page" zeroing · Michal Hocko <mhocko@kernel.org> · 2017-05-11
Re: [v3 0/9] parallelized "struct page" zeroing · David Miller <davem@davemloft.net> · 2017-05-11
Re: [v3 0/9] parallelized "struct page" zeroing · Pasha Tatashin <hidden> · 2017-05-15
Re: [v3 0/9] parallelized "struct page" zeroing · Michal Hocko <mhocko@kernel.org> · 2017-05-15
Re: [v3 0/9] parallelized "struct page" zeroing · Pasha Tatashin <hidden> · 2017-05-15
Re: [v3 0/9] parallelized "struct page" zeroing · Michal Hocko <mhocko@kernel.org> · 2017-05-16
Re: [v3 0/9] parallelized "struct page" zeroing · Pasha Tatashin <hidden> · 2017-05-26
Re: [v3 0/9] parallelized "struct page" zeroing · Michal Hocko <mhocko@kernel.org> · 2017-05-29
Re: [v3 0/9] parallelized "struct page" zeroing · Pasha Tatashin <hidden> · 2017-05-30
Re: [v3 0/9] parallelized "struct page" zeroing · Michal Hocko <mhocko@kernel.org> · 2017-05-31
Re: [v3 0/9] parallelized "struct page" zeroing · David Miller <davem@davemloft.net> · 2017-05-31
Re: [v3 0/9] parallelized "struct page" zeroing · Pasha Tatashin <hidden> · 2017-06-01
Re: [v3 0/9] parallelized "struct page" zeroing · Michal Hocko <mhocko@kernel.org> · 2017-06-01

From: Benjamin Herrenschmidt <hidden>
Date: 2017-05-16 23:52:00
Also in: linux-mm, linux-s390, lkml, sparclinux

On Fri, 2017-05-12 at 13:37 -0400, David Miller wrote:

quoted

Right now it is larger, but what I suggested is to add a new optimized
routine just for this case, which would do STBI for 64-bytes but
without membar (do membar at the end of memmap_init_zone() and
deferred_init_memmap()

#define struct_page_clear(page)                                 \
         __asm__ __volatile__(                                   \
         "stxa   %%g0, [%0]%2\n"                                 \
         "stxa   %%xg0, [%0 + %1]%2\n"                           \
         : /* No output */                                       \
         : "r" (page), "r" (0x20), "i"(ASI_BLK_INIT_QUAD_LDD_P))

And insert it into __init_single_page() instead of memset()

The final result is 4.01s/T which is even faster compared to current
4.97s/T

Ok, indeed, that would work.

On ppc64, that might not. We have a dcbz instruction that clears an
entire cache line at once. That's what we use for memset's and page
clearing. However, 64 bytes is half a cache line on modern processors
so we can't use it with that semantic and would have to fallback to the
slower stores.

Cheers,
Ben.

`h`	back out one level
`j`	next message in thread
`k`	previous message in thread
`l`	drill in
`Esc`	close help / fold thread tree
`?`	toggle this help