[PATCH v3 13/28] arm64/sve: Signal handling support

[PATCH v3 00/28] ARM Scalable Vector Extension (SVE) · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 01/28] regset: Add support for dynamically sized regsets · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
Re: [PATCH v3 01/28] regset: Add support for dynamically sized regsets · Catalin Marinas <catalin.marinas@arm.com> · 2017-10-11
Re: [PATCH v3 01/28] regset: Add support for dynamically sized regsets · Dave Martin <Dave.Martin@arm.com> · 2017-10-11
[PATCH v3 02/28] arm64: KVM: Hide unsupported AArch64 CPU features from guests · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 02/28] arm64: KVM: Hide unsupported AArch64 CPU features from guests · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-11
[PATCH v3 02/28] arm64: KVM: Hide unsupported AArch64 CPU features from guests · Marc Zyngier <hidden> · 2017-10-11
[PATCH v3 02/28] arm64: KVM: Hide unsupported AArch64 CPU features from guests · Christoffer Dall <hidden> · 2017-10-17
[PATCH v3 02/28] arm64: KVM: Hide unsupported AArch64 CPU features from guests · Marc Zyngier <hidden> · 2017-10-17
[PATCH v3 02/28] arm64: KVM: Hide unsupported AArch64 CPU features from guests · Christoffer Dall <hidden> · 2017-10-18
[PATCH v3 02/28] arm64: KVM: Hide unsupported AArch64 CPU features from guests · Dave.Martin@arm.com (Dave Martin) · 2017-10-18
[PATCH v3 02/28] arm64: KVM: Hide unsupported AArch64 CPU features from guests · Christoffer Dall <hidden> · 2017-10-18
[PATCH v3 03/28] arm64: efi: Add missing Kconfig dependency on KERNEL_MODE_NEON · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 03/28] arm64: efi: Add missing Kconfig dependency on KERNEL_MODE_NEON · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-11
[PATCH v3 03/28] arm64: efi: Add missing Kconfig dependency on KERNEL_MODE_NEON · Dave.Martin@arm.com (Dave Martin) · 2017-10-11
[PATCH v3 04/28] arm64: Port deprecated instruction emulation to new sysctl interface · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 04/28] arm64: Port deprecated instruction emulation to new sysctl interface · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-11
[PATCH v3 05/28] arm64: fpsimd: Simplify uses of {set, clear}_ti_thread_flag() · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 05/28] arm64: fpsimd: Simplify uses of {set, clear}_ti_thread_flag() · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-11
[PATCH v3 06/28] arm64/sve: System register and exception syndrome definitions · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 06/28] arm64/sve: System register and exception syndrome definitions · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-11
[PATCH v3 07/28] arm64/sve: Low-level SVE architectural state manipulation functions · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 07/28] arm64/sve: Low-level SVE architectural state manipulation functions · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-11
[PATCH v3 07/28] arm64/sve: Low-level SVE architectural state manipulation functions · Dave.Martin@arm.com (Dave Martin) · 2017-10-11
[PATCH v3 08/28] arm64/sve: Kconfig update and conditional compilation support · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 08/28] arm64/sve: Kconfig update and conditional compilation support · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-11
[PATCH v3 09/28] arm64/sve: Signal frame and context structure definition · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 09/28] arm64/sve: Signal frame and context structure definition · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-11
[PATCH v3 10/28] arm64/sve: Low-level CPU setup · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 10/28] arm64/sve: Low-level CPU setup · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-11
[PATCH v3 11/28] arm64/sve: Core task context handling · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 11/28] arm64/sve: Core task context handling · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-11
[PATCH v3 11/28] arm64/sve: Core task context handling · Dave.Martin@arm.com (Dave Martin) · 2017-10-12
[PATCH v3 11/28] arm64/sve: Core task context handling · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-13
[PATCH v3 11/28] arm64/sve: Core task context handling · Dave.Martin@arm.com (Dave Martin) · 2017-10-13
[PATCH v3 12/28] arm64/sve: Support vector length resetting for new processes · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 12/28] arm64/sve: Support vector length resetting for new processes · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-11
[PATCH v3 13/28] arm64/sve: Signal handling support · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 13/28] arm64/sve: Signal handling support · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-11
[PATCH v3 13/28] arm64/sve: Signal handling support · Dave.Martin@arm.com (Dave Martin) · 2017-10-12
[PATCH v3 13/28] arm64/sve: Signal handling support · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-13
[PATCH v3 13/28] arm64/sve: Signal handling support · Dave.Martin@arm.com (Dave Martin) · 2017-10-13
[PATCH v3 14/28] arm64/sve: Backend logic for setting the vector length · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 14/28] arm64/sve: Backend logic for setting the vector length · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-11
[PATCH v3 15/28] arm64: cpufeature: Move sys_caps_initialised declarations · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 15/28] arm64: cpufeature: Move sys_caps_initialised declarations · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-11
[PATCH v3 16/28] arm64/sve: Probe SVE capabilities and usable vector lengths · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 16/28] arm64/sve: Probe SVE capabilities and usable vector lengths · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-11
[PATCH v3 16/28] arm64/sve: Probe SVE capabilities and usable vector lengths · Suzuki.Poulose@arm.com (Suzuki K Poulose) · 2017-10-12
[PATCH v3 16/28] arm64/sve: Probe SVE capabilities and usable vector lengths · Dave.Martin@arm.com (Dave Martin) · 2017-10-16
[PATCH v3 16/28] arm64/sve: Probe SVE capabilities and usable vector lengths · Suzuki.Poulose@arm.com (Suzuki K Poulose) · 2017-10-16
[PATCH v3 16/28] arm64/sve: Probe SVE capabilities and usable vector lengths · Dave.Martin@arm.com (Dave Martin) · 2017-10-16
[PATCH v3 16/28] arm64/sve: Probe SVE capabilities and usable vector lengths · Suzuki.Poulose@arm.com (Suzuki K Poulose) · 2017-10-16
[PATCH v3 16/28] arm64/sve: Probe SVE capabilities and usable vector lengths · Dave.Martin@arm.com (Dave Martin) · 2017-10-16
[PATCH v3 16/28] arm64/sve: Probe SVE capabilities and usable vector lengths · Suzuki.Poulose@arm.com (Suzuki K Poulose) · 2017-10-16
[PATCH v3 17/28] arm64/sve: Preserve SVE registers around kernel-mode NEON use · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 17/28] arm64/sve: Preserve SVE registers around kernel-mode NEON use · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-12
[PATCH v3 18/28] arm64/sve: Preserve SVE registers around EFI runtime service calls · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 18/28] arm64/sve: Preserve SVE registers around EFI runtime service calls · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-12
[PATCH v3 19/28] arm64/sve: ptrace and ELF coredump support · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 19/28] arm64/sve: ptrace and ELF coredump support · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-12
[PATCH v3 19/28] arm64/sve: ptrace and ELF coredump support · Dave.Martin@arm.com (Dave Martin) · 2017-10-13
[PATCH v3 19/28] arm64/sve: ptrace and ELF coredump support · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-18
[PATCH v3 19/28] arm64/sve: ptrace and ELF coredump support · Dave.Martin@arm.com (Dave Martin) · 2017-10-18
[PATCH v3 20/28] arm64/sve: Add prctl controls for userspace vector length management · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 20/28] arm64/sve: Add prctl controls for userspace vector length management · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-12
[PATCH v3 21/28] arm64/sve: Add sysctl to set the default vector length for new processes · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 21/28] arm64/sve: Add sysctl to set the default vector length for new processes · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-12
[PATCH v3 22/28] arm64/sve: KVM: Prevent guests from using SVE · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 22/28] arm64/sve: KVM: Prevent guests from using SVE · Marc Zyngier <hidden> · 2017-10-11
[PATCH v3 22/28] arm64/sve: KVM: Prevent guests from using SVE · Dave.Martin@arm.com (Dave Martin) · 2017-10-12
[PATCH v3 22/28] arm64/sve: KVM: Prevent guests from using SVE · Marc Zyngier <hidden> · 2017-10-12
[PATCH v3 22/28] arm64/sve: KVM: Prevent guests from using SVE · Dave.Martin@arm.com (Dave Martin) · 2017-10-13
[PATCH v3 22/28] arm64/sve: KVM: Prevent guests from using SVE · Marc Zyngier <hidden> · 2017-10-13
[PATCH v3 22/28] arm64/sve: KVM: Prevent guests from using SVE · Dave.Martin@arm.com (Dave Martin) · 2017-10-13
[PATCH v3 22/28] arm64/sve: KVM: Prevent guests from using SVE · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-12
[PATCH v3 22/28] arm64/sve: KVM: Prevent guests from using SVE · Christoffer Dall <hidden> · 2017-10-17
[PATCH v3 22/28] arm64/sve: KVM: Prevent guests from using SVE · Dave.Martin@arm.com (Dave Martin) · 2017-10-17
[PATCH v3 22/28] arm64/sve: KVM: Prevent guests from using SVE · Christoffer Dall <hidden> · 2017-10-18
[PATCH v3 22/28] arm64/sve: KVM: Prevent guests from using SVE · Dave.Martin@arm.com (Dave Martin) · 2017-10-18
[PATCH v3 22/28] arm64/sve: KVM: Prevent guests from using SVE · Christoffer Dall <hidden> · 2017-10-18
[PATCH v3 23/28] arm64/sve: KVM: Treat guest SVE use as undefined instruction execution · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 23/28] arm64/sve: KVM: Treat guest SVE use as undefined instruction execution · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-12
[PATCH v3 23/28] arm64/sve: KVM: Treat guest SVE use as undefined instruction execution · Christoffer Dall <hidden> · 2017-10-17
[PATCH v3 24/28] arm64/sve: KVM: Hide SVE from CPU features exposed to guests · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 24/28] arm64/sve: KVM: Hide SVE from CPU features exposed to guests · Marc Zyngier <hidden> · 2017-10-11
[PATCH v3 24/28] arm64/sve: KVM: Hide SVE from CPU features exposed to guests · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-12
[PATCH v3 24/28] arm64/sve: KVM: Hide SVE from CPU features exposed to guests · Christoffer Dall <hidden> · 2017-10-17
[PATCH v3 24/28] arm64/sve: KVM: Hide SVE from CPU features exposed to guests · Dave.Martin@arm.com (Dave Martin) · 2017-10-17
[PATCH v3 24/28] arm64/sve: KVM: Hide SVE from CPU features exposed to guests · Marc Zyngier <hidden> · 2017-10-17
[PATCH v3 24/28] arm64/sve: KVM: Hide SVE from CPU features exposed to guests · Dave.Martin@arm.com (Dave Martin) · 2017-10-17
[PATCH v3 24/28] arm64/sve: KVM: Hide SVE from CPU features exposed to guests · Christoffer Dall <hidden> · 2017-10-18
[PATCH v3 24/28] arm64/sve: KVM: Hide SVE from CPU features exposed to guests · Dave.Martin@arm.com (Dave Martin) · 2017-10-18
[PATCH v3 24/28] arm64/sve: KVM: Hide SVE from CPU features exposed to guests · Christoffer Dall <hidden> · 2017-10-18
[PATCH v3 25/28] arm64/sve: Detect SVE and activate runtime support · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 25/28] arm64/sve: Detect SVE and activate runtime support · Suzuki.Poulose@arm.com (Suzuki K Poulose) · 2017-10-11
[PATCH v3 25/28] arm64/sve: Detect SVE and activate runtime support · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-12
[PATCH v3 26/28] arm64/sve: Add documentation · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[PATCH v3 26/28] arm64/sve: Add documentation · Szabolcs Nagy <hidden> · 2017-10-11
[PATCH v3 26/28] arm64/sve: Add documentation · Dave.Martin@arm.com (Dave Martin) · 2017-10-11
[PATCH v3 26/28] arm64/sve: Add documentation · Szabolcs Nagy <hidden> · 2017-10-11
[PATCH v3 26/28] arm64/sve: Add documentation · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-13
[PATCH v3 26/28] arm64/sve: Add documentation · Dave.Martin@arm.com (Dave Martin) · 2017-10-13
[PATCH v3 26/28] arm64/sve: Add documentation · catalin.marinas@arm.com (Catalin Marinas) · 2017-10-18
[PATCH v3 26/28] arm64/sve: Add documentation · Dave.Martin@arm.com (Dave Martin) · 2017-10-13
[RFC PATCH v3 27/28] arm64: signal: Report signal frame size to userspace via auxv · Dave.Martin@arm.com (Dave Martin) · 2017-10-10
[RFC PATCH v3 27/28] arm64: signal: Report signal frame size to userspace via auxv · Szabolcs Nagy <hidden> · 2017-10-11
[RFC PATCH v3 27/28] arm64: signal: Report signal frame size to userspace via auxv · Dave.Martin@arm.com (Dave P Martin) · 2017-10-11
[RFC PATCH v3 28/28] arm64/sve: signal: Include SVE when computing AT_MINSIGSTKSZ · Dave.Martin@arm.com (Dave Martin) · 2017-10-10

STALE3172d

From: catalin.marinas@arm.com (Catalin Marinas)
Date: 2017-10-13 11:17:19
Also in: kvmarm, linux-arch

On Thu, Oct 12, 2017 at 05:11:57PM +0100, Dave P Martin wrote:

On Wed, Oct 11, 2017 at 05:40:52PM +0100, Catalin Marinas wrote:

quoted

On Tue, Oct 10, 2017 at 07:38:30PM +0100, Dave P Martin wrote:

quoted

diff --git a/arch/arm64/kernel/fpsimd.c b/arch/arm64/kernel/fpsimd.c
index aabeaee..fa4ed34 100644
--- a/arch/arm64/kernel/fpsimd.c
+++ b/arch/arm64/kernel/fpsimd.c

@@ -310,6 +310,32 @@ static void fpsimd_to_sve(struct task_struct *task)
 		       sizeof(fst->vregs[i]));
 }
 
+/*
+ * Transfer the SVE state in task->thread.sve_state to
+ * task->thread.fpsimd_state.
+ *
+ * Task can be a non-runnable task, or current.  In the latter case,
+ * softirqs (and preemption) must be disabled.
+ * task->thread.sve_state must point to at least sve_state_size(task)
+ * bytes of allocated kernel memory.
+ * task->thread.sve_state must be up to date before calling this function.
+ */
+static void sve_to_fpsimd(struct task_struct *task)
+{
+	unsigned int vq;
+	void const *sst = task->thread.sve_state;
+	struct fpsimd_state *fst = &task->thread.fpsimd_state;
+	unsigned int i;
+
+	if (!system_supports_sve())
+		return;
+
+	vq = sve_vq_from_vl(task->thread.sve_vl);
+	for (i = 0; i < 32; ++i)
+		memcpy(&fst->vregs[i], ZREG(sst, vq, i),
+		       sizeof(fst->vregs[i]));
+}

Nit: could we actually just do an assignment with some pointer casting?
It looks like we invoke memcpy for every 16 bytes (same for
fpsimd_to_sve).

I was uneasy about what the type of ZREG(sst, vq, i) ought to be.
In any case, memest() is magic: my oldskool GCC (5.3.0) generates:

ffff000008084c70 <sve_to_fpsimd>:
ffff000008084c70:       14000004        b       ffff000008084c80 <sve_to_fpsimd+0x10>
ffff000008084c74:       d503201f        nop
ffff000008084c78:       d65f03c0        ret
ffff000008084c7c:       d503201f        nop
ffff000008084c80:       f0007d61        adrp    x1, ffff000009033000 <reset_devices>
ffff000008084c84:       f942a021        ldr     x1, [x1,#1344]
ffff000008084c88:       36b001c1        tbz     w1, #22, ffff000008084cc0 <sve_to_fpsimd+0x50>
ffff000008084c8c:       b94ca805        ldr     w5, [x0,#3240]
ffff000008084c90:       912a0001        add     x1, x0, #0xa80
ffff000008084c94:       91320004        add     x4, x0, #0xc80
ffff000008084c98:       f9465006        ldr     x6, [x0,#3232]
ffff000008084c9c:       121c6ca5        and     w5, w5, #0xfffffff0
ffff000008084ca0:       52800000        mov     w0, #0x0                        // #0
ffff000008084ca4:       8b2040c2        add     x2, x6, w0, uxtw
ffff000008084ca8:       0b050000        add     w0, w0, w5
ffff000008084cac:       a9400c42        ldp     x2, x3, [x2]
ffff000008084cb0:       a8810c22        stp     x2, x3, [x1],#16
ffff000008084cb4:       eb01009f        cmp     x4, x1
ffff000008084cb8:       54ffff61        b.ne    ffff000008084ca4 <sve_to_fpsimd+0x34>
ffff000008084cbc:       d65f03c0        ret
ffff000008084cc0:       d65f03c0        ret
ffff000008084cc4:       d503201f        nop


Without volatile, I think assigning a single object and doing a memcpy()
are equivalent to the compiler: which it actually uses depends solely on
optimisation considerations.

(But then I'm not a language lawyer ... not a professional one anyway).

Are you concerned compilers may mess this up?

That's fine, please ignore my comment then. I was worried that gcc would
always generate a call to the memcpy implementation rather than inlining
it.

-- 
Catalin

`h`	back out one level
`j`	next message in thread
`k`	previous message in thread
`l`	drill in
`Esc`	close help / fold thread tree
`?`	toggle this help