Re: [RFC PATCH v11 for 4.15 01/24] Restartable sequences system call

[RFC PATCH for 4.15 00/24] Restartable sequences and CPU op vector v11 · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
[RFC PATCH for 4.15 02/24] Restartable sequences: ARM 32 architecture support · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
[RFC PATCH for 4.15 06/24] Restartable sequences: powerpc architecture support · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
[RFC PATCH for 4.15 03/24] Restartable sequences: wire up ARM 32 system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
[RFC PATCH for 4.15 23/24] membarrier: selftest: Test private expedited sync core cmd · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
Re: [RFC PATCH for 4.15 23/24] membarrier: selftest: Test private expedited sync core cmd · Shuah Khan <hidden> · 2017-11-17
Re: [RFC PATCH for 4.15 23/24] membarrier: selftest: Test private expedited sync core cmd · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-17
[RFC PATCH v2 for 4.15 21/24] x86: Introduce sync_core_before_usermode · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
[RFC PATCH for 4.15 18/24] membarrier: provide SHARED_EXPEDITED command · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
Re: [RFC PATCH for 4.15 18/24] membarrier: provide SHARED_EXPEDITED command · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-15
[RFC PATCH for 4.15 19/24] membarrier: selftest: Test shared expedited cmd · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
Re: [RFC PATCH for 4.15 19/24] membarrier: selftest: Test shared expedited cmd · Shuah Khan <hidden> · 2017-11-17
[RFC PATCH for 4.15 20/24] membarrier: Provide core serializing command · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
[RFC PATCH v7 for 4.15 16/24] membarrier: powerpc: Skip memory barrier in switch_mm() · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
[RFC PATCH v5 for 4.15 17/24] membarrier: Document scheduler barrier requirements · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
[RFC PATCH v2 for 4.15 22/24] membarrier: x86: Provide core serializing command · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
[RFC PATCH v2 for 4.15 13/24] Restartable sequences: Provide self-tests · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
[RFC PATCH v2 for 4.15 15/24] membarrier: selftest: Test private expedited cmd · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
[RFC PATCH v2 for 4.15 12/24] cpu_opv: Implement selftests · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
[RFC PATCH for 4.15 14/24] Restartable sequences selftests: arm: workaround gcc asm size guess · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
[RFC PATCH for 4.15 24/24] membarrier: arm64: Provide core serializing command · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
[RFC PATCH for 4.15 09/24] cpu_opv: Wire up x86 32/64 system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
[RFC PATCH for 4.15 11/24] cpu_opv: Wire up ARM32 system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
[RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-15
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Michael Kerrisk (man-pages) <hidden> · 2017-11-15
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-15
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Thomas Gleixner <hidden> · 2017-11-16
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Andi Kleen <hidden> · 2017-11-17
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Thomas Gleixner <hidden> · 2017-11-17
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-17
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Andi Kleen <hidden> · 2017-11-17
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Thomas Gleixner <hidden> · 2017-11-17
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Andi Kleen <hidden> · 2017-11-17
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Thomas Gleixner <hidden> · 2017-11-17
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Andy Lutomirski <luto@amacapital.net> · 2017-11-18
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Thomas Gleixner <hidden> · 2017-11-17
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-20
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-20
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Thomas Gleixner <hidden> · 2017-11-20
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Thomas Gleixner <hidden> · 2017-11-20
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-20
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-20
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Andi Kleen <hidden> · 2017-11-20
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-20
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Thomas Gleixner <hidden> · 2017-11-20
Re: [RFC PATCH v3 for 4.15 08/24] Provide cpu_opv system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-21
[RFC PATCH for 4.15 10/24] cpu_opv: Wire up powerpc system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
[RFC PATCH for 4.15 07/24] Restartable sequences: Wire up powerpc system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
[RFC PATCH for 4.15 04/24] Restartable sequences: x86 32/64 architecture support · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
Re: [RFC PATCH for 4.15 04/24] Restartable sequences: x86 32/64 architecture support · Thomas Gleixner <hidden> · 2017-11-16
Re: [RFC PATCH for 4.15 04/24] Restartable sequences: x86 32/64 architecture support · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-19
Re: [RFC PATCH for 4.15 04/24] Restartable sequences: x86 32/64 architecture support · Thomas Gleixner <hidden> · 2017-11-20
[RFC PATCH for 4.15 05/24] Restartable sequences: wire up x86 32/64 system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
[RFC PATCH v11 for 4.15 01/24] Restartable sequences system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
Re: [RFC PATCH v11 for 4.15 01/24] Restartable sequences system call · Ben Maurer <hidden> · 2017-11-14
Re: [RFC PATCH v11 for 4.15 01/24] Restartable sequences system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
Re: [RFC PATCH v11 for 4.15 01/24] Restartable sequences system call · Ben Maurer <hidden> · 2017-11-14
Re: [RFC PATCH v11 for 4.15 01/24] Restartable sequences system call · Peter Zijlstra <peterz@infradead.org> · 2017-11-16
Re: [RFC PATCH v11 for 4.15 01/24] Restartable sequences system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-16
Re: [RFC PATCH v11 for 4.15 01/24] Restartable sequences system call · Peter Zijlstra <peterz@infradead.org> · 2017-11-16
Re: [RFC PATCH v11 for 4.15 01/24] Restartable sequences system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-16
Re: [RFC PATCH v11 for 4.15 01/24] Restartable sequences system call · Peter Zijlstra <peterz@infradead.org> · 2017-11-16
Re: [RFC PATCH v11 for 4.15 01/24] Restartable sequences system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-16
Re: [RFC PATCH v11 for 4.15 01/24] Restartable sequences system call · Thomas Gleixner <hidden> · 2017-11-16
Re: [RFC PATCH v11 for 4.15 01/24] Restartable sequences system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-16
Re: [RFC PATCH v11 for 4.15 01/24] Restartable sequences system call · Peter Zijlstra <peterz@infradead.org> · 2017-11-16
Re: [RFC PATCH v11 for 4.15 01/24] Restartable sequences system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-16
Re: [RFC PATCH v11 for 4.15 01/24] Restartable sequences system call · Peter Zijlstra <peterz@infradead.org> · 2017-11-16
Re: [RFC PATCH v11 for 4.15 01/24] Restartable sequences system call · Thomas Gleixner <hidden> · 2017-11-16
Re: [RFC PATCH v11 for 4.15 01/24] Restartable sequences system call · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-19
Re: [RFC PATCH for 4.15 00/24] Restartable sequences and CPU op vector v11 · Linus Torvalds <torvalds@linux-foundation.org> · 2017-11-14
Re: [RFC PATCH for 4.15 00/24] Restartable sequences and CPU op vector v11 · Andy Lutomirski <luto@amacapital.net> · 2017-11-14
Re: [RFC PATCH for 4.15 00/24] Restartable sequences and CPU op vector v11 · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-14
Re: [RFC PATCH for 4.15 00/24] Restartable sequences and CPU op vector v11 · Andy Lutomirski <luto@amacapital.net> · 2017-11-15
Re: [RFC PATCH for 4.15 00/24] Restartable sequences and CPU op vector v11 · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2017-11-15
Re: [RFC PATCH for 4.15 00/24] Restartable sequences and CPU op vector v11 · Paul Turner <hidden> · 2017-11-14
Re: [RFC PATCH for 4.15 00/24] Restartable sequences and CPU op vector v11 · Mathieu Desnoyers <mathieu.desnoyers@efficios.com> · 2018-03-27

From: Peter Zijlstra <peterz@infradead.org>
Date: 2017-11-16 19:16:03
Also in: lkml

On Tue, Nov 14, 2017 at 03:03:51PM -0500, Mathieu Desnoyers wrote:

+static bool rseq_update_cpu_id(struct task_struct *t)
+{
+	uint32_t cpu_id = raw_smp_processor_id();
+
+	if (__put_user(cpu_id, &t->rseq->cpu_id_start))
+		return false;
+	if (__put_user(cpu_id, &t->rseq->cpu_id))
+		return false;

For LP64 this _could_ be a single 64bit store, right? It would save some
stac/clac noise on x86_64.

+	trace_rseq_update(t);
+	return true;
+}

+static bool rseq_get_rseq_cs(struct task_struct *t,

bool return value, but is used as a C int error value later (it works,
but is inconsistent).

+		void __user **start_ip,
+		unsigned long *post_commit_offset,
+		void __user **abort_ip,
+		uint32_t *cs_flags)

That's a fair amount of arguments, and I suppose that isn't a problem
because there's only the one callsite and it all gets inlined anyway.

+{
+	unsigned long ptr;
+	struct rseq_cs __user *urseq_cs;
+	struct rseq_cs rseq_cs;
+	u32 __user *usig;
+	u32 sig;
+
+	if (__get_user(ptr, &t->rseq->rseq_cs))
+		return false;
+	if (!ptr)
+		return true;
+	urseq_cs = (struct rseq_cs __user *)ptr;
+	if (copy_from_user(&rseq_cs, urseq_cs, sizeof(rseq_cs)))
+		return false;
+	/*
+	 * We need to clear rseq_cs upon entry into a signal handler
+	 * nested on top of a rseq assembly block, so the signal handler
+	 * will not be fixed up if itself interrupted by a nested signal
+	 * handler or preempted.  We also need to clear rseq_cs if we
+	 * preempt or deliver a signal on top of code outside of the
+	 * rseq assembly block, to ensure that a following preemption or
+	 * signal delivery will not try to perform a fixup needlessly.
+	 */
+	if (clear_user(&t->rseq->rseq_cs, sizeof(t->rseq->rseq_cs)))
+		return false;
+	if (rseq_cs.version > 0)
+		return false;

+	*cs_flags = rseq_cs.flags;
+	*start_ip = (void __user *)rseq_cs.start_ip;
+	*post_commit_offset = (unsigned long)rseq_cs.post_commit_offset;
+	*abort_ip = (void __user *)rseq_cs.abort_ip;

+	usig = (u32 __user *)(rseq_cs.abort_ip - sizeof(u32));
+	if (get_user(sig, usig))
+		return false;

+	if (current->rseq_sig != sig) {
+		printk_ratelimited(KERN_WARNING
+			"Possible attack attempt. Unexpected rseq signature 0x%x, expecting 0x%x (pid=%d, addr=%p).\n",
+			sig, current->rseq_sig, current->pid, usig);
+		return false;
+	}
+	return true;
+}
+
+static int rseq_need_restart(struct task_struct *t, uint32_t cs_flags)
+{
+	bool need_restart = false;
+	uint32_t flags;
+
+	/* Get thread flags. */
+	if (__get_user(flags, &t->rseq->flags))
+		return -EFAULT;
+
+	/* Take into account critical section flags. */
+	flags |= cs_flags;
+
+	/*
+	 * Restart on signal can only be inhibited when restart on
+	 * preempt and restart on migrate are inhibited too. Otherwise,
+	 * a preempted signal handler could fail to restart the prior
+	 * execution context on sigreturn.
+	 */
+	if (flags & RSEQ_CS_FLAG_NO_RESTART_ON_SIGNAL) {
+		if (!(flags & RSEQ_CS_FLAG_NO_RESTART_ON_MIGRATE))
+			return -EINVAL;
+		if (!(flags & RSEQ_CS_FLAG_NO_RESTART_ON_PREEMPT))
+			return -EINVAL;
+	}
+	if (t->rseq_migrate
+			&& !(flags & RSEQ_CS_FLAG_NO_RESTART_ON_MIGRATE))

That's a horrible code form, please put the && at the end of the
previous line and begin the next line aligned with the (, like:

	if (t->rseq_migrate &&
	    !(flags & RSEQ_CS_FLAG_NO_RESTART_ON_MIGRATE))

Luckily you've already killed this code, but try and remember for a next
time ;-)

+		need_restart = true;
+	else if (t->rseq_preempt
+			&& !(flags & RSEQ_CS_FLAG_NO_RESTART_ON_PREEMPT))
+		need_restart = true;
+	else if (t->rseq_signal
+			&& !(flags & RSEQ_CS_FLAG_NO_RESTART_ON_SIGNAL))
+		need_restart = true;
+
+	t->rseq_preempt = false;
+	t->rseq_signal = false;
+	t->rseq_migrate = false;
+	if (need_restart)
+		return 1;
+	return 0;
+}
+
+static int rseq_ip_fixup(struct pt_regs *regs)
+{
+	struct task_struct *t = current;
+	void __user *start_ip = NULL;
+	unsigned long post_commit_offset = 0;
+	void __user *abort_ip = NULL;
+	uint32_t cs_flags = 0;
+	int ret;

	unsigned long ip = instruction_pointer(regs);

+
+	ret = rseq_get_rseq_cs(t, &start_ip, &post_commit_offset, &abort_ip,
+			&cs_flags);

	trace_rseq_ip_fixup((void __user *)ip,

+		start_ip, post_commit_offset, abort_ip, ret);

Why trace here and not right before/after instruction_pointer_set()?

+	if (!ret)
+		return -EFAULT;
+
+	ret = rseq_need_restart(t, cs_flags);
+	if (ret < 0)
+		return -EFAULT;
+	if (!ret)
+		return 0;
+	/*
+	 * Handle potentially not being within a critical section.
+	 * Unsigned comparison will be true when
+	 * ip < start_ip (wrap-around to large values), and when
+	 * ip >= start_ip + post_commit_offset.
+	 */
+	if ((unsigned long)instruction_pointer(regs) - (unsigned long)start_ip
+			>= post_commit_offset)

	if ((unsigned long)(ip - start_ip) >= post_commit_offset)

+		return 1;
+
+	instruction_pointer_set(regs, (unsigned long)abort_ip);

Since you only ever use abort_ip as unsigned long, why propagate this
"void __user *" all the way from rseq_get_rseq_cs() ? Save yourself some
typing and casts :-)

+	return 1;
+}

`h`	back out one level
`j`	next message in thread
`k`	previous message in thread
`l`	drill in
`Esc`	close help / fold thread tree
`?`	toggle this help