Re: [PATCH v2 28/33] nsfs: support file handles

[PATCH v2 00/33] ns: support file handles · Christian Brauner <brauner@kernel.org> · 2025-09-12
[PATCH v2 01/33] pidfs: validate extensible ioctls · Christian Brauner <brauner@kernel.org> · 2025-09-12
[PATCH v2 02/33] nsfs: drop tautological ioctl() check · Christian Brauner <brauner@kernel.org> · 2025-09-12
[PATCH v2 03/33] nsfs: validate extensible ioctls · Christian Brauner <brauner@kernel.org> · 2025-09-12
[PATCH v2 04/33] block: use extensible_ioctl_valid() · Christian Brauner <brauner@kernel.org> · 2025-09-12
Re: [PATCH v2 04/33] block: use extensible_ioctl_valid() · Mark Brown <broonie@kernel.org> · 2025-09-16
Re: [PATCH v2 04/33] block: use extensible_ioctl_valid() · Dan Carpenter <hidden> · 2025-09-16
Re: [PATCH v2 04/33] block: use extensible_ioctl_valid() · Jan Kara <jack@suse.cz> · 2025-09-18
Re: [PATCH v2 04/33] block: use extensible_ioctl_valid() · Christian Brauner <brauner@kernel.org> · 2025-09-19
[PATCH v2 05/33] ns: move to_ns_common() to ns_common.h · Christian Brauner <brauner@kernel.org> · 2025-09-12
[PATCH v2 06/33] nsfs: add nsfs.h header · Christian Brauner <brauner@kernel.org> · 2025-09-12
[PATCH v2 07/33] ns: uniformly initialize ns_common · Christian Brauner <brauner@kernel.org> · 2025-09-12
[PATCH v2 08/33] cgroup: use ns_common_init() · Christian Brauner <brauner@kernel.org> · 2025-09-12
Re: [PATCH v2 08/33] cgroup: use ns_common_init() · Tejun Heo <tj@kernel.org> · 2025-09-12
[PATCH v2 09/33] ipc: use ns_common_init() · Christian Brauner <brauner@kernel.org> · 2025-09-12
[PATCH v2 10/33] mnt: use ns_common_init() · Christian Brauner <brauner@kernel.org> · 2025-09-12
[PATCH v2 11/33] net: use ns_common_init() · Christian Brauner <brauner@kernel.org> · 2025-09-12
Re: [PATCH v2 11/33] net: use ns_common_init() · Jan Kara <jack@suse.cz> · 2025-09-15
Re: [PATCH v2 11/33] net: use ns_common_init() · Christian Brauner <brauner@kernel.org> · 2025-09-15
Re: [PATCH v2 11/33] net: use ns_common_init() · Jan Kara <jack@suse.cz> · 2025-09-15
Re: [PATCH v2 11/33] net: use ns_common_init() · Al Viro <viro@zeniv.linux.org.uk> · 2025-09-15
[PATCH v2 12/33] pid: use ns_common_init() · Christian Brauner <brauner@kernel.org> · 2025-09-12
[PATCH v2 13/33] time: use ns_common_init() · Christian Brauner <brauner@kernel.org> · 2025-09-12
[PATCH v2 14/33] user: use ns_common_init() · Christian Brauner <brauner@kernel.org> · 2025-09-12
[PATCH v2 15/33] uts: use ns_common_init() · Christian Brauner <brauner@kernel.org> · 2025-09-12
[PATCH v2 16/33] ns: remove ns_alloc_inum() · Christian Brauner <brauner@kernel.org> · 2025-09-12
[PATCH v2 17/33] nstree: make iterator generic · Christian Brauner <brauner@kernel.org> · 2025-09-12
Re: [PATCH v2 17/33] nstree: make iterator generic · Jan Kara <jack@suse.cz> · 2025-09-15
[PATCH v2 18/33] mnt: support ns lookup · Christian Brauner <brauner@kernel.org> · 2025-09-12
Re: [PATCH v2 18/33] mnt: support ns lookup · Jan Kara <jack@suse.cz> · 2025-09-15
Re: [PATCH v2 18/33] mnt: support ns lookup · Christian Brauner <brauner@kernel.org> · 2025-09-15
Re: [PATCH v2 18/33] mnt: support ns lookup · Kuniyuki Iwashima <kuniyu@google.com> · 2025-09-16
Re: [PATCH v2 18/33] mnt: support ns lookup · Al Viro <viro@zeniv.linux.org.uk> · 2025-09-16
Re: [PATCH v2 18/33] mnt: support ns lookup · Al Viro <viro@zeniv.linux.org.uk> · 2025-09-16
Re: [PATCH v2 18/33] mnt: support ns lookup · Al Viro <viro@zeniv.linux.org.uk> · 2025-09-16
Re: [PATCH v2 18/33] mnt: support ns lookup · Al Viro <viro@zeniv.linux.org.uk> · 2025-09-16
Re: [PATCH v2 18/33] mnt: support ns lookup · Christian Brauner <brauner@kernel.org> · 2025-09-17
Re: [PATCH v2 18/33] mnt: support ns lookup · Al Viro <viro@zeniv.linux.org.uk> · 2025-09-18
[PATCH v2 19/33] cgroup: support ns lookup · Christian Brauner <brauner@kernel.org> · 2025-09-12
Re: [PATCH v2 19/33] cgroup: support ns lookup · Jan Kara <jack@suse.cz> · 2025-09-15
[PATCH v2 20/33] ipc: support ns lookup · Christian Brauner <brauner@kernel.org> · 2025-09-12
Re: [PATCH v2 20/33] ipc: support ns lookup · Jan Kara <jack@suse.cz> · 2025-09-15
[PATCH v2 21/33] net: support ns lookup · Christian Brauner <brauner@kernel.org> · 2025-09-12
Re: [PATCH v2 21/33] net: support ns lookup · Jan Kara <jack@suse.cz> · 2025-09-15
Re: [PATCH v2 21/33] net: support ns lookup · Christian Brauner <brauner@kernel.org> · 2025-09-15
Re: [PATCH v2 21/33] net: support ns lookup · Kuniyuki Iwashima <kuniyu@google.com> · 2025-09-16
[PATCH v2 22/33] pid: support ns lookup · Christian Brauner <brauner@kernel.org> · 2025-09-12
Re: [PATCH v2 22/33] pid: support ns lookup · Jan Kara <jack@suse.cz> · 2025-09-15
[PATCH v2 23/33] time: support ns lookup · Christian Brauner <brauner@kernel.org> · 2025-09-12
Re: [PATCH v2 23/33] time: support ns lookup · Jan Kara <jack@suse.cz> · 2025-09-15
[PATCH v2 24/33] user: support ns lookup · Christian Brauner <brauner@kernel.org> · 2025-09-12
Re: [PATCH v2 24/33] user: support ns lookup · Jan Kara <jack@suse.cz> · 2025-09-15
Re: [PATCH v2 24/33] user: support ns lookup · Christian Brauner <brauner@kernel.org> · 2025-09-15
Re: [PATCH v2 24/33] user: support ns lookup · Jan Kara <jack@suse.cz> · 2025-09-15
[PATCH v2 25/33] uts: support ns lookup · Christian Brauner <brauner@kernel.org> · 2025-09-12
Re: [PATCH v2 25/33] uts: support ns lookup · Jan Kara <jack@suse.cz> · 2025-09-15
[PATCH v2 26/33] ns: add to_<type>_ns() to respective headers · Christian Brauner <brauner@kernel.org> · 2025-09-12
Re: [PATCH v2 26/33] ns: add to_<type>_ns() to respective headers · Jan Kara <jack@suse.cz> · 2025-09-15
[PATCH v2 27/33] nsfs: add current_in_namespace() · Christian Brauner <brauner@kernel.org> · 2025-09-12
Re: [PATCH v2 27/33] nsfs: add current_in_namespace() · Jan Kara <jack@suse.cz> · 2025-09-15
[PATCH v2 28/33] nsfs: support file handles · Christian Brauner <brauner@kernel.org> · 2025-09-12
Re: [PATCH v2 28/33] nsfs: support file handles · Jan Kara <jack@suse.cz> · 2025-09-15
Re: [PATCH v2 28/33] nsfs: support file handles · Christian Brauner <brauner@kernel.org> · 2025-09-15
[PATCH v2 29/33] nsfs: support exhaustive file handles · Christian Brauner <brauner@kernel.org> · 2025-09-12
Re: [PATCH v2 29/33] nsfs: support exhaustive file handles · Jan Kara <jack@suse.cz> · 2025-09-15
[PATCH v2 30/33] nsfs: add missing id retrieval support · Christian Brauner <brauner@kernel.org> · 2025-09-12
Re: [PATCH v2 30/33] nsfs: add missing id retrieval support · Jan Kara <jack@suse.cz> · 2025-09-15
[PATCH v2 31/33] tools: update nsfs.h uapi header · Christian Brauner <brauner@kernel.org> · 2025-09-12
[PATCH v2 32/33] selftests/namespaces: add identifier selftests · Christian Brauner <brauner@kernel.org> · 2025-09-12
[PATCH v2 33/33] selftests/namespaces: add file handle selftests · Christian Brauner <brauner@kernel.org> · 2025-09-12
Re: [PATCH v2 00/33] ns: support file handles · Al Viro <viro@zeniv.linux.org.uk> · 2025-09-16

From: Christian Brauner <brauner@kernel.org>
Date: 2025-09-15 13:55:13
Also in: cgroups, linux-block, linux-fsdevel, linux-kselftest, linux-nfs, lkml

On Mon, Sep 15, 2025 at 03:25:20PM +0200, Jan Kara wrote:

On Fri 12-09-25 13:52:51, Christian Brauner wrote:

quoted

A while ago we added support for file handles to pidfs so pidfds can be
encoded and decoded as file handles. Userspace has adopted this quickly
and it's proven very useful. Implement file handles for namespaces as
well.

A process is not always able to open /proc/self/ns/. That requires
procfs to be mounted and for /proc/self/ or /proc/self/ns/ to not be
overmounted. However, userspace can always derive a namespace fd from
a pidfd. And that always works for a task's own namespace.

There's no need to introduce unnecessary behavioral differences between
/proc/self/ns/ fds, pidfd-derived namespace fds, and file-handle-derived
namespace fds. So namespace file handles are always decodable if the
caller is located in the namespace the file handle refers to.

This also allows a task to e.g., store a set of file handles to its
namespaces in a file on-disk so it can verify when it gets rexeced that
they're still valid and so on. This is akin to the pidfd use-case.

Or just plainly for namespace comparison reasons where a file handle to
the task's own namespace can be easily compared against others.

Reviewed-by: Amir Goldstein <amir73il@gmail.com>
Signed-off-by: Christian Brauner <brauner@kernel.org>

...

quoted

+	switch (ns->ops->type) {
+#ifdef CONFIG_CGROUPS
+	case CLONE_NEWCGROUP:
+		if (!current_in_namespace(to_cg_ns(ns)))
+			owning_ns = to_cg_ns(ns)->user_ns;
+		break;
+#endif
+#ifdef CONFIG_IPC_NS
+	case CLONE_NEWIPC:
+		if (!current_in_namespace(to_ipc_ns(ns)))
+			owning_ns = to_ipc_ns(ns)->user_ns;
+		break;
+#endif
+	case CLONE_NEWNS:
+		if (!current_in_namespace(to_mnt_ns(ns)))
+			owning_ns = to_mnt_ns(ns)->user_ns;
+		break;
+#ifdef CONFIG_NET_NS
+	case CLONE_NEWNET:
+		if (!current_in_namespace(to_net_ns(ns)))
+			owning_ns = to_net_ns(ns)->user_ns;
+		break;
+#endif
+#ifdef CONFIG_PID_NS
+	case CLONE_NEWPID:
+		if (!current_in_namespace(to_pid_ns(ns))) {
+			owning_ns = to_pid_ns(ns)->user_ns;
+		} else if (!READ_ONCE(to_pid_ns(ns)->child_reaper)) {
+			ns->ops->put(ns);
+			return ERR_PTR(-EPERM);
+		}
+		break;
+#endif
+#ifdef CONFIG_TIME_NS
+	case CLONE_NEWTIME:
+		if (!current_in_namespace(to_time_ns(ns)))
+			owning_ns = to_time_ns(ns)->user_ns;
+		break;
+#endif
+#ifdef CONFIG_USER_NS
+	case CLONE_NEWUSER:
+		if (!current_in_namespace(to_user_ns(ns)))
+			owning_ns = to_user_ns(ns);
+		break;
+#endif
+#ifdef CONFIG_UTS_NS
+	case CLONE_NEWUTS:
+		if (!current_in_namespace(to_uts_ns(ns)))
+			owning_ns = to_uts_ns(ns)->user_ns;
+		break;
+#endif

Frankly, switches like these are asking for more Generic usage ;) But ok
for now.

quoted

+	default:
+		return ERR_PTR(-EOPNOTSUPP);
+	}
+
+	if (owning_ns && !ns_capable(owning_ns, CAP_SYS_ADMIN)) {
+		ns->ops->put(ns);
+		return ERR_PTR(-EPERM);
+	}
+
+	/* path_from_stashed() unconditionally consumes the reference. */
+	ret = path_from_stashed(&ns->stashed, nsfs_mnt, ns, &path);
+	if (ret)
+		return ERR_PTR(ret);
+
+	return no_free_ptr(path.dentry);

Ugh, so IMO this is very subtle because we declare

	struct path path __free(path_put)

but then do no_free_ptr(path.dentry). I really had to lookup implementation
of no_free_ptr() to check whether we are leaking mnt reference here or not
(we are not). But that seems as an implementation detail we shouldn't
better rely on? Wouldn't be:

	return dget(path.dentry);

much clearer (and sligthly less efficient, I know, but who cares)?

Fine by me as well!

`h`	back out one level
`j`	next message in thread
`k`	previous message in thread
`l`	drill in
`Esc`	close help / fold thread tree
`?`	toggle this help