Re:Re: [PATCH] bundle-uri: refresh packed_git if unbundle succeed

[PATCH] bundle-uri: refresh packed_git if unbundle succeed · blanet via GitGitGadget <hidden> · 2024-05-15
Re: [PATCH] bundle-uri: refresh packed_git if unbundle succeed · Patrick Steinhardt <hidden> · 2024-05-17
Re:Re: [PATCH] bundle-uri: refresh packed_git if unbundle succeed · Xing Xin <hidden> · 2024-05-20
Re: [PATCH] bundle-uri: refresh packed_git if unbundle succeed · Karthik Nayak <hidden> · 2024-05-17
Re:Re: [PATCH] bundle-uri: refresh packed_git if unbundle succeed · Xing Xin <hidden> · 2024-05-20
[PATCH v2] bundle-uri: verify oid before writing refs · blanet via GitGitGadget <hidden> · 2024-05-20
Re: [PATCH v2] bundle-uri: verify oid before writing refs · Karthik Nayak <hidden> · 2024-05-21
[PATCH v3 0/4] object checking related additions and fixes for bundles in fetches · blanet via GitGitGadget <hidden> · 2024-05-27
[PATCH v3 1/4] bundle-uri: verify oid before writing refs · Xing Xin via GitGitGadget <hidden> · 2024-05-27
Re: [PATCH v3 1/4] bundle-uri: verify oid before writing refs · Patrick Steinhardt <hidden> · 2024-05-28
Re:Re: [PATCH v3 1/4] bundle-uri: verify oid before writing refs · Xing Xin <hidden> · 2024-05-30
[PATCH v3 2/4] unbundle: introduce unbundle_fsck_flags for fsckobjects handling · Xing Xin via GitGitGadget <hidden> · 2024-05-27
Re: [PATCH v3 2/4] unbundle: introduce unbundle_fsck_flags for fsckobjects handling · Patrick Steinhardt <hidden> · 2024-05-28
Re:Re: [PATCH v3 2/4] unbundle: introduce unbundle_fsck_flags for fsckobjects handling · Xing Xin <hidden> · 2024-05-29
Re: Re: [PATCH v3 2/4] unbundle: introduce unbundle_fsck_flags for fsckobjects handling · Patrick Steinhardt <hidden> · 2024-05-30
Re:Re: Re: [PATCH v3 2/4] unbundle: introduce unbundle_fsck_flags for fsckobjects handling · Xing Xin <hidden> · 2024-05-30
[PATCH v3 3/4] fetch-pack: expose fsckObjects configuration logic · Xing Xin via GitGitGadget <hidden> · 2024-05-27
Re: [PATCH v3 3/4] fetch-pack: expose fsckObjects configuration logic · Patrick Steinhardt <hidden> · 2024-05-28
[PATCH v3 4/4] unbundle: introduce new option UNBUNDLE_FSCK_FOLLOW_FETCH · Xing Xin via GitGitGadget <hidden> · 2024-05-27
Re: [PATCH v3 4/4] unbundle: introduce new option UNBUNDLE_FSCK_FOLLOW_FETCH · Patrick Steinhardt <hidden> · 2024-05-28
Re:Re: [PATCH v3 4/4] unbundle: introduce new option UNBUNDLE_FSCK_FOLLOW_FETCH · Xing Xin <hidden> · 2024-05-30
[PATCH v4 0/4] object checking related additions and fixes for bundles in fetches · blanet via GitGitGadget <hidden> · 2024-05-30
[PATCH v4 1/4] bundle-uri: verify oid before writing refs · Xing Xin via GitGitGadget <hidden> · 2024-05-30
[PATCH v4 2/4] unbundle: extend verify_bundle_flags to support fsck-objects · Xing Xin via GitGitGadget <hidden> · 2024-05-30
Re: [PATCH v4 2/4] unbundle: extend verify_bundle_flags to support fsck-objects · Patrick Steinhardt <hidden> · 2024-06-06
Re:Re: [PATCH v4 2/4] unbundle: extend verify_bundle_flags to support fsck-objects · Xing Xin <hidden> · 2024-06-11
[PATCH v4 3/4] fetch-pack: expose fsckObjects configuration logic · Xing Xin via GitGitGadget <hidden> · 2024-05-30
[PATCH v4 4/4] unbundle: introduce option VERIFY_BUNDLE_FSCK_FOLLOW_FETCH · Xing Xin via GitGitGadget <hidden> · 2024-05-30
Re: [PATCH v4 4/4] unbundle: introduce option VERIFY_BUNDLE_FSCK_FOLLOW_FETCH · Patrick Steinhardt <hidden> · 2024-06-06
Re:Re: [PATCH v4 4/4] unbundle: introduce option VERIFY_BUNDLE_FSCK_FOLLOW_FETCH · Xing Xin <hidden> · 2024-06-11
[PATCH v5 0/4] object checking related additions and fixes for bundles in fetches · blanet via GitGitGadget <hidden> · 2024-06-11
[PATCH v5 2/4] fetch-pack: expose fsckObjects configuration logic · Xing Xin via GitGitGadget <hidden> · 2024-06-11
[PATCH v5 1/4] bundle-uri: verify oid before writing refs · Xing Xin via GitGitGadget <hidden> · 2024-06-11
[PATCH v5 3/4] unbundle: extend options to support object verification · Xing Xin via GitGitGadget <hidden> · 2024-06-11
Re: [PATCH v5 3/4] unbundle: extend options to support object verification · Patrick Steinhardt <hidden> · 2024-06-11
Re:Re: [PATCH v5 3/4] unbundle: extend options to support object verification · Xing Xin <hidden> · 2024-06-11
[PATCH v5 4/4] unbundle: use VERIFY_BUNDLE_FSCK_FOLLOW_FETCH for fetches · Xing Xin via GitGitGadget <hidden> · 2024-06-11
[PATCH v6 0/3] object checking related additions and fixes for bundles in fetches · blanet via GitGitGadget <hidden> · 2024-06-11
[PATCH v6 1/3] bundle-uri: verify oid before writing refs · Xing Xin via GitGitGadget <hidden> · 2024-06-11
[PATCH v6 2/3] fetch-pack: expose fsckObjects configuration logic · Xing Xin via GitGitGadget <hidden> · 2024-06-11
[PATCH v6 3/3] unbundle: support object verification for fetches · Xing Xin via GitGitGadget <hidden> · 2024-06-11
Re: [PATCH v6 0/3] object checking related additions and fixes for bundles in fetches · Patrick Steinhardt <hidden> · 2024-06-11
[PATCH v7 0/3] object checking related additions and fixes for bundles in fetches · blanet via GitGitGadget <hidden> · 2024-06-17
[PATCH v7 1/3] bundle-uri: verify oid before writing refs · Xing Xin via GitGitGadget <hidden> · 2024-06-17
[PATCH v7 2/3] fetch-pack: expose fsckObjects configuration logic · Xing Xin via GitGitGadget <hidden> · 2024-06-17
[PATCH v7 3/3] unbundle: extend object verification for fetches · Xing Xin via GitGitGadget <hidden> · 2024-06-17
[PATCH v8 0/3] object checking related additions and fixes for bundles in fetches · blanet via GitGitGadget <hidden> · 2024-06-19
[PATCH v8 2/3] fetch-pack: expose fsckObjects configuration logic · Xing Xin via GitGitGadget <hidden> · 2024-06-19
[PATCH v8 1/3] bundle-uri: verify oid before writing refs · Xing Xin via GitGitGadget <hidden> · 2024-06-19
[PATCH v8 3/3] unbundle: extend object verification for fetches · Xing Xin via GitGitGadget <hidden> · 2024-06-19

From: Xing Xin <hidden>
Date: 2024-05-20 09:41:32

At 2024-05-17 13:00:49, "Patrick Steinhardt" [off-list ref] wrote:

On Wed, May 15, 2024 at 03:01:09AM +0000, blanet via GitGitGadget wrote:

quoted

From: Xing Xin <redacted>

Long time no see :)

Glad to see you again here :)

quoted

So why the `refs/bundles/main` is not discovered? After some digging I
found that:

1. when unbundling a downloaded bundle, a `verify_bundle` is called to
   check its prerequisites if any. The verify procedure would find oids
   so `packed_git` is initialized.

2. after unbundled all bundles, we would enter `do_fetch_pack_v2`,
   during which `mark_complete_and_common_ref` and `mark_tips` would
   find oids with `OBJECT_INFO_QUICK` flag set, so no new packs would be
   enlisted if `packed_git` has already initialized in 1.

And I assume we do not want it to not use `OBJECT_INFO_QUICK`?

I think so. For clones or fetches without using bundle-uri, we can hardly
encounter the case that new packs are added during the negotiation process.
So using `OBJECT_INFO_QUICK` can get some performance gain.

quoted

Back to the example above, when unbunding `incr.bundle`, `base.pack` is
enlisted to `packed_git` bacause of the prerequisites to verify. Then we
can not find `B` for negotiation at a latter time bacause `B` exists in
`incr.pack` which is not enlisted in `packed_git`.

Okay, the explanation feels sensible.

quoted

This commit fixes this by adding a `reprepare_packed_git` call for every
successfully unbundled bundle, which ensures to enlist all generated
packs from bundle uri. And a set of negotiation related tests are added.

This makes me wonder though. Do we really need to call
`reprepare_packed_git()` once for every bundle, or can't we instead call
it once at the end once we have fetched all bundles? Reading on.

quoted

Signed-off-by: Xing Xin <redacted>
---
    bundle-uri: refresh packed_git if unbundle succeed

Published-As: https://github.com/gitgitgadget/git/releases/tag/pr-1730%2Fblanet%2Fxx%2Fbundle-uri-bug-using-bundle-list-v1
Fetch-It-Via: git fetch https://github.com/gitgitgadget/git pr-1730/blanet/xx/bundle-uri-bug-using-bundle-list-v1
Pull-Request: https://github.com/gitgitgadget/git/pull/1730

 bundle-uri.c                |   3 +
 t/t5558-clone-bundle-uri.sh | 129 ++++++++++++++++++++++++++++++++++++
 2 files changed, 132 insertions(+)

diff --git a/bundle-uri.c b/bundle-uri.c
index ca32050a78f..2b9d36cfd8e 100644
--- a/bundle-uri.c
+++ b/bundle-uri.c

@@ -7,6 +7,7 @@
 #include "refs.h"
 #include "run-command.h"
 #include "hashmap.h"
+#include "packfile.h"
 #include "pkt-line.h"
 #include "config.h"
 #include "remote.h"

@@ -376,6 +377,8 @@ static int unbundle_from_file(struct repository *r, const char *file)
 			       VERIFY_BUNDLE_QUIET)))
 		return 1;
 
+	reprepare_packed_git(r);
+

So what's hidden here is that `unbundle_from_file()` will also try to
access the bundle's refs right away. Surprisingly, we do so by calling
`refs_update_ref()` with `REF_SKIP_OID_VERIFICATION`, which has the
effect that we basically accept arbitrary object IDs here even if we do
not know those. That's why we didn't have to `reprepare_packed_git()`
before this change.

You are right! I tried dropping this `REF_SKIP_OID_VERIFICATION` flag and
the negotiation works as expected.

After some further digging I find that without `REF_SKIP_OID_VERIFICATION`,
both `write_ref_to_lockfile` for files backend and `reftable_be_transaction_prepare`
for reftable backend would call `parse_object` to check the oid. `parse_object`
can help refresh `packed_git` via `reprepare_packed_git`.

Now there are two conflicting thoughts here:

 - Either we can now drop `REF_SKIP_OID_VERIFICATION` as the object IDs
   should now be accessible.

 - Or we can avoid calling `reprepare_packed_git()` inside the loop and
   instead call it once after we have fetched all bundles.

The second one feels a bit like premature optimization to me. But the
first item does feel like it could help us to catch broken bundles
because we wouldn't end up creating refs for objects that neither we nor
the bundle have.

I favor the first approach because a validation on the object IDs we are
writing is a safe guard . And the flag itself was designed to be used in
testing scenarios.

/*
 * Blindly write an object_id. This is useful for testing data corruption
 * scenarios.
 */
#define REF_SKIP_OID_VERIFICATION (1 << 10)

`h`	back out one level
`j`	next message in thread
`k`	previous message in thread
`l`	drill in
`Esc`	close help / fold thread tree
`?`	toggle this help