Re: [PATCH v13 5/7] object-file.c: add "stream_loose_object()" to handle large object

[PATCH] unpack-objects: unpack large object in stream · Han Xin <hidden> · 2021-10-09
Re: [PATCH] unpack-objects: unpack large object in stream · Han Xin <hidden> · 2021-10-19
Re: [PATCH] unpack-objects: unpack large object in stream · Philip Oakley <hidden> · 2021-10-20
Re: [PATCH] unpack-objects: unpack large object in stream · Han Xin <hidden> · 2021-10-21
Re: [PATCH] unpack-objects: unpack large object in stream · Philip Oakley <hidden> · 2021-10-21
Re: [PATCH] unpack-objects: unpack large object in stream · Han Xin <hidden> · 2021-11-03
Re: [PATCH] unpack-objects: unpack large object in stream · Philip Oakley <hidden> · 2021-11-03
[PATCH v2 1/6] object-file: refactor write_loose_object() to support inputstream · Han Xin <hidden> · 2021-11-12
Re: [PATCH v2 1/6] object-file: refactor write_loose_object() to support inputstream · Jiang Xin <hidden> · 2021-11-18
[PATCH v2 2/6] object-file.c: add dry_run mode for write_loose_object() · Han Xin <hidden> · 2021-11-12
Re: [PATCH v2 2/6] object-file.c: add dry_run mode for write_loose_object() · Jiang Xin <hidden> · 2021-11-18
[PATCH v2 3/6] object-file.c: handle nil oid in write_loose_object() · Han Xin <hidden> · 2021-11-12
Re: [PATCH v2 3/6] object-file.c: handle nil oid in write_loose_object() · Jiang Xin <hidden> · 2021-11-18
[PATCH v2 4/6] object-file.c: read input stream repeatedly in write_loose_object() · Han Xin <hidden> · 2021-11-12
Re: [PATCH v2 4/6] object-file.c: read input stream repeatedly in write_loose_object() · Jiang Xin <hidden> · 2021-11-18
[PATCH v2 5/6] object-store.h: add write_loose_object() · Han Xin <hidden> · 2021-11-12
[PATCH v2 6/6] unpack-objects: unpack large object in stream · Han Xin <hidden> · 2021-11-12
Re: [PATCH v2 6/6] unpack-objects: unpack large object in stream · Jiang Xin <hidden> · 2021-11-18
[PATCH v3 0/5] unpack large objects in stream · Han Xin <hidden> · 2021-11-22
Re: [PATCH v3 0/5] unpack large objects in stream · Han Xin <hidden> · 2021-11-29
Re: [PATCH v3 0/5] unpack large objects in stream · Jeff King <hidden> · 2021-11-29
Re: [PATCH v3 0/5] unpack large objects in stream · Han Xin <hidden> · 2021-11-30
[PATCH v4 0/5] unpack large objects in stream · Han Xin <hidden> · 2021-12-03
Re: [PATCH v4 0/5] unpack large objects in stream · Derrick Stolee <hidden> · 2021-12-07
[PATCH v5 0/6] unpack large blobs in stream · Han Xin <hidden> · 2021-12-10
[PATCH v5 0/6] unpack large blobs in stream · Han Xin <hidden> · 2021-12-17
[PATCH v7 0/5] unpack large blobs in stream · Han Xin <hidden> · 2021-12-21
[PATCH v7 1/5] unpack-objects.c: add dry_run mode for get_data() · Han Xin <hidden> · 2021-12-21
Re: [PATCH v7 1/5] unpack-objects.c: add dry_run mode for get_data() · Ævar Arnfjörð Bjarmason <hidden> · 2021-12-21
Re: [PATCH v7 1/5] unpack-objects.c: add dry_run mode for get_data() · René Scharfe <hidden> · 2021-12-21
Re: [PATCH v7 1/5] unpack-objects.c: add dry_run mode for get_data() · Ævar Arnfjörð Bjarmason <hidden> · 2021-12-21
Re: [PATCH v7 1/5] unpack-objects.c: add dry_run mode for get_data() · Jiang Xin <hidden> · 2021-12-22
Re: [PATCH v7 1/5] unpack-objects.c: add dry_run mode for get_data() · Jiang Xin <hidden> · 2021-12-22
Re: [PATCH v7 1/5] unpack-objects.c: add dry_run mode for get_data() · Jiang Xin <hidden> · 2021-12-31
[PATCH v7 2/5] object-file API: add a format_object_header() function · Han Xin <hidden> · 2021-12-21
Re: [PATCH v7 2/5] object-file API: add a format_object_header() function · René Scharfe <hidden> · 2021-12-21
C99 %z (was: [PATCH v7 2/5] object-file API: add a format_object_header() function) · Ævar Arnfjörð Bjarmason <hidden> · 2022-02-01
Re: [PATCH v7 2/5] object-file API: add a format_object_header() function · Jiang Xin <hidden> · 2021-12-31
[PATCH v7 3/5] object-file.c: refactor write_loose_object() to reuse in stream version · Han Xin <hidden> · 2021-12-21
Re: [PATCH v7 3/5] object-file.c: refactor write_loose_object() to reuse in stream version · Ævar Arnfjörð Bjarmason <hidden> · 2021-12-21
Re: [PATCH v7 3/5] object-file.c: refactor write_loose_object() to reuse in stream version · Jiang Xin <hidden> · 2021-12-22
[PATCH v7 4/5] object-file.c: add "write_stream_object_file()" to support read in stream · Han Xin <hidden> · 2021-12-21
Re: [PATCH v7 4/5] object-file.c: add "write_stream_object_file()" to support read in stream · Ævar Arnfjörð Bjarmason <hidden> · 2021-12-21
Re: [PATCH v7 4/5] object-file.c: add "write_stream_object_file()" to support read in stream · Ævar Arnfjörð Bjarmason <hidden> · 2021-12-21
[PATCH v7 5/5] unpack-objects: unpack_non_delta_entry() read data in a stream · Han Xin <hidden> · 2021-12-21
Re: [PATCH v7 5/5] unpack-objects: unpack_non_delta_entry() read data in a stream · Ævar Arnfjörð Bjarmason <hidden> · 2021-12-21
Re: [PATCH v7 5/5] unpack-objects: unpack_non_delta_entry() read data in a stream · Jiang Xin <hidden> · 2021-12-31
[PATCH v8 0/6] unpack large blobs in stream · Han Xin <hidden> · 2022-01-08
[PATCH v9 1/5] unpack-objects: low memory footprint for get_data() in dry_run mode · Han Xin <hidden> · 2022-01-20
[PATCH v9 0/5] unpack large blobs in stream · Han Xin <hidden> · 2022-01-20
Re: [PATCH v9 0/5] unpack large blobs in stream · Ævar Arnfjörð Bjarmason <hidden> · 2022-02-01
Re: [PATCH v9 0/5] unpack large blobs in stream · Han Xin <hidden> · 2022-02-02
Re: [PATCH v9 0/5] unpack large blobs in stream · Ævar Arnfjörð Bjarmason <hidden> · 2022-02-02
[PATCH v10 0/6] unpack-objects: support streaming large objects to disk · Ævar Arnfjörð Bjarmason <hidden> · 2022-02-04
[PATCH v10 1/6] unpack-objects: low memory footprint for get_data() in dry_run mode · Ævar Arnfjörð Bjarmason <hidden> · 2022-02-04
[PATCH v10 2/6] object-file.c: do fsync() and close() before post-write die() · Ævar Arnfjörð Bjarmason <hidden> · 2022-02-04
[PATCH v10 4/6] object-file.c: add "stream_loose_object()" to handle large object · Ævar Arnfjörð Bjarmason <hidden> · 2022-02-04
[PATCH v10 3/6] object-file.c: refactor write_loose_object() to several steps · Ævar Arnfjörð Bjarmason <hidden> · 2022-02-04
[PATCH v10 5/6] core doc: modernize core.bigFileThreshold documentation · Ævar Arnfjörð Bjarmason <hidden> · 2022-02-04
[PATCH v10 6/6] unpack-objects: use stream_loose_object() to unpack large objects · Ævar Arnfjörð Bjarmason <hidden> · 2022-02-04
[PATCH v11 0/8] unpack-objects: support streaming blobs to disk · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-19
[PATCH v11 1/8] unpack-objects: low memory footprint for get_data() in dry_run mode · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-19
[PATCH v11 2/8] object-file.c: do fsync() and close() before post-write die() · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-19
[PATCH v11 3/8] object-file.c: refactor write_loose_object() to several steps · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-19
Re: [PATCH v11 3/8] object-file.c: refactor write_loose_object() to several steps · René Scharfe <hidden> · 2022-03-19
[PATCH v11 4/8] object-file.c: factor out deflate part of write_loose_object() · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-19
[PATCH v11 5/8] object-file.c: add "stream_loose_object()" to handle large object · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-19
[PATCH v11 6/8] core doc: modernize core.bigFileThreshold documentation · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-19
[PATCH v11 7/8] unpack-objects: refactor away unpack_non_delta_entry() · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-19
[PATCH v11 8/8] unpack-objects: use stream_loose_object() to unpack large objects · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-19
[PATCH v12 0/8] unpack-objects: support streaming blobs to disk · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-29
[PATCH v12 2/8] object-file.c: do fsync() and close() before post-write die() · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-29
[PATCH v12 1/8] unpack-objects: low memory footprint for get_data() in dry_run mode · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-29
[PATCH v12 3/8] object-file.c: refactor write_loose_object() to several steps · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-29
Re: [PATCH v12 3/8] object-file.c: refactor write_loose_object() to several steps · Han Xin <hidden> · 2022-03-30
Re: [PATCH v12 3/8] object-file.c: refactor write_loose_object() to several steps · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-30
[PATCH v12 4/8] object-file.c: factor out deflate part of write_loose_object() · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-29
[PATCH v12 5/8] object-file.c: add "stream_loose_object()" to handle large object · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-29
Re: [PATCH v12 5/8] object-file.c: add "stream_loose_object()" to handle large object · Neeraj Singh <hidden> · 2022-03-31
[PATCH v12 6/8] core doc: modernize core.bigFileThreshold documentation · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-29
[PATCH v12 7/8] unpack-objects: refactor away unpack_non_delta_entry() · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-29
Re: [PATCH v12 7/8] unpack-objects: refactor away unpack_non_delta_entry() · René Scharfe <hidden> · 2022-03-30
Re: [PATCH v12 7/8] unpack-objects: refactor away unpack_non_delta_entry() · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-31
Re: [PATCH v12 7/8] unpack-objects: refactor away unpack_non_delta_entry() · René Scharfe <hidden> · 2022-03-31
[PATCH v12 8/8] unpack-objects: use stream_loose_object() to unpack large objects · Ævar Arnfjörð Bjarmason <hidden> · 2022-03-29
[PATCH v13 0/7] unpack-objects: support streaming blobs to disk · Ævar Arnfjörð Bjarmason <hidden> · 2022-06-04
[PATCH v13 1/7] unpack-objects: low memory footprint for get_data() in dry_run mode · Ævar Arnfjörð Bjarmason <hidden> · 2022-06-04
[PATCH v13 2/7] object-file.c: do fsync() and close() before post-write die() · Ævar Arnfjörð Bjarmason <hidden> · 2022-06-04
[PATCH v13 3/7] object-file.c: refactor write_loose_object() to several steps · Ævar Arnfjörð Bjarmason <hidden> · 2022-06-04
[PATCH v13 4/7] object-file.c: factor out deflate part of write_loose_object() · Ævar Arnfjörð Bjarmason <hidden> · 2022-06-04
[PATCH v13 5/7] object-file.c: add "stream_loose_object()" to handle large object · Ævar Arnfjörð Bjarmason <hidden> · 2022-06-04
Re: [PATCH v13 5/7] object-file.c: add "stream_loose_object()" to handle large object · Neeraj Singh <hidden> · 2022-06-08
[RFC PATCH] object-file.c: batched disk flushes for stream_loose_object() · Han Xin <hidden> · 2022-06-09
Re: [RFC PATCH] object-file.c: batched disk flushes for stream_loose_object() · Neeraj Singh <hidden> · 2022-06-09
Re: [RFC PATCH] object-file.c: batched disk flushes for stream_loose_object() · Johannes Schindelin <hidden> · 2022-06-09
Re: [RFC PATCH] object-file.c: batched disk flushes for stream_loose_object() · Han Xin <hidden> · 2022-06-10
[PATCH v13 7/7] unpack-objects: use stream_loose_object() to unpack large objects · Ævar Arnfjörð Bjarmason <hidden> · 2022-06-04
[PATCH v13 6/7] core doc: modernize core.bigFileThreshold documentation · Ævar Arnfjörð Bjarmason <hidden> · 2022-06-04
[PATCH v14 0/7] unpack-objects: support streaming blobs to disk · Han Xin <hidden> · 2022-06-10
[PATCH v14 1/7] unpack-objects: low memory footprint for get_data() in dry_run mode · Han Xin <hidden> · 2022-06-10
[PATCH v14 2/7] object-file.c: do fsync() and close() before post-write die() · Han Xin <hidden> · 2022-06-10
Re: [PATCH v14 2/7] object-file.c: do fsync() and close() before post-write die() · René Scharfe <hidden> · 2022-06-10
[PATCH v14 3/7] object-file.c: refactor write_loose_object() to several steps · Han Xin <hidden> · 2022-06-10
[PATCH v14 4/7] object-file.c: factor out deflate part of write_loose_object() · Han Xin <hidden> · 2022-06-10
[PATCH v14 5/7] object-file.c: add "stream_loose_object()" to handle large object · Han Xin <hidden> · 2022-06-10
[PATCH v14 6/7] core doc: modernize core.bigFileThreshold documentation · Han Xin <hidden> · 2022-06-10
[PATCH v14 7/7] unpack-objects: use stream_loose_object() to unpack large objects · Han Xin <hidden> · 2022-06-10
[PATCH v15 0/6] unpack-objects: support streaming blobs to disk · Han Xin <hidden> · 2022-06-11
[PATCH v15 1/6] unpack-objects: low memory footprint for get_data() in dry_run mode · Han Xin <hidden> · 2022-06-11
[PATCH v15 2/6] object-file.c: refactor write_loose_object() to several steps · Han Xin <hidden> · 2022-06-11
[PATCH v15 3/6] object-file.c: factor out deflate part of write_loose_object() · Han Xin <hidden> · 2022-06-11
[PATCH v15 4/6] object-file.c: add "stream_loose_object()" to handle large object · Han Xin <hidden> · 2022-06-11
[PATCH v15 5/6] core doc: modernize core.bigFileThreshold documentation · Han Xin <hidden> · 2022-06-11
[PATCH v15 6/6] unpack-objects: use stream_loose_object() to unpack large objects · Han Xin <hidden> · 2022-06-11
[PATCH 0/1] unpack-objects: low memory footprint for get_data() in dry_run mode · Han Xin <hidden> · 2022-05-20
[PATCH 1/1] unpack-objects: low memory footprint for get_data() in dry_run mode · Han Xin <hidden> · 2022-05-20
[PATCH v9 2/5] object-file.c: refactor write_loose_object() to several steps · Han Xin <hidden> · 2022-01-20
[PATCH v9 3/5] object-file.c: add "stream_loose_object()" to handle large object · Han Xin <hidden> · 2022-01-20
[PATCH v9 4/5] unpack-objects: unpack_non_delta_entry() read data in a stream · Han Xin <hidden> · 2022-01-20
[PATCH v9 5/5] object-file API: add a format_object_header() function · Han Xin <hidden> · 2022-01-20
[PATCH v8 1/6] unpack-objects: low memory footprint for get_data() in dry_run mode · Han Xin <hidden> · 2022-01-08
Re: [PATCH v8 1/6] unpack-objects: low memory footprint for get_data() in dry_run mode · René Scharfe <hidden> · 2022-01-08
Re: [PATCH v8 1/6] unpack-objects: low memory footprint for get_data() in dry_run mode · Han Xin <hidden> · 2022-01-11
[PATCH v8 2/6] object-file.c: refactor write_loose_object() to several steps · Han Xin <hidden> · 2022-01-08
Re: [PATCH v8 2/6] object-file.c: refactor write_loose_object() to several steps · René Scharfe <hidden> · 2022-01-08
Re: [PATCH v8 2/6] object-file.c: refactor write_loose_object() to several steps · Han Xin <hidden> · 2022-01-11
[PATCH v8 3/6] object-file.c: remove the slash for directory_size() · Han Xin <hidden> · 2022-01-08
Re: [PATCH v8 3/6] object-file.c: remove the slash for directory_size() · René Scharfe <hidden> · 2022-01-08
Re: [PATCH v8 3/6] object-file.c: remove the slash for directory_size() · Han Xin <hidden> · 2022-01-11
[PATCH v8 4/6] object-file.c: add "stream_loose_object()" to handle large object · Han Xin <hidden> · 2022-01-08
[PATCH v8 6/6] object-file API: add a format_object_header() function · Han Xin <hidden> · 2022-01-08
[PATCH v8 5/6] unpack-objects: unpack_non_delta_entry() read data in a stream · Han Xin <hidden> · 2022-01-08
[PATCH v6 1/6] object-file.c: release strbuf in write_loose_object() · Han Xin <hidden> · 2021-12-17
Re: [PATCH v6 1/6] object-file.c: release strbuf in write_loose_object() · René Scharfe <hidden> · 2021-12-17
[PATCH v6 2/6] object-file.c: refactor object header generation into a function · Han Xin <hidden> · 2021-12-17
[RFC PATCH] object-file API: add a format_loose_header() function · Ævar Arnfjörð Bjarmason <hidden> · 2021-12-20
Re: [RFC PATCH] object-file API: add a format_loose_header() function · Philip Oakley <hidden> · 2021-12-20
Re: [RFC PATCH] object-file API: add a format_loose_header() function · Han Xin <hidden> · 2021-12-21
[PATCH v6 3/6] object-file.c: refactor write_loose_object() to reuse in stream version · Han Xin <hidden> · 2021-12-17
[PATCH v6 4/6] object-file.c: make "write_object_file_flags()" to support read in stream · Han Xin <hidden> · 2021-12-17
Re: [PATCH v6 4/6] object-file.c: make "write_object_file_flags()" to support read in stream · René Scharfe <hidden> · 2021-12-17
[PATCH v6 5/6] unpack-objects.c: add dry_run mode for get_data() · Han Xin <hidden> · 2021-12-17
Re: [PATCH v6 5/6] unpack-objects.c: add dry_run mode for get_data() · René Scharfe <hidden> · 2021-12-17
[PATCH v6 6/6] unpack-objects: unpack_non_delta_entry() read data in a stream · Han Xin <hidden> · 2021-12-17
[PATCH v5 1/6] object-file: refactor write_loose_object() to support read from stream · Han Xin <hidden> · 2021-12-10
[PATCH v5 2/6] object-file.c: handle undetermined oid in write_loose_object() · Han Xin <hidden> · 2021-12-10
Re: [PATCH v5 2/6] object-file.c: handle undetermined oid in write_loose_object() · Ævar Arnfjörð Bjarmason <hidden> · 2021-12-13
[PATCH v5 3/6] object-file.c: read stream in a loop in write_loose_object() · Han Xin <hidden> · 2021-12-10
[PATCH v5 4/6] unpack-objects.c: add dry_run mode for get_data() · Han Xin <hidden> · 2021-12-10
[PATCH v5 5/6] object-file.c: make "write_object_file_flags()" to support "HASH_STREAM" · Han Xin <hidden> · 2021-12-10
[PATCH v5 6/6] unpack-objects: unpack_non_delta_entry() read data in a stream · Han Xin <hidden> · 2021-12-10
Re: [PATCH v5 6/6] unpack-objects: unpack_non_delta_entry() read data in a stream · Ævar Arnfjörð Bjarmason <hidden> · 2021-12-13
[PATCH v4 1/5] object-file: refactor write_loose_object() to read buffer from stream · Han Xin <hidden> · 2021-12-03
Re: [PATCH v4 1/5] object-file: refactor write_loose_object() to read buffer from stream · Ævar Arnfjörð Bjarmason <hidden> · 2021-12-03
Re: [PATCH v4 1/5] object-file: refactor write_loose_object() to read buffer from stream · Han Xin <hidden> · 2021-12-06
[PATCH v4 2/5] object-file.c: handle undetermined oid in write_loose_object() · Han Xin <hidden> · 2021-12-03
Re: [PATCH v4 2/5] object-file.c: handle undetermined oid in write_loose_object() · Ævar Arnfjörð Bjarmason <hidden> · 2021-12-03
Re: [PATCH v4 2/5] object-file.c: handle undetermined oid in write_loose_object() · Han Xin <hidden> · 2021-12-06
Re: [PATCH v4 2/5] object-file.c: handle undetermined oid in write_loose_object() · Ævar Arnfjörð Bjarmason <hidden> · 2021-12-03
Re: [PATCH v4 2/5] object-file.c: handle undetermined oid in write_loose_object() · Han Xin <hidden> · 2021-12-06
[PATCH v4 3/5] object-file.c: read stream in a loop in write_loose_object() · Han Xin <hidden> · 2021-12-03
[PATCH v4 4/5] unpack-objects.c: add dry_run mode for get_data() · Han Xin <hidden> · 2021-12-03
Re: [PATCH v4 4/5] unpack-objects.c: add dry_run mode for get_data() · Ævar Arnfjörð Bjarmason <hidden> · 2021-12-03
Re: [PATCH v4 4/5] unpack-objects.c: add dry_run mode for get_data() · Han Xin <hidden> · 2021-12-06
[PATCH v4 5/5] unpack-objects: unpack_non_delta_entry() read data in a stream · Han Xin <hidden> · 2021-12-03
Re: [PATCH v4 5/5] unpack-objects: unpack_non_delta_entry() read data in a stream · Ævar Arnfjörð Bjarmason <hidden> · 2021-12-03
Re: [PATCH v4 5/5] unpack-objects: unpack_non_delta_entry() read data in a stream · Han Xin <hidden> · 2021-12-07
Re: [PATCH v4 5/5] unpack-objects: unpack_non_delta_entry() read data in a stream · Ævar Arnfjörð Bjarmason <hidden> · 2021-12-03
Re: [PATCH v4 5/5] unpack-objects: unpack_non_delta_entry() read data in a stream · Han Xin <hidden> · 2021-12-07
Re: [PATCH v4 5/5] unpack-objects: unpack_non_delta_entry() read data in a stream · Ævar Arnfjörð Bjarmason <hidden> · 2021-12-03
Re: [PATCH v4 5/5] unpack-objects: unpack_non_delta_entry() read data in a stream · Han Xin <hidden> · 2021-12-07
[PATCH v3 2/5] object-file.c: handle undetermined oid in write_loose_object() · Han Xin <hidden> · 2021-11-22
Re: [PATCH v3 2/5] object-file.c: handle undetermined oid in write_loose_object() · Derrick Stolee <hidden> · 2021-11-29
[PATCH v3 1/5] object-file: refactor write_loose_object() to read buffer from stream · Han Xin <hidden> · 2021-11-22
[PATCH v3 3/5] object-file.c: read stream in a loop in write_loose_object() · Han Xin <hidden> · 2021-11-22
[PATCH v3 4/5] unpack-objects.c: add dry_run mode for get_data() · Han Xin <hidden> · 2021-11-22
[PATCH v3 5/5] unpack-objects: unpack_non_delta_entry() read data in a stream · Han Xin <hidden> · 2021-11-22
Re: [PATCH v3 5/5] unpack-objects: unpack_non_delta_entry() read data in a stream · Derrick Stolee <hidden> · 2021-11-29
Re: [PATCH v3 5/5] unpack-objects: unpack_non_delta_entry() read data in a stream · Han Xin <hidden> · 2021-11-30
Re: [PATCH v3 5/5] unpack-objects: unpack_non_delta_entry() read data in a stream · Derrick Stolee <hidden> · 2021-11-30
"git hyperfine" (was: [PATCH v3 5/5] unpack-objects[...]) · Ævar Arnfjörð Bjarmason <hidden> · 2021-12-01
Re: [PATCH v3 5/5] unpack-objects: unpack_non_delta_entry() read data in a stream · Han Xin <hidden> · 2021-12-02
Re: [PATCH v3 5/5] unpack-objects: unpack_non_delta_entry() read data in a stream · Derrick Stolee <hidden> · 2021-12-02

From: Neeraj Singh <hidden>
Date: 2022-06-08 03:26:44

On 6/4/2022 3:10 AM, Ævar Arnfjörð Bjarmason wrote:

From: Han Xin <redacted>

If we want unpack and write a loose object using "write_loose_object",
we have to feed it with a buffer with the same size of the object, which
will consume lots of memory and may cause OOM. This can be improved by
feeding data to "stream_loose_object()" in a stream.

Add a new function "stream_loose_object()", which is a stream version of
"write_loose_object()" but with a low memory footprint. We will use this
function to unpack large blob object in later commit.

Another difference with "write_loose_object()" is that we have no chance
to run "write_object_file_prepare()" to calculate the oid in advance.
In "write_loose_object()", we know the oid and we can write the
temporary file in the same directory as the final object, but for an
object with an undetermined oid, we don't know the exact directory for
the object.

Still, we need to save the temporary file we're preparing
somewhere. We'll do that in the top-level ".git/objects/"
directory (or whatever "GIT_OBJECT_DIRECTORY" is set to). Once we've
streamed it we'll know the OID, and will move it to its canonical
path.

I think this new logic doesn't play well with batched-fsync. Even 
through we don't know the final OID, we should still call 
prepare_loose_object_bulk_checkin to potentially create the bulk checkin 
objdir.

quoted hunk ↗ jump to hunk

diff --git a/object-file.c b/object-file.c
index 7946fa5e088..9fd449693c4 100644
--- a/object-file.c
+++ b/object-file.c

@@ -2119,6 +2119,106 @@ static int freshen_packed_object(const struct object_id *oid)
  	return 1;
  }
  
+int stream_loose_object(struct input_stream *in_stream, size_t len,
+			struct object_id *oid)
+{
+	int fd, ret, err = 0, flush = 0;
+	unsigned char compressed[4096];
+	git_zstream stream;
+	git_hash_ctx c;
+	struct strbuf tmp_file = STRBUF_INIT;
+	struct strbuf filename = STRBUF_INIT;
+	int dirlen;
+	char hdr[MAX_HEADER_LEN];
+	int hdrlen;
+
+	/* Since oid is not determined, save tmp file to odb path. */
+	strbuf_addf(&filename, "%s/", get_object_directory());
+	hdrlen = format_object_header(hdr, sizeof(hdr), OBJ_BLOB, len);
+
+	/*
+	 * Common steps for write_loose_object and stream_loose_object to
+	 * start writing loose objects:
+	 *
+	 *  - Create tmpfile for the loose object.
+	 *  - Setup zlib stream for compression.
+	 *  - Start to feed header to zlib stream.
+	 */
+	fd = start_loose_object_common(&tmp_file, filename.buf, 0,
+				       &stream, compressed, sizeof(compressed),
+				       &c, hdr, hdrlen);
+	if (fd < 0) {
+		err = -1;
+		goto cleanup;
+	}
+
+	/* Then the data itself.. */
+	do {
+		unsigned char *in0 = stream.next_in;
+
+		if (!stream.avail_in && !in_stream->is_finished) {
+			const void *in = in_stream->read(in_stream, &stream.avail_in);
+			stream.next_in = (void *)in;
+			in0 = (unsigned char *)in;
+			/* All data has been read. */
+			if (in_stream->is_finished)
+				flush = 1;
+		}
+		ret = write_loose_object_common(&c, &stream, flush, in0, fd,
+						compressed, sizeof(compressed));
+		/*
+		 * Unlike write_loose_object(), we do not have the entire
+		 * buffer. If we get Z_BUF_ERROR due to too few input bytes,
+		 * then we'll replenish them in the next input_stream->read()
+		 * call when we loop.
+		 */
+	} while (ret == Z_OK || ret == Z_BUF_ERROR);
+
+	if (stream.total_in != len + hdrlen)
+		die(_("write stream object %ld != %"PRIuMAX), stream.total_in,
+		    (uintmax_t)len + hdrlen);
+
+	/* Common steps for write_loose_object and stream_loose_object to
+	 * end writing loose oject:
+	 *
+	 *  - End the compression of zlib stream.
+	 *  - Get the calculated oid.
+	 */
+	if (ret != Z_STREAM_END)
+		die(_("unable to stream deflate new object (%d)"), ret);
+	ret = end_loose_object_common(&c, &stream, oid);
+	if (ret != Z_OK)
+		die(_("deflateEnd on stream object failed (%d)"), ret);
+	close_loose_object(fd, tmp_file.buf);
+

If batch fsync is enabled, the close_loose_object call will refrain from 
syncing the tmp file.

+	if (freshen_packed_object(oid) || freshen_loose_object(oid)) {
+		unlink_or_warn(tmp_file.buf);
+		goto cleanup;
+	}
+
+	loose_object_path(the_repository, &filename, oid);
+

We expect this loose_object_path call to return a path in the bulk fsync 
object directory. It might not do so if we don't call 
prepare_loose_object_bulk_checkin.

In the new test case introduced in (7/7), we seem to be getting lucky
in that there are some small objects (commits) earlier in the packfile,
so we go through write_loose_object first.

Thanks for including me on the review!

-Neeraj

`h`	back out one level
`j`	next message in thread
`k`	previous message in thread
`l`	drill in
`Esc`	close help / fold thread tree
`?`	toggle this help