Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush

[PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Tejun Heo <tj@kernel.org> · 2010-08-12
[PATCH 01/11] block/loop: queue ordered mode should be DRAIN_FLUSH · Tejun Heo <tj@kernel.org> · 2010-08-12
[PATCH 02/11] block: kill QUEUE_ORDERED_BY_TAG · Tejun Heo <tj@kernel.org> · 2010-08-12
Re: [PATCH 02/11] block: kill QUEUE_ORDERED_BY_TAG · Vladislav Bolkhovitin <hidden> · 2010-08-13
Re: [PATCH 02/11] block: kill QUEUE_ORDERED_BY_TAG · Christoph Hellwig <hch@lst.de> · 2010-08-13
[PATCH 03/11] block: deprecate barrier and replace blk_queue_ordered() with blk_queue_flush() · Tejun Heo <tj@kernel.org> · 2010-08-12
Re: [PATCH 03/11] block: deprecate barrier and replace blk_queue_ordered() with blk_queue_flush() · Jeremy Fitzhardinge <hidden> · 2010-08-14
Re: [PATCH 03/11] block: deprecate barrier and replace blk_queue_ordered() with blk_queue_flush() · "hch@lst.de" <hch@lst.de> · 2010-08-14
Re: [PATCH 03/11] block: deprecate barrier and replace blk_queue_ordered() with blk_queue_flush() · Jeremy Fitzhardinge <hidden> · 2010-08-16
[PATCH 04/11] block: remove spurious uses of REQ_HARDBARRIER · Tejun Heo <tj@kernel.org> · 2010-08-12
[PATCH 05/11] block: misc cleanups in barrier code · Tejun Heo <tj@kernel.org> · 2010-08-12
[PATCH 06/11] block: drop barrier ordering by queue draining · Tejun Heo <tj@kernel.org> · 2010-08-12
[PATCH 07/11] block: rename blk-barrier.c to blk-flush.c · Tejun Heo <tj@kernel.org> · 2010-08-12
[PATCH 08/11] block: rename barrier/ordered to flush · Tejun Heo <tj@kernel.org> · 2010-08-12
Re: [PATCH 08/11] block: rename barrier/ordered to flush · Christoph Hellwig <hch@lst.de> · 2010-08-17
Re: [PATCH 08/11] block: rename barrier/ordered to flush · Tejun Heo <tj@kernel.org> · 2010-08-17
Re: [PATCH 08/11] block: rename barrier/ordered to flush · Christoph Hellwig <hch@lst.de> · 2010-08-17
Re: [PATCH 08/11] block: rename barrier/ordered to flush · Tejun Heo <tj@kernel.org> · 2010-08-18
[PATCH 09/11] block: implement REQ_FLUSH/FUA based interface for FLUSH/FUA requests · Tejun Heo <tj@kernel.org> · 2010-08-12
[PATCH 10/11] fs, block: propagate REQ_FLUSH/FUA interface to upper layers · Tejun Heo <tj@kernel.org> · 2010-08-12
Re: [PATCH 10/11] fs, block: propagate REQ_FLUSH/FUA interface to upper layers · Jan Kara <jack@suse.cz> · 2010-08-12
Re: [PATCH 10/11] fs, block: propagate REQ_FLUSH/FUA interface to upper layers · Tejun Heo <tj@kernel.org> · 2010-08-13
Re: [PATCH 10/11] fs, block: propagate REQ_FLUSH/FUA interface to upper layers · Christoph Hellwig <hch@lst.de> · 2010-08-13
[PATCH UPDATED 10/11] fs, block: propagate REQ_FLUSH/FUA interface to upper layers · Tejun Heo <tj@kernel.org> · 2010-08-16
[PATCH 11/11] block: use REQ_FLUSH in blkdev_issue_flush() · Tejun Heo <tj@kernel.org> · 2010-08-12
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Christoph Hellwig <hch@lst.de> · 2010-08-13
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Tejun Heo <tj@kernel.org> · 2010-08-13
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Christoph Hellwig <hch@lst.de> · 2010-08-13
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Tejun Heo <tj@kernel.org> · 2010-08-13
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Christoph Hellwig <hch@lst.de> · 2010-08-14
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Tejun Heo <tj@kernel.org> · 2010-08-17
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Christoph Hellwig <hch@lst.de> · 2010-08-17
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Tejun Heo <tj@kernel.org> · 2010-08-17
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Christoph Hellwig <hch@lst.de> · 2010-08-17
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Tejun Heo <tj@kernel.org> · 2010-08-18
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Tejun Heo <hidden> · 2010-08-18
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Kiyoshi Ueda <hidden> · 2010-08-20
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Tejun Heo <tj@kernel.org> · 2010-08-23
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Mike Snitzer <hidden> · 2010-08-23
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Kiyoshi Ueda <hidden> · 2010-08-24
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Tejun Heo <tj@kernel.org> · 2010-08-24
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Mike Snitzer <hidden> · 2010-08-24
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Tejun Heo <tj@kernel.org> · 2010-08-24
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Kiyoshi Ueda <hidden> · 2010-08-25
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Mike Snitzer <hidden> · 2010-08-25
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Kiyoshi Ueda <hidden> · 2010-08-27
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Mike Snitzer <hidden> · 2010-08-27
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Kiyoshi Ueda <hidden> · 2010-08-30
safety of retrying SYNCHRONIZE CACHE [was: Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush] · Mike Snitzer <hidden> · 2010-09-01
Re: safety of retrying SYNCHRONIZE CACHE [was: Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush] · Hannes Reinecke <hare@suse.de> · 2010-09-01
Re: safety of retrying SYNCHRONIZE CACHE [was: Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush] · Hannes Reinecke <hare@suse.de> · 2010-09-01
[RFC] training mpath to discern between SCSI errors (was: Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush) · Mike Snitzer <hidden> · 2010-08-25
Re: [RFC] training mpath to discern between SCSI errors · Mike Christie <hidden> · 2010-08-25
Re: [RFC] training mpath to discern between SCSI errors · Hannes Reinecke <hare@suse.de> · 2010-08-30
Re: [RFC] training mpath to discern between SCSI errors · Sergei Shtylyov <hidden> · 2010-08-30
Re: [RFC] training mpath to discern between SCSI errors · Hannes Reinecke <hare@suse.de> · 2010-08-30
Re: [dm-devel] [RFC] training mpath to discern between SCSI errors · Hannes Reinecke <hare@suse.de> · 2010-08-30
Re: [RFC] training mpath to discern between SCSI errors · Jun'ichi Nomura <hidden> · 2010-10-18
Re: [RFC] training mpath to discern between SCSI errors · Hannes Reinecke <hare@suse.de> · 2010-10-18
Re: [RFC] training mpath to discern between SCSI errors · Jun'ichi Nomura <hidden> · 2010-10-19
Re: [dm-devel] [RFC] training mpath to discern between SCSI errors · Malahal Naineni <hidden> · 2010-11-19
Re: training mpath to discern between SCSI errors · Mike Snitzer <hidden> · 2010-11-30
[RFC PATCH 0/3] differentiate between I/O errors · Mike Snitzer <hidden> · 2010-12-07
[RFC PATCH v2 1/3] scsi: Detailed I/O errors · Mike Snitzer <hidden> · 2010-12-07
[RFC PATCH v2 2/3] dm mpath: propagate target errors immediately · Mike Snitzer <hidden> · 2010-12-07
[RFC PATCH 3/3] block: improve detail in I/O error messages · Mike Snitzer <hidden> · 2010-12-07
Re: [RFC PATCH 3/3] block: improve detail in I/O error messages · Sergei Shtylyov <hidden> · 2010-12-08
[PATCH v2 3/3] block: improve detail in I/O error messages · Mike Snitzer <hidden> · 2010-12-08
Re: [RFC PATCH 0/3] differentiate between I/O errors · Malahal Naineni <hidden> · 2010-12-10
Re: [RFC PATCH 0/3] differentiate between I/O errors · Mike Snitzer <hidden> · 2011-01-14
Re: training mpath to discern between SCSI errors · Hannes Reinecke <hare@suse.de> · 2010-12-17
Re: training mpath to discern between SCSI errors · Mike Snitzer <hidden> · 2010-12-17
Re: training mpath to discern between SCSI errors · Mike Snitzer <hidden> · 2011-01-14
Re: training mpath to discern between SCSI errors · Hannes Reinecke <hare@suse.de> · 2011-01-14
Re: training mpath to discern between SCSI errors · Mike Snitzer <hidden> · 2011-01-14
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Vladislav Bolkhovitin <hidden> · 2010-08-24
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Alan Cox <hidden> · 2010-08-24
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Vladislav Bolkhovitin <hidden> · 2010-08-13
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Christoph Hellwig <hch@lst.de> · 2010-08-13
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Vladislav Bolkhovitin <hidden> · 2010-08-18
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Tejun Heo <tj@kernel.org> · 2010-08-13
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Vladislav Bolkhovitin <hidden> · 2010-08-18
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Tejun Heo <tj@kernel.org> · 2010-08-19
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Hannes Reinecke <hare@suse.de> · 2010-08-30
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Vladislav Bolkhovitin <hidden> · 2010-08-30
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Christoph Hellwig <hch@lst.de> · 2010-08-18
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Tejun Heo <tj@kernel.org> · 2010-08-19
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Christoph Hellwig <hch@lst.de> · 2010-08-19
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Tejun Heo <tj@kernel.org> · 2010-08-19
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Christoph Hellwig <hch@lst.de> · 2010-08-20
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Ric Wheeler <hidden> · 2010-08-20
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Chris Mason <hidden> · 2010-08-20
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Ric Wheeler <hidden> · 2010-08-20
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Tejun Heo <tj@kernel.org> · 2010-08-23
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Christoph Hellwig <hch@lst.de> · 2010-08-23
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Ric Wheeler <hidden> · 2010-08-23
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Jens Axboe <hidden> · 2010-08-23
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Christoph Hellwig <hch@lst.de> · 2010-08-23
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Tejun Heo <tj@kernel.org> · 2010-08-23
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Christoph Hellwig <hch@lst.de> · 2010-08-23
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Jens Axboe <hidden> · 2010-08-25
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Hannes Reinecke <hare@suse.de> · 2010-08-30
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Ric Wheeler <hidden> · 2010-08-23
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Sergey Vlasov <hidden> · 2010-08-23
Re: [dm-devel] [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Ric Wheeler <hidden> · 2010-08-23
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Tejun Heo <tj@kernel.org> · 2010-08-23
Re: [PATCHSET block#for-2.6.36-post] block: replace barrier with sequenced flush · Christoph Hellwig <hch@lst.de> · 2010-08-23
[PATCH] block: simplify queue_next_fseq · Christoph Hellwig <hch@lst.de> · 2010-08-23
OT grammar nit Re: [PATCH] block: simplify queue_next_fseq · John Robinson <hidden> · 2010-08-23

From: Mike Snitzer <hidden>
Date: 2010-08-24 17:52:16
Also in: dm-devel, linux-fsdevel, linux-ide, linux-scsi, lkml

On Tue, Aug 24 2010 at 12:59pm -0400,
Tejun Heo [off-list ref] wrote:

Hello,

On 08/24/2010 12:24 PM, Kiyoshi Ueda wrote:

quoted

Yes, checking whether it's a transport error in lower layer is
the right solution.
(Since I know it's not available yet, I just hoped if upper layers
 had some other options.)

Anyway, only reporting errors for REQ_FLUSH to upper layer without
such a solution would make dm-multipath almost unusable in real world,
although it's better than implicit data loss.

I see.

quoted

Maybe just turn off barrier support in mpath for now?

If it's possible, it could be a workaround for a short term.
But how can you do that?

I think it's not enough to just drop REQ_FLUSH flag from q->flush_flags.
Underlying devices of a mpath device may have write-back cache and
it may be enabled.
So if a mpath device doesn't set REQ_FLUSH flag in q->flush_flags, it
becomes a device which has write-back cache but doesn't support flush.
Then, upper layer can do nothing to ensure cache flush?

Yeah, I was basically suggesting to forget about cache flush w/ mpath
until it can be fixed.  You're saying that if mpath just passes
REQ_FLUSH upwards without retrying, it will be almost unuseable,
right?  I'm not sure how to proceed here.

Seems clear that we must fix mpath to receive the SCSI errors, in some
form, so it can decide if a retry is required/valid or not.

Such error processing was a big selling point for the transition from
bio-based to request-based multipath; so it's unfortunate that this
piece has been left until now.

How much work would discerning between transport and IO errors take?

Hannes already proposed some patches:
https://patchwork.kernel.org/patch/61282/
https://patchwork.kernel.org/patch/61283/
https://patchwork.kernel.org/patch/61596/

This work was discussed at LSF, see "Error Handling - Hannes Reinecke"
here: http://lwn.net/Articles/400589/

I thought James, Alasdair and others offered some guidance on what he'd
like to see...

Unfortunately, even though I was at this LSF session, I can't recall any
specific consensus on how Hannes' work should be refactored (to avoid
adding SCSI sense processing code directly in dm-mpath).  Maybe James,
Hannes or others remember?

Was it enough to just have the SCSI sense processing code split out in a
new sub-section of the SCSI midlayer -- and then DM calls that code?

If it can't be done quickly enough the retry logic can be kept around
to keep the old behavior but that already was a broken behavior, so...
:-(

I'll have to review this thread again to understand why mpath's existing
retry logic is broken behavior.  mpath is used with more capable SCSI
devices so I'm missing why a failed FLUSH implies data loss.

Mike

`h`	back out one level
`j`	next message in thread
`k`	previous message in thread
`l`	drill in
`Esc`	close help / fold thread tree
`?`	toggle this help