Edited attention.py for older xformers (#1270)

Older versions of xformers require query, key, value to be contiguous, this calls .contiguous() on q/k/v before passing to xformers.
2026-01-27 17:22:53 +03:00 · 2022-11-14 20:35:47 +08:00
parent b3c5e086e5
commit 33d7e89c42
1 changed files with 3 additions and 0 deletions
--- a/src/diffusers/models/attention.py
+++ b/src/diffusers/models/attention.py
@@ -557,6 +557,9 @@ class CrossAttention(nn.Module):
        return hidden_states

    def _memory_efficient_attention_xformers(self, query, key, value):
+        query = query.contiguous()
+        key = key.contiguous()
+        value = value.contiguous()
        hidden_states = xformers.ops.memory_efficient_attention(query, key, value, attn_bias=None)
        hidden_states = self.reshape_batch_dim_to_heads(hidden_states)
        return hidden_states