jinaai
/

xlm-roberta-flash-implementation

jupyterjazz commited on Sep 9, 2024

Commit

e6e3a6f

verified ·

1 Parent(s): 8b2ad1e

fix: partition adapter mask when batch size is specified

Files changed (1) hide show

modeling_xlm_roberta.py CHANGED Viewed

@@ -558,15 +558,18 @@ class XLMRobertaModel(XLMRobertaPreTrainedModel):
             )
         else:
             range_iter = range(0, len(sentences), batch_size)
-        lora_arguments = (
-            {"adapter_mask": adapter_mask} if adapter_mask is not None else {}
-        )
         for i in range_iter:
             encoded_input = self.tokenizer(
                 sentences[i : i + batch_size],
                 return_tensors="pt",
                 **tokenizer_kwargs,
             ).to(self.device)
             token_embs = self.forward(**encoded_input, **lora_arguments)[0]
             # Accumulate in fp32 to avoid overflow

             )
         else:
             range_iter = range(0, len(sentences), batch_size)
         for i in range_iter:
             encoded_input = self.tokenizer(
                 sentences[i : i + batch_size],
                 return_tensors="pt",
                 **tokenizer_kwargs,
             ).to(self.device)
+            lora_arguments = (
+                {"adapter_mask": adapter_mask[i : i + batch_size]}
+                if adapter_mask is not None
+                else {}
+            )
             token_embs = self.forward(**encoded_input, **lora_arguments)[0]
             # Accumulate in fp32 to avoid overflow