Spaces:

NCSOFT
/

harim_plus

Running

fgenie commited on Dec 1, 2022

Commit

a1a10ca

1 Parent(s): 37d452a

bugfix

Files changed (3) hide show

__pycache__/harim_scorer.cpython-39.pyc CHANGED Viewed

Binary files a/__pycache__/harim_scorer.cpython-39.pyc and b/__pycache__/harim_scorer.cpython-39.pyc differ

harim_plus.py CHANGED Viewed

@@ -207,18 +207,19 @@ class Harimplus_Scorer:
             emp_in = emp_in.to(self._device)
             tgt_in = tgt_in.to(self._device)
             tgt_mask = tgt_mask.to(self._device)
             with torch.no_grad():
                 # token_type_ids attribute causes error
                 s2s_logits = self._encdec_model.forward(
                                                     input_ids = src_in.input_ids,
                                                     attention_mask = src_in.attention_mask,
-                                                    labels = tgt_in.input_ids,
                                                     return_dict=True).logits
                 lm_logits = self._encdec_model.forward(
                                                     input_ids = emp_in.input_ids,
                                                     attention_mask = emp_in.attention_mask,
-                                                    labels = tgt_in.input_ids,
                                                     return_dict=True).logits
                 sent_lengths = tgt_mask.sum(-1)
                 ll_tok = self.log_likelihoods(s2s_logits, tgt_in.input_ids, tgt_mask)

             emp_in = emp_in.to(self._device)
             tgt_in = tgt_in.to(self._device)
             tgt_mask = tgt_mask.to(self._device)
+            fill_ignore_mask = ~(tgt_mask.bool())
             with torch.no_grad():
                 # token_type_ids attribute causes error
                 s2s_logits = self._encdec_model.forward(
                                                     input_ids = src_in.input_ids,
                                                     attention_mask = src_in.attention_mask,
+                                                    labels = tgt_in.input_ids.masked_fill(fill_ignore_mask, -100),
                                                     return_dict=True).logits
                 lm_logits = self._encdec_model.forward(
                                                     input_ids = emp_in.input_ids,
                                                     attention_mask = emp_in.attention_mask,
+                                                    labels = tgt_in.input_ids.masked_fill(fill_ignore_mask, -100),
                                                     return_dict=True).logits
                 sent_lengths = tgt_mask.sum(-1)
                 ll_tok = self.log_likelihoods(s2s_logits, tgt_in.input_ids, tgt_mask)

harim_scorer.py CHANGED Viewed

@@ -141,18 +141,19 @@ class Harimplus_Scorer:
             emp_in = emp_in.to(self._device)
             tgt_in = tgt_in.to(self._device)
             tgt_mask = tgt_mask.to(self._device)
             with torch.no_grad():
                 # token_type_ids attribute causes error
                 s2s_logits = self._encdec_model.forward(
                                                     input_ids = src_in.input_ids,
                                                     attention_mask = src_in.attention_mask,
-                                                    labels = tgt_in.input_ids,
                                                     return_dict=True).logits
                 lm_logits = self._encdec_model.forward(
                                                     input_ids = emp_in.input_ids,
                                                     attention_mask = emp_in.attention_mask,
-                                                    labels = tgt_in.input_ids,
                                                     return_dict=True).logits
                 sent_lengths = tgt_mask.sum(-1)
                 ll_tok = self.log_likelihoods(s2s_logits, tgt_in.input_ids, tgt_mask)

             emp_in = emp_in.to(self._device)
             tgt_in = tgt_in.to(self._device)
             tgt_mask = tgt_mask.to(self._device)
+            fill_ignore_mask = ~(tgt_mask.bool())
             with torch.no_grad():
                 # token_type_ids attribute causes error
                 s2s_logits = self._encdec_model.forward(
                                                     input_ids = src_in.input_ids,
                                                     attention_mask = src_in.attention_mask,
+                                                    labels = tgt_in.input_ids.masked_fill(fill_ignore_mask, -100),
                                                     return_dict=True).logits
                 lm_logits = self._encdec_model.forward(
                                                     input_ids = emp_in.input_ids,
                                                     attention_mask = emp_in.attention_mask,
+                                                    labels = tgt_in.input_ids.masked_fill(fill_ignore_mask, -100),
                                                     return_dict=True).logits
                 sent_lengths = tgt_mask.sum(-1)
                 ll_tok = self.log_likelihoods(s2s_logits, tgt_in.input_ids, tgt_mask)