Genstruct_test

Runtime error

Tonic commited on Mar 10, 2024

Commit

cdc4e67

verified ·

1 Parent(s): 29d6a8c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -22,8 +22,12 @@ rm_model = AutoModelForSequenceClassification.from_pretrained('OpenAssistant/rew
 @spaces.GPU
 def generate_text(usertitle, content, temperature, max_length, N=3):
-    input_text = f"title: {usertitle}\ncontent: {content}"
-    inputs = tokenizer(input_text, return_tensors='pt').to('cuda')
     attention_mask = torch.ones(inputs['input_ids'].shape, dtype=torch.long, device='cuda')
     generated_sequences = model.generate(inputs['input_ids'], attention_mask=attention_mask, temperature=temperature, max_length=max_length, pad_token_id=tokenizer.eos_token_id, num_return_sequences=N, do_sample=True)
     decoded_sequences = [tokenizer.decode(g, skip_special_tokens=True) for g in generated_sequences]

 @spaces.GPU
 def generate_text(usertitle, content, temperature, max_length, N=3):
+    msg =[
+    'title': {usertitle},
+    'content': {content}
+    ]
+    # input_text = f"title: {usertitle}\ncontent: {content}"
+    inputs = tokenizer.apply_chat_template(msg, return_tensors='pt').cuda()
     attention_mask = torch.ones(inputs['input_ids'].shape, dtype=torch.long, device='cuda')
     generated_sequences = model.generate(inputs['input_ids'], attention_mask=attention_mask, temperature=temperature, max_length=max_length, pad_token_id=tokenizer.eos_token_id, num_return_sequences=N, do_sample=True)
     decoded_sequences = [tokenizer.decode(g, skip_special_tokens=True) for g in generated_sequences]