implicit-cot-math

Running on Zero

da03 commited on Jun 17, 2024

Commit

9428a07

1 Parent(s): e2618b3

.

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,5 +1,4 @@
 import spaces
-import torch
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM
@@ -12,14 +11,19 @@ def preprocess(num):
     reversed_num = ' '.join(num[::-1])
     return reversed_num
 @spaces.GPU
 def predict_product(num1, num2):
     input_text = f'{preprocess(num1)} * {preprocess(num2)} ='
     inputs = tokenizer(input_text, return_tensors='pt').to('cuda' if torch.cuda.is_available() else 'cpu')
     model.to('cuda' if torch.cuda.is_available() else 'cpu')
     outputs = model.generate(**inputs, max_new_tokens=40)
-    raw_output = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    prediction = raw_output.strip().replace(' ', '')[::-1]
     return input_text, raw_output, prediction
 demo = gr.Interface(
@@ -31,7 +35,13 @@ demo = gr.Interface(
         gr.Textbox(label='Predicted Product')
     ],
     title='GPT-2 Multiplication Predictor',
-    description='Enter two numbers up to 9 digits each and get the predicted product.'
 )
 demo.launch()

 import spaces
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM
     reversed_num = ' '.join(num[::-1])
     return reversed_num
+def postprocess(raw_output):
+    prediction = raw_output.replace(' ', '')[::-1]
+    return prediction
 @spaces.GPU
 def predict_product(num1, num2):
     input_text = f'{preprocess(num1)} * {preprocess(num2)} ='
     inputs = tokenizer(input_text, return_tensors='pt').to('cuda' if torch.cuda.is_available() else 'cpu')
     model.to('cuda' if torch.cuda.is_available() else 'cpu')
     outputs = model.generate(**inputs, max_new_tokens=40)
+    output = outputs[0][inputs['input_ids'].shape[-1]:]
+    raw_output = tokenizer.decode(output, skip_special_tokens=True)
+    prediction = postprocess(raw_output)
     return input_text, raw_output, prediction
 demo = gr.Interface(
         gr.Textbox(label='Predicted Product')
     ],
     title='GPT-2 Multiplication Predictor',
+    description='Enter two numbers up to 9 digits each and get the predicted product.',
+    article="""
+    ### Additional Resources
+    - [Paper: From Explicit CoT to Implicit CoT: Learning to Internalize CoT Step by Step](https://arxiv.org/pdf/2405.14838)
+    - [Code Repository](https://github.com/da03/Internalize_CoT_Step_by_Step)
+    - [Tweet Announcement](https://twitter.com/yuntiandeng/status/1795854740879774036)
+    """
 )
 demo.launch()