token-counter-tool

Runtime error

App Files Files Community

Chris4K commited on Nov 21, 2023

Commit

b4a8aea

1 Parent(s): 6e48ed8

Update text_generator.py

Browse files

Files changed (1) hide show

text_generator.py +25 -58

text_generator.py CHANGED Viewed

@@ -1,67 +1,34 @@
-import requests
-import os
-from transformers import pipeline
 from transformers import Tool
-# Import other necessary libraries if needed
-class TextGenerationTool(Tool):
     name = "text_generator"
-    description = (
-        "This is a tool for text generation. It takes a prompt as input and returns the generated text."
-    )
     inputs = ["text"]
     outputs = ["text"]
     def __call__(self, prompt: str):
-        #API_URL = "https://api-inference.huggingface.co/models/openchat/openchat_3.5"
-        #headers = {"Authorization": "Bearer " +  os.environ['hf']}
-        token=os.environ['hf']
-        #payload = {
-        #    "inputs": prompt  # Adjust this based on your model's input format
-        #}
-        #payload = {
-        #            "inputs": "Can you please let us know more details about your ",
-        #        }
-        #def query(payload):
-        #generated_text = requests.post(API_URL, headers=headers, json=payload).json()
-        #print(generated_text)
-        #return generated_text["text"]
-        # Replace the following line with your text generation logic
-        #generated_text = f"Generated text based on the prompt: '{prompt}'"
-        # Initialize the text generation pipeline
-        text_generator = pipeline(model="lgaalves/gpt2-dolly", token=token)
-        # Generate text based on a prompt
-        generated_text = text_generator(prompt, max_length=500, num_return_sequences=1, temperature=0.7)
-        # Print the generated text
-        print(generated_text)
-        return generated_text
-        # Define the payload for the request
-        #payload = {
-        #    "inputs": prompt  # Adjust this based on your model's input format
-        #}
-        # Make the request to the API
-        #generated_text = requests.post(API_URL, headers=headers, json=payload).json()
-        # Extract and return the generated text
-        #return generated_text["generated_text"]
-# Uncomment and customize the following lines based on your text generation needs
-# text_generator = pipeline(model="gpt2")
-# generated_text = text_generator(prompt, max_length=500, num_return_sequences=1, temperature=0.7)
-# Print the generated text if needed
-# print(generated_text)

+from transformers import AutoTokenizer
+def tokenize(input_text):
+    tokens = tokenizer(input_text)["input_ids"]
+    return f"Number of tokens: {len(tokens)}"
+tokenize_tool = gr.Interface(
+    fn=tokenize,
+    inputs=gr.Textbox(lines=7, label="Input Text"),
+    outputs=gr.Textbox(label="Tokenization Result"),
+    live=True,
+    title="GPT-2 Tokenizer",
+    description="This tool tokenizes input text using the lgaalves/gpt2-dolly model.",
+)
+tokenize_tool.launch()
+import os
+from transformers import pipeline
 from transformers import Tool
+class TokenCounterTool(Tool):
     name = "text_generator"
+    description = "This is a tool for counting token used by a prompt. It takes a prompt as input and returns the generated text."
     inputs = ["text"]
     outputs = ["text"]
     def __call__(self, prompt: str):
+        token = os.environ['hf']
+        tokenizer = AutoTokenizer.from_pretrained("lgaalves/gpt2-dolly")
+        tokens = tokenizer(input_text)["input_ids"]
+        return f"Number of tokens: {len(tokens)}"