Spaces:

miiann
/

miian-Q3

Runtime error

miiann commited on Jun 11

Commit

d9b26f0

verified ·

1 Parent(s): b8777eb

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,41 +2,28 @@ import gradio as gr
 from transformers import AutoModel, AutoTokenizer
 import torch
-# Load model (cached after first run)
-def load_model():
-    tokenizer = AutoTokenizer.from_pretrained(
-        "Qwen/Qwen3-Embedding-8B",
-        trust_remote_code=True
-    )
-    model = AutoModel.from_pretrained(
-        "Qwen/Qwen3-Embedding-8B",
-        trust_remote_code=True,
-        device_map="auto"
-    ).eval()
-    return tokenizer, model
-tokenizer, model = load_model()
-# Embedding generation function
 def get_embedding(text):
     inputs = tokenizer(text, return_tensors="pt", truncation=True).to(model.device)
     with torch.no_grad():
         outputs = model(**inputs)
-    # Mean pooling for sentence embedding
     embedding = outputs.last_hidden_state.mean(dim=1).squeeze().tolist()
-    return {
-        "input_text": text,
-        "embedding_size": len(embedding),
-        "first_5_values": embedding[:5]  # Preview
-    }
-# Gradio Interface
 demo = gr.Interface(
     fn=get_embedding,
-    inputs=gr.Textbox(label="Input Text", placeholder="Enter text to embed..."),
-    outputs=gr.JSON(label="Embedding Result"),
-    title="Qwen3-Embedding-8B Demo",
-    examples=["Hello world", "How does AI work?", "上海天气怎么样？"]
 )
 demo.launch()

 from transformers import AutoModel, AutoTokenizer
 import torch
+# Load model with caching
+tokenizer = AutoTokenizer.from_pretrained(
+    "Qwen/Qwen3-Embedding-8B",
+    trust_remote_code=True
+)
+model = AutoModel.from_pretrained(
+    "Qwen/Qwen3-Embedding-8B",
+    trust_remote_code=True,
+    device_map="auto"
+).eval()
 def get_embedding(text):
     inputs = tokenizer(text, return_tensors="pt", truncation=True).to(model.device)
     with torch.no_grad():
         outputs = model(**inputs)
     embedding = outputs.last_hidden_state.mean(dim=1).squeeze().tolist()
+    return {"text": text, "embedding_size": len(embedding)}
 demo = gr.Interface(
     fn=get_embedding,
+    inputs=gr.Textbox(label="Input text"),
+    outputs=gr.JSON(),
+    title="Qwen3 Embeddings"
 )
 demo.launch()