Spaces:

tsuching
/

Tibetan-tts

Running

tsuching commited on 18 days ago

Commit

07702a8

verified ·

1 Parent(s): 57f5830

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,6 +5,7 @@ import bophono
 from pydub import AudioSegment
 from botok import WordTokenizer
 from transformers import pipeline, AutoTokenizer, AutoModelForSeq2SeqLM
 from transformers import MBart50TokenizerFast, MBartForConditionalGeneration
@@ -360,15 +361,17 @@ def run_task(text, language, task):
                 # Load Monlam AI Tibetan→English model
                 #tib_tokenizer = AutoTokenizer.from_pretrained("monlam-ai/mt-bod-eng", token=HF_TOKEN)
                 #tib_model = AutoModelForSeq2SeqLM.from_pretrained("monlam-ai/mt-bod-eng", token=HF_TOKEN)
-                tib_tokenizer = AutoTokenizer.from_pretrained("billingsmoore/prototype-tibetan-to-english-translation-v1")
-                tib_model = AutoModelForSeq2SeqLM.from_pretrained("billingsmoore/prototype-tibetan-to-english-translation-v1")
                 # Encode Tibetan input
-                inputs = tib_tokenizer(text, return_tensors="pt")
                 # Generate translation
-                outputs = tib_model.generate(**inputs, max_new_tokens=256)
-                translated = tib_tokenizer.decode(outputs[0], skip_special_tokens=True).strip()
                 # Handle nonsense or empty outputs
                 if not translated or translated.isspace():

 from pydub import AudioSegment
 from botok import WordTokenizer
+from mlotsawa.translator import Translator
 from transformers import pipeline, AutoTokenizer, AutoModelForSeq2SeqLM
 from transformers import MBart50TokenizerFast, MBartForConditionalGeneration
                 # Load Monlam AI Tibetan→English model
                 #tib_tokenizer = AutoTokenizer.from_pretrained("monlam-ai/mt-bod-eng", token=HF_TOKEN)
                 #tib_model = AutoModelForSeq2SeqLM.from_pretrained("monlam-ai/mt-bod-eng", token=HF_TOKEN)
+                #tib_tokenizer = AutoTokenizer.from_pretrained("billingsmoore/prototype-tibetan-to-english-translation-v1")
+                #tib_model = AutoModelForSeq2SeqLM.from_pretrained("billingsmoore/prototype-tibetan-to-english-translation-v1")
                 # Encode Tibetan input
+                #inputs = tib_tokenizer(text, return_tensors="pt")
                 # Generate translation
+                #outputs = tib_model.generate(**inputs, max_new_tokens=256)
+                #translated = tib_tokenizer.decode(outputs[0], skip_special_tokens=True).strip()
+                translator = Translator()
+                translated = translator.translate(text)
                 # Handle nonsense or empty outputs
                 if not translated or translated.isspace():