Spaces:

tsuching
/

Tibetan-tts

Running

tsuching commited on 21 days ago

Commit

69b711b

verified ·

1 Parent(s): 9c45e61

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -199,25 +199,32 @@ def run_task(text, language, task):
                 except Exception as e2:
                     return None, None, f"Translation error: {e2}"
         elif language == "Tibetan":
-            # 1) Segment Tibetan text with Botok
-            tokens = [t.text for t in wt.tokenize(text)]
-            segmented_text = " ".join(tokens)
-            # 2) Set source and target languages
-            tokenizer.src_lang = "bo_CN"
-            forced_bos = tokenizer.lang_code_to_id["en_XX"]
-            # 3) Translate using MBART-50
-            inputs = tokenizer(segmented_text, return_tensors="pt")
-            outputs = model.generate(
-                **inputs,
-                max_new_tokens=256,
-                forced_bos_token_id=forced_bos
-            )
-            english_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
-            return None, None, english_text
             #translated_text = translate_with_quota(text, src_lang="bo", tgt_lang="en")
             #return None, None, translated_text
         else:

                 except Exception as e2:
                     return None, None, f"Translation error: {e2}"
         elif language == "Tibetan":
+            try:
+                # 1) Segment Tibetan text with Botok
+                tokens = [t.text for t in wt.tokenize(text)]
+                segmented_text = " ".join(tokens)
+                print("Segmented Tibetan:", segmented_text)
+                # 2) Set source and target languages
+                tokenizer.src_lang = "bo_CN"
+                forced_bos = tokenizer.lang_code_to_id["en_XX"]
+                # 3) Translate using MBART-50
+                inputs = tokenizer(segmented_text, return_tensors="pt")
+                outputs = model.generate(
+                    **inputs,
+                    max_new_tokens=256,
+                    forced_bos_token_id=forced_bos
+                )
+                # 4) Decode output
+                english_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
+                print("Translation output:", english_text)
+                return None, None, english_text
+            except Exception as e:
+                return None, None, f"Tibetan translation error: {e}"
             #translated_text = translate_with_quota(text, src_lang="bo", tgt_lang="en")
             #return None, None, translated_text
         else: