Spaces:

Ephraimmm
/

Pidgin_0.1

Runtime error

Ephraimmm commited on Sep 17

Commit

60cedc0

verified ·

1 Parent(s): 6d4ced0

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,15 +10,21 @@ from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorStream
 # ---------------------
 # Model + Tokenizer
 # ---------------------
 MODEL_ID = "Ephraimmm/PIDGIN_gemma-3"
-bnb_config = BitsAndBytesConfig(
-    load_in_4bit=True,
-    bnb_4bit_quant_type="nf4",
-    bnb_4bit_use_double_quant=True,
-    bnb_4bit_compute_dtype=torch.bfloat16 if torch.cuda.is_bf16_supported() else torch.float16,
 )
 print("Loading model...")
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_ID,

 # ---------------------
 # Model + Tokenizer
 # ---------------------
+from transformers import AutoModelForCausalLM, AutoTokenizer
 MODEL_ID = "Ephraimmm/PIDGIN_gemma-3"
+print("Loading quantized model...")
+model = AutoModelForCausalLM.from_pretrained(
+    MODEL_ID,
+    device_map="auto",              # Let HF handle GPU placement
+    torch_dtype="auto",             # Match the quantization dtype
+    trust_remote_code=True          # Required for Unsloth models
 )
+tokenizer = AutoTokenizer.from_pretrained(MODEL_ID, trust_remote_code=True)
 print("Loading model...")
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_ID,