mlx-my-repo

Running

pcuenq HF Staff commited on Jun 5

Commit

f2c85ee

1 Parent(s): 125c019

Q5

Files changed (1) hide show

app.py CHANGED Viewed

@@ -27,6 +27,7 @@ QUANT_PARAMS = {
     "Q2": 2,
     "Q3": 3,
     "Q4": 4,
     "Q6": 6,
     "Q8": 8,
 }
@@ -144,6 +145,7 @@ def process_model(model_id, q_method, oauth_token: gr.OAuthToken | None):
 css="""/* Custom CSS to allow scrolling */
 .gradio-container {overflow-y: auto;}
 """
 # Create Gradio interface
 with gr.Blocks(css=css) as demo:
     gr.Markdown("You must be logged in to use MLX-my-repo.")
@@ -156,7 +158,7 @@ with gr.Blocks(css=css) as demo:
     )
     q_method = gr.Dropdown(
-        ["FP16", "Q2", "Q3", "Q4", "Q6", "Q8"],
         label="Conversion Method",
         info="MLX conversion type (FP16 for float16, Q2–Q8 for quantized models)",
         value="Q4",

     "Q2": 2,
     "Q3": 3,
     "Q4": 4,
+    "Q5": 5,
     "Q6": 6,
     "Q8": 8,
 }
 css="""/* Custom CSS to allow scrolling */
 .gradio-container {overflow-y: auto;}
 """
 # Create Gradio interface
 with gr.Blocks(css=css) as demo:
     gr.Markdown("You must be logged in to use MLX-my-repo.")
     )
     q_method = gr.Dropdown(
+        ["FP16"] + list(QUANT_PARAMS.keys()),
         label="Conversion Method",
         info="MLX conversion type (FP16 for float16, Q2–Q8 for quantized models)",
         value="Q4",