Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

reward-modeling

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

5

Full-text search

Active filters: reward-modeling

opencompass/CompassJudger-2-32B-Instruct

Text Ranking • 33B • Updated Jul 22, 2025 • 191 • 3

LifelongAlignment/aifgen-piecewise-preference-shift-0-reward-model

Reinforcement Learning • 0.5B • Updated May 7, 2025 • 1

mradermacher/CompassJudger-2-32B-Instruct-GGUF

Text Ranking • 33B • Updated Jul 23, 2025 • 47

mradermacher/CompassJudger-2-32B-Instruct-i1-GGUF

Text Ranking • 33B • Updated Jul 23, 2025 • 104

htaf/distill-pipeline

Updated Nov 27, 2025