RedHatAI
/

quantization

Model card Files Files and versions

417 MB

2 contributors

History: 5 commits

danieldk's picture

danieldk HF Staff

Add `scaled_(int|fp8)_quant` and `fp8_marlin_gemm`

5c6fb68 about 1 year ago