inference-optimization

1 Article

Model AI Raksasa Bisa Jalan di Laptop Murah, Kok Bisa?

Continue Reading

0 38

6

Dzul Qurnain 1 Juni 2026

Quantization adalah teknik mengompresi model AI dari 16-bit ke 8-bit atau 4-bit. Pelajari cara bikin model 70 miliar parameter jalan di laptop biasa, metode GPTQ dan NF4, plus trade-off akurasi yang harus kamu tahu sebelum deploy ke production.

Artificial Intelligence, Koding, Python, Server, Uncategorized

Page 1 of 1