Блог инженера

History is written by its contributors

Типы квантизации LLM: памятка

2026-05-04 время чтения 3 мин AI Ilya Brin

Хочешь запустить большую языковую модель локально, но не знаешь, какой файл скачать? Q4_K_M, IQ3_S, Q5_K_M - это не случайный набор символов. Это формат квантизации, и от него зависит качество ответов и сколько памяти съест модель.

Читать далее