wererat: (Default)

[personal profile] wererat 2025-01-30 04:26 pm (UTC)(link)

Есть и локальный; называется [дипсик-] R1. тыц.

wererat: (Default)

[personal profile] wererat 2025-01-30 05:25 pm (UTC)(link)

Ты просто невнимательно смотрел. На той страничке, чуть ниже, есть т.н. "дистилляты":

DeepSeek-R1-Distill-Qwen-1.5B

DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Llama-8B

DeepSeek-R1-Distill-Qwen-14B

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Llama-70B

70b (с 16-битным квантованием) можно пускать на 1 маке, а более мелкие (с 8b или 16b, смотря по ресурсам), так и прямо на видюхах. Это не сам R1, конечно, но качество заметно улучшается от такого файн-тьюна.

Ну и, справедливости ради, "локальная" не всегда значит "домашняя", увы и ах ,)

Edited ((слиплись)) 2025-01-30 17:25 (UTC)
wererat: (Default)

[personal profile] wererat 2025-01-30 10:24 pm (UTC)(link)
*разводит лапками* зато локальное! ,)

Некоторые пытаются "сжимать" непосредственно R1, утверждают что это работает (см. https://unsloth.ai/blog/deepseekr1-dynamic). Но тоже будет "глупее", конечно.