Date: 2025-01-30 01:54 pm (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi
Так он что, на базу ходит? Я наивно верил, что он весь локальный.

Date: 2025-01-30 04:26 pm (UTC)
wererat: (Default)
From: [personal profile] wererat

Есть и локальный; называется [дипсик-] R1. тыц.

Date: 2025-01-30 05:25 pm (UTC)
wererat: (Default)
From: [personal profile] wererat

Ты просто невнимательно смотрел. На той страничке, чуть ниже, есть т.н. "дистилляты":

DeepSeek-R1-Distill-Qwen-1.5B

DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Llama-8B

DeepSeek-R1-Distill-Qwen-14B

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Llama-70B

70b (с 16-битным квантованием) можно пускать на 1 маке, а более мелкие (с 8b или 16b, смотря по ресурсам), так и прямо на видюхах. Это не сам R1, конечно, но качество заметно улучшается от такого файн-тьюна.

Ну и, справедливости ради, "локальная" не всегда значит "домашняя", увы и ах ,)

Edited ((слиплись)) Date: 2025-01-30 05:25 pm (UTC)

Date: 2025-01-30 10:24 pm (UTC)
wererat: (Default)
From: [personal profile] wererat
*разводит лапками* зато локальное! ,)

Некоторые пытаются "сжимать" непосредственно R1, утверждают что это работает (см. https://unsloth.ai/blog/deepseekr1-dynamic). Но тоже будет "глупее", конечно.

Profile

lev: (Default)
lev

December 2025

S M T W T F S
 12 3456
7 8910 111213
1415 16 17 18 1920
21 2223 2425 2627
28293031   

Page Summary

Style Credit

Expand Cut Tags

No cut tags
Page generated Dec. 29th, 2025 03:39 am
Powered by Dreamwidth Studios