Date: 2025-01-30 01:54 pm (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi
Так он что, на базу ходит? Я наивно верил, что он весь локальный.

Date: 2025-01-30 04:26 pm (UTC)
wererat: (Default)
From: [personal profile] wererat

Есть и локальный; называется [дипсик-] R1. тыц.

Date: 2025-01-30 05:25 pm (UTC)
wererat: (Default)
From: [personal profile] wererat

Ты просто невнимательно смотрел. На той страничке, чуть ниже, есть т.н. "дистилляты":

DeepSeek-R1-Distill-Qwen-1.5B

DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Llama-8B

DeepSeek-R1-Distill-Qwen-14B

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Llama-70B

70b (с 16-битным квантованием) можно пускать на 1 маке, а более мелкие (с 8b или 16b, смотря по ресурсам), так и прямо на видюхах. Это не сам R1, конечно, но качество заметно улучшается от такого файн-тьюна.

Ну и, справедливости ради, "локальная" не всегда значит "домашняя", увы и ах ,)

Edited ((слиплись)) Date: 2025-01-30 05:25 pm (UTC)

Date: 2025-01-30 10:24 pm (UTC)
wererat: (Default)
From: [personal profile] wererat
*разводит лапками* зато локальное! ,)

Некоторые пытаются "сжимать" непосредственно R1, утверждают что это работает (см. https://unsloth.ai/blog/deepseekr1-dynamic). Но тоже будет "глупее", конечно.

Profile

lev: (Default)
lev

July 2025

S M T W T F S
   12345
6789101112
13141516171819
20212223242526
2728293031  

Page Summary

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 2nd, 2025 04:18 pm
Powered by Dreamwidth Studios