deepseek-v3:671b/params

A strong Mixture-of-Experts (MoE) language model with 671B total parameters with 37B activated for each token.

671b

752.5K Pulls Updated 8 weeks ago

deepseek-v3:671b ... /

params

f4d24e9138dd · 148B

{

"stop": [

"<｜begin▁of▁sentence｜>",

"<｜end▁of▁sentence｜>",

"<｜User｜>",

"<｜Assistant｜>"

]

}