deepseek-v2:236b-chat-q3_K

deepseek-v2:236b-chat-q3_K_L

1.1M Downloads Updated 2 years ago

A strong, economical, and efficient Mixture-of-Experts language model.

16b 236b

ollama run deepseek-v2:236b-chat-q3_K_L

curl http://localhost:11434/api/chat \
  -d '{
    "model": "deepseek-v2:236b-chat-q3_K_L",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

from ollama import chat

response = chat(
    model='deepseek-v2:236b-chat-q3_K_L',
    messages=[{'role': 'user', 'content': 'Hello!'}],
)
print(response.message.content)

import ollama from 'ollama'

const response = await ollama.chat({
  model: 'deepseek-v2:236b-chat-q3_K_L',
  messages: [{role: 'user', content: 'Hello!'}],
})
console.log(response.message.content)

Details

Updated 2 years ago

2 years ago

8b50480a0f69 · 122GB ·

model

archdeepseek2

parameters236B

quantizationQ3_K_L

122GB

params

{ "stop": [ "User:", "Assistant:" ] }

32B

license

14kB

template

{{ if .System }}{{ .System }} {{ end }}{{ if .Prompt }}User: {{ .Prompt }} {{ end }}Assistant:{{ .Re

111B

Readme

Note: this model requires Ollama 0.1.40.

DeepSeek-V2 is a a strong Mixture-of-Experts (MoE) language model characterized by economical training and efficient inference.

Note: this model is bilingual in English and Chinese.

The model comes in two sizes:

16B Lite: ollama run deepseek-v2:16b
236B: ollama run deepseek-v2:236b

References

GitHub