deepseek-coder-v2:236b-instruct-q6

deepseek-coder-v2:236b-instruct-q6_K

2.7M Downloads Updated 1 year ago

An open-source Mixture-of-Experts code language model that achieves performance comparable to GPT4-Turbo in code-specific tasks.

16b 236b

ollama run deepseek-coder-v2:236b-instruct-q6_K

curl http://localhost:11434/api/chat \
  -d '{
    "model": "deepseek-coder-v2:236b-instruct-q6_K",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

from ollama import chat

response = chat(
    model='deepseek-coder-v2:236b-instruct-q6_K',
    messages=[{'role': 'user', 'content': 'Hello!'}],
)
print(response.message.content)

import ollama from 'ollama'

const response = await ollama.chat({
  model: 'deepseek-coder-v2:236b-instruct-q6_K',
  messages: [{role: 'user', content: 'Hello!'}],
})
console.log(response.message.content)

Details

Updated 1 year ago

1 year ago

6ce352e55f26 · 194GB ·

model

archdeepseek2

parameters236B

quantizationQ6_K

194GB

params

{ "stop": [ "User:", "Assistant:" ] }

32B

license

14kB

license

1.1kB

template

{{- if .Suffix }}<｜fim▁begin｜>{{ .Prompt }}<｜fim▁hole｜>{{ .Suffix }}<｜fim▁end｜> {{

705B

Readme

DeepSeek-Coder-V2 is an open-source Mixture-of-Experts (MoE) code language model that achieves performance comparable to GPT4-Turbo in code-specific tasks. DeepSeek-Coder-V2 is further pre-trained from DeepSeek-Coder-V2-Base with 6 trillion tokens sourced from a high-quality and multi-source corpus.

References

Hugging Face