共计 1700 个字符,预计需要花费 5 分钟才能阅读完成。
最近真的要和大家分享一波超燃的科技新发现!✨
一家叫 DeepSeek 的初创公司,经过多次技术迭代升级,终于推出了全新一代大模型——DeepSeek-V3!听说它的表现超级惊艳,功能一流到让人目瞪口呆😱。
更让人心动的是,DeepSeek还直接将他们的 DeepSeek R1 免费开源!这波操作一经发布,就在AI发烧友圈子里炸开了锅🔥。不只是在国内,海外的社交平台和技术论坛上,各路大神们纷纷点赞、连连称赞,简直是引爆了全球热议!
作为一个AI控,看到这么多免费又高效的技术福利,真的是忍不住种草了~如果你也对前沿科技充满好奇,那就快来一起体验这波AI革命吧!#DeepSeek #AI新突破 #开源福利 #科技种草
快来评论区聊聊你的看法吧!💬💕
性能对齐 OpenAI-o1 正式版
DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
本地部署,我们可以通过Ollama来进行安装
一、安装Ollama
1.官网地址
https://ollama.com/
二、安装一个可视化对话Chatbox或者Page Assist - 本地 AI 模型的 Web UI(二选一)
安装
https://chatboxai.app/
ollama run deepseek-r1:1.5b
ollama run deepseek-r1:7b
ollama run deepseek-r1:8b
ollama run deepseek-r1:14b
ollama run deepseek-r1:32b
ollama run deepseek-r1:70b
2. 更多模型下载
DeepSeek-R1
模型 | #总参数 | #已激活参数 | 上下文长度 | 下载 |
---|---|---|---|---|
DeepSeek-R1-Zero | 671B | 37B | 128千 | 🤗 HuggingFace |
DeepSeek-R1 | 671B | 37B | 128千 | 🤗 HuggingFace |
DeepSeek-R1-Zero 和 DeepSeek-R1 基于 DeepSeek-V3-Base 进行训练。有关模型架构的更多详细信息,请参阅DeepSeek-V3存储库。
DeepSeek-R1-Distill 模型
模型 | 基础模型 | 下载 |
---|---|---|
DeepSeek-R1-Distill-Qwen-1.5B | Qwen2.5-Math-1.5B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Qwen-7B | Qwen2.5-Math-7B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Llama-8B | Llama-3.1-8B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Qwen-14B | Qwen2.5-14B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Qwen-32B | Qwen2.5-32B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Llama-70B | Llama-3.3-70B-Instruct | 🤗 HuggingFace |
DeepSeek-R1-Distill 模型基于开源模型进行了微调,使用了 DeepSeek-R1 生成的样本。我们对其配置和分词器进行了轻微更改。请使用我们的设置来运行这些模型。