免费开源!对标OpenAI-o1,本地部署 DeepSeek-R1 大模型!

71次阅读
没有评论

共计 1700 个字符,预计需要花费 5 分钟才能阅读完成。

最近真的要和大家分享一波超燃的科技新发现!✨

一家叫 DeepSeek 的初创公司,经过多次技术迭代升级,终于推出了全新一代大模型——DeepSeek-V3!听说它的表现超级惊艳,功能一流到让人目瞪口呆😱。

更让人心动的是,DeepSeek还直接将他们的 DeepSeek R1 免费开源!这波操作一经发布,就在AI发烧友圈子里炸开了锅🔥。不只是在国内,海外的社交平台和技术论坛上,各路大神们纷纷点赞、连连称赞,简直是引爆了全球热议!

作为一个AI控,看到这么多免费又高效的技术福利,真的是忍不住种草了~如果你也对前沿科技充满好奇,那就快来一起体验这波AI革命吧!#DeepSeek #AI新突破 #开源福利 #科技种草

快来评论区聊聊你的看法吧!💬💕

性能对齐 OpenAI-o1 正式版

DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

 

免费开源!对标OpenAI-o1,本地部署 DeepSeek-R1 大模型!

本地部署,我们可以通过Ollama来进行安装

 

一、安装Ollama

1.官网地址

https://ollama.com/

免费开源!对标OpenAI-o1,本地部署 DeepSeek-R1 大模型!

二、安装一个可视化对话Chatbox或者Page Assist - 本地 AI 模型的 Web UI(二选一)

安装

https://chatboxai.app/

免费开源!对标OpenAI-o1,本地部署 DeepSeek-R1 大模型!

Web UI 控制端【点击安装免费开源!对标OpenAI-o1,本地部署 DeepSeek-R1 大模型!

 

大模型安装命令

 

1.5B Qwen DeepSeek R1
ollama run deepseek-r1:1.5b

7B Qwen DeepSeek R1
ollama run deepseek-r1:7b

8B Llama DeepSeek R1
ollama run deepseek-r1:8b

14B Qwen DeepSeek R1
ollama run deepseek-r1:14b

32B Qwen DeepSeek R1
ollama run deepseek-r1:32b

70B Llama DeepSeek R1
ollama run deepseek-r1:70b

2. 更多模型下载

DeepSeek-R1

模型 #总参数 #已激活参数 上下文长度 下载
DeepSeek-R1-Zero 671B 37B 128千 🤗 HuggingFace
DeepSeek-R1 671B 37B 128千 🤗 HuggingFace

DeepSeek-R1-Zero 和 DeepSeek-R1 基于 DeepSeek-V3-Base 进行训练。有关模型架构的更多详细信息,请参阅DeepSeek-V3存储库。

DeepSeek-R1-Distill 模型

模型 基础模型 下载
DeepSeek-R1-Distill-Qwen-1.5B Qwen2.5-Math-1.5B 🤗 HuggingFace
DeepSeek-R1-Distill-Qwen-7B Qwen2.5-Math-7B 🤗 HuggingFace
DeepSeek-R1-Distill-Llama-8B Llama-3.1-8B 🤗 HuggingFace
DeepSeek-R1-Distill-Qwen-14B Qwen2.5-14B 🤗 HuggingFace
DeepSeek-R1-Distill-Qwen-32B Qwen2.5-32B 🤗 HuggingFace
DeepSeek-R1-Distill-Llama-70B Llama-3.3-70B-Instruct 🤗 HuggingFace

DeepSeek-R1-Distill 模型基于开源模型进行了微调,使用了 DeepSeek-R1 生成的样本。我们对其配置和分词器进行了轻微更改。请使用我们的设置来运行这些模型。

正文完
 0
wudilad
版权声明:本站原创文章,由 wudilad 2025-01-31发表,共计1700字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)
验证码