以下是基于2核4G云服务器部署DeepSeek的两种主流方案:
方案一:基于Dify平台的企业级部署(推荐)
-
环境准备
-
部署Dify框架
执行以下Docker命令部署Dify服务:docker run -d --name dify \
-p 80:80 \
-v /data/dify:/app/data \
-e DIFY_OPENAI_API_KEY=your_deepseek_key \
dify.ai/dify-server:latest
需替换
your_deepseek_key
为实际API密钥1。 -
配置DeepSeek模型与工作流
- 访问Dify控制台(
http://服务器IP
),创建新应用并选择模型「DeepSeek-R1-16K」1。 - 上传业务文档(如合同文件),启用「父子分割 + 向量检索」优化知识库1。
- 设置触发关键词(如“合同审查”)关联自动化模板,实现风险分析、报告生成等流程1。
- 访问Dify控制台(
方案二:轻量化部署(适合个人/测试)
-
基础环境配置
- 安装Ollama:通过脚本快速安装工具链:
curl -fsSL https://ollama.com/install.sh | sh
并下载DeepSeek-R1模型:
ollama run deepseek-r1:1.5b
```:ml-citation{ref="2,8" data="citationList"}
- 安装Ollama:通过脚本快速安装工具链:
-
虚拟内存扩展(防止内存不足)
- 创建Swap文件(建议4GB):
sudo fallocate -l 4G /swapfile
sudo chmod 600 /swapfile
sudo mkswap /swapfile
sudo swapon /swapfile
修改
/etc/fstab
文件实现开机自动挂载2。
- 创建Swap文件(建议4GB):
-
部署Web交互界面
- 使用Docker运行Open WebUI:
docker run -d --name webui -p 8080:8080 --gpus all -v ollama:/root/.ollama ghcr.io/open-webui/open-webui:main
访问
http://服务器IP:8080
即可通过可视化界面调用模型28。
- 使用Docker运行Open WebUI:
注意事项
- 性能优化:实际推理时内存消耗较高,建议通过模型量化(如4-bit)降低资源占用7。
- 安全组配置:确保云服务器防火墙开放80/8080等必要端口27。
- 备份方案:若服务器性能不足,可参考华为昇腾一体机或腾讯云HAI服务实现弹性扩容45。