以下是基于2核4G云服务器部署DeepSeek的两种主流方案:


方案一:基于Dify平台的企业级部署(推荐)

  1. 环境准备

    • 服务器配置:2核4G云服务器(没有的同学可以点击这里立即购买
    • 系统依赖:安装Docker(版本≥20.10)
    • 密钥申请:从DeepSeek官网获取API Key‌1
  2. 部署Dify框架
    执行以下Docker命令部署Dify服务:

    docker run -d --name dify \
    -p 80:80 \
    -v /data/dify:/app/data \
    -e DIFY_OPENAI_API_KEY=your_deepseek_key \
    dify.ai/dify-server:latest

    需替换your_deepseek_key为实际API密钥‌1

  3. 配置DeepSeek模型与工作流

    • 访问Dify控制台(http://服务器IP),创建新应用并选择模型「DeepSeek-R1-16K」‌1
    • 上传业务文档(如合同文件),启用「父子分割 + 向量检索」优化知识库‌1
    • 设置触发关键词(如“合同审查”)关联自动化模板,实现风险分析、报告生成等流程‌1

方案二:轻量化部署(适合个人/测试)

  1. 基础环境配置

    • 安装Ollama:通过脚本快速安装工具链:
      curl -fsSL https://ollama.com/install.sh | sh

      并下载DeepSeek-R1模型:

      ollama run deepseek-r1:1.5b
      ```‌:ml-citation{ref="2,8" data="citationList"}
       

  2. 虚拟内存扩展(防止内存不足)

    • 创建Swap文件(建议4GB):
      sudo fallocate -l 4G /swapfile
      sudo chmod 600 /swapfile
      sudo mkswap /swapfile
      sudo swapon /swapfile

      修改/etc/fstab文件实现开机自动挂载‌2

  3. 部署Web交互界面

    • 使用Docker运行Open WebUI:
      docker run -d --name webui -p 8080:8080 --gpus all -v ollama:/root/.ollama ghcr.io/open-webui/open-webui:main

      访问http://服务器IP:8080即可通过可视化界面调用模型‌28


注意事项

  • 性能优化‌:实际推理时内存消耗较高,建议通过模型量化(如4-bit)降低资源占用‌7
  • 安全组配置‌:确保云服务器防火墙开放80/8080等必要端口‌27
  • 备份方案‌:若服务器性能不足,可参考华为昇腾一体机或腾讯云HAI服务实现弹性扩容‌45

阿, 信

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?fb36374b73e574f866fcdc680ade9f22"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })();