DeepSeek应用与部署
山东大学经济学院 教授
山东大学国家治理研究院 研究员
李铁岗
听听真我数字人讲DeepSeek
AIGC发展历程
AIGC 2014-2024
自然语言处理与语言模型
大语言模型LLM:2018 —2024
DeepSeek介绍
DeepSeek:2023 —
DeepSeek:技术创新——模型架构 | V2
(Multi-Head Latent Attention)
DeepSeek:技术创新—模型架构 | V3
DeepSeek:技术创新—推理模型 | RL
PPO:Proximal Policy Optimization
GRPO:Group Relative Policy Optimization
强化学习让智能体(Agent)在环境
(Environment)中不断尝试、学习,并优化自己
的策略(Policy),最终获得最大化的奖励
(Reward)。
DeepSeek应用场景
DeepSeek的能力层级
• 1. 基础能力层 多模态数据融合与结构化理解,包括跨模态语义对齐(文本、图像、音频、视频、代
码、传感器数据统一语义)和动态数据治理(解决数据缺失、噪音干扰、概念飘逸等),支持200多
种数据格式自动解析。
• 2. 中级能力层 领域问题建模与复杂推理,包括领域自适应学习(建立医、教育、金融垂直应用于
模型)、因果推理引擎(建立因果图模型)和多目标优化决策(求解帕 累托最有解)。
• 3. 高级能力层 复杂系统建模与自主决策,包括数字孪生仿真系统(构建物理于数字融合虚拟环境
模拟天气等)、多智能体协同优化(将每个个体作为智能体通过联邦学习模拟群体行为)和元认知调
控机制(实施监控自身决策、动态分配资源、自动触发行为)。
• 4. 终极能力层 自主进化与创造性突破,包括概念空间探索(通过对抗网络探索新合金成分等)、
范式转移预警(监控跨领域知识流、识别技术革命前兆)和自编程能力(自动模块设计、代码编写、
测试用例)。
Deepseek R1Deepseek V3
Deepseek r1鞅的证明
Deepseek r1 Roy安全准则组合模型推理
Deepseek r1推理玻尿酸配方
DeepSeek提示词工程
提示词工程
Deepseek十类提示词
• 1. 内容生成类 :文本生成、代码生成、创 • 6. 系统操作类:模式切换、资源优化、记
意生成和数据模拟。 忆管理。
• 2. 信息处理类 :文本摘要、信息抽取、 • 7. 知识查询类:事实核查、概念解释、溯
情感分析和多语言翻译。 源检索。
• 3. 对话交互类 :角色扮演、多轮对话、 • 8. 教育与研究类:题目生成、论文润色、
反问引导。 实验设计。
• 4. 技能应用类 :数学计算、代码解释、 • 9. 多模态处理类:图文互译、表格解析、
逻辑推理。 视频脚本。
• 5. 个性化定制类 :风格迁移、知识库绑 • 10. 伦理与安全类:内容审核、价值观对
定、偏好记忆。 齐、风险预警。
DeepSeek部署方案
Deepseek部署全线图
Deepseek
移动手机应用 本地部署蒸馏小模型 第三方UI客户管接入服务 云端网站接入服务
DeepseeK替代部署方案
• 本地部署蒸馏小模型:可通过ollama平台、LM Studio平台快速本地部署基于Llama和Qwen蒸馏的
DeepSeek - R1推理模型,涵盖多种不同参数规模,适合想在本地运行模型的用户。
• 第三方UI客户管接入服务:可通过Anything LLM、Cherry Studio、Chatbox等选择API接入。
• 秘塔AI搜索:接入满血版DeepSeek - R1推理模型,无广告且搜索结果直达。以学习JDK21新特性为
例,能详细给出学习计划,包括快速预览、深入学习核心特性、实战与总结等阶段。
• 硅基流动:注册即送2000万Tokens,提供多个基于DeepSeek - R1蒸馏训练的模型,如DeepSeek -
R1 - Distill - Llama - 70B等,在推理能力上表现出色。
• 阿里云百炼:提供多个DeepSeek系列模型,如DeepSeek - V3、DeepSeek - R1 - Distill - Qwen -
等,部分限时免费,涵盖文本生成等功能。
• 百度智能云:千帆ModelBuilder全面支持DeepSeek - R1/V3调用,且限时免费,其模型在百科知识、
数学推理等任务表现突出。
• 英伟达:可通过特定接口调用DeepSeek - R1 671B全量模型,获取API Key后能进行相关操作。
DeepSeek API调用
API 调用方法
• DeepSeek API
model='deepseek-chat' 即可调用 DeepSeek-V3
model='deepseek-reasoner',即可调用 DeepSeek-R1。
Token 用量计算
• token 是模型用来表示自然语言文本的基本单位,也是我们的计费单元,可
以直观的理解为“字”或“词”;通常 1 个中文词语、1 个英文单词、1 个数字
或 1 个符号计为 1 个 token。
• 一般情况下模型中 token 和字数的换算比例大致如下:
• 1 个英文字符 ≈ 个 token。
• 1 个中文字符 ≈ 个 token。
• 但因为不同模型的分词不同,所以换算比例也存在差异,每一次实际处理
token 数量以模型返回为准,您可以从返回结果的 usage 中查看。
阿里云部署Deepseek
以 DeepSeek-R1 满血版为例进行演示,通过百炼模型服务进行 DeepSeek 开源模型调用,可以根
据实际需求选择其他参数规模的 DeepSeek 模型。百炼平台的 API 提供标准化接口,无需自行搭建
模型服务基础设施,且具备负载均衡和自动扩缩容机制,保障 API 调用稳定性。搭配 Chatbox 可视
化界面客户端,进一步简化了调用流程,无需在命令行中操作,通过图形化界面即可轻松配置和使用
DeepSeek 模型。
DeepSeek
DeepSeek
DeepSeek-R1-
-R1 DeepSeek-V3
DeepSeek-R1-
Ditill-Qwen-14B
DeepSeek-R1-
Ditill-Qwen-32B
DeepSeek-R1-
Ditill-Qwen-7B
DeepSeek-R1-
Ditill-Ollama-7B
DeepSeek-R1-
Distill-Ollama-7B
腾讯云部署流程
• Cloud Studio:登录腾讯云官网,进入Cloud Studio,可一键部署,即开即用,能快速体验7B以下
DeepSeek - R1蒸馏模型。
• 云原生构建:登录腾讯云,云原生构建相关服务,一键体验DeepSeek,无需等待下载,支持
• TI平台:登录腾讯云TI平台,提供专属算力、多种尺寸模型、0代码模型部署等功能。
• HAI:登录腾讯云HAI控制台,新建DeepSeek - R1应用,创建完成后可通过站内信获取密码,选择可视化
界面(ChatbotUI)或命令行(JupyterLab)直接调用DeepSeek - R1模型。
• 云应用:登录腾讯云找到云应用服务,直接购买成品DeepSeek应用,或利用云应用定制化软件功能,快速
部署AI应用或定制传统软件。
• 搜索方案:大模型知识引擎:注册并登录腾讯云,在控制台搜索“大模型知识引擎” 体验”开通服务。新
建应用并配置基础信息,选择DeepSeek - R1/V3模型,即可在右侧调试窗口提问搜索。
• API接口:申请腾讯云DeepSeek API接口,获取API Key后,可在自己的应用或程序中通过调用API来实现
DeepSeek模型的搜索功能。
腾讯云API调用
开发者首选,DeepSeek部署简单、直观、高效!
HAI 提供 GPU 算力和 ollama 环境,支持 , 7B, 8B, 32B 等多个 DeepSeek-R1 蒸馏模型。
企业级首选,DeepSeek部署稳定、安全、易用!
腾讯云智能全栈AI服务上架DeepSeek系列模型
创建应用
华为云+silconflow
通过创建API key 调用
邀请码:z0sI0urY
邀请链接:
华为云模型微调
u对话模型微调
u生图模型微调
模型微调工程
DeepSeek:推理模型 | 推理能力蒸馏
学生模型
DeepSeek 蒸馏模型
老师模型
模型蒸馏工程
老师模型和学生模型
小模型:相当于一枚小学生,知识面非常有限,但是胜在没
教授那么大谱,给个板凳坐着就够了(部署成本低,推理成
本低)。
大模型:像一位见多识广、知识储备庞大的“大教
授”,无所不知,但是“供养”他很贵。
什么是模型蒸馏?
“模型蒸馏”就是把大模型学到的本领,用“浓缩”的方式教给小模型的过程,在保证一定精度的
同时,大幅降低运算成本和硬件要求。
模型蒸馏
• 蒸馏是一种机器学习技术,其中较小的模型(“学生模型”)被训练来模仿
较大、预训练模型(“教师模型”)的行为。
• 1. 数据蒸馏 在数据蒸馏中,教师模型生成合成数据或伪标签,然后这些数据用于训练学生
模型。
• 2. Logits蒸馏 在logits蒸馏中,学生模型被训练来匹配教师模型的logits,而不仅仅是最
终的预测。这种方法保留了更多关于教师模型置信水平和决策过程的信息。
• 3. 特征蒸馏 特征蒸馏涉及将教师模型中间层的知识转移到学生模型中。通过对齐两个模
型的隐藏表示,学生模型可以学习到更丰富和更抽象的特征。
蒸馏、微调、RAG
微调:又叫精调,相当于学生意识到自己某门课有短
板,然后自己找参考书恶补了一下,从而补上短板。
蒸馏:是学生通过模仿老师的解题思路,达到和老师
相似的知识水平。
蒸馏、微调、RAG
RAG:直译过来叫做“检索增强生成”。相当于这题我不会,但是我有“小抄”,我回
答的时候,就看一眼小抄,然后再综合我脑子里的已有知识,进行回答。
DeepSeek本地部署
DeepSeek本地部署-硬件环境准备
1. GPU要求 2. 系统要求
推荐NVIDIA显卡(RTX 3090/4090/A100等)
显存要求:
Linux(Ubuntu +)或 Windows WSL2
Python +,推荐使用Anaconda/Miniconda
管理环境
■ 7B模型:至少16GB显存
■ 13B/20B模型:至少24GB显存
■ 70B模型:需多卡并行(如2xA100)
支持CUDA + 和 cuDNN +
DeepSeek本地部署-部署办法
方法1:使用Hugging Face Transformers 方法2:使用vLLM加速推理
方法3:Docker部署
Anything LLM接入
• 下载安装• 打开官网,根据自己的系统选择下载对应的版本。
• • 安装文件,按照安装向导的提示进行操作,默认路径安装或修改默认安装路径都可以。安装完成后,点击完成自动跳转
到AnythingLLM界面。
• 模型配置• LLM Selection(大语言模型选择):选择Ollama,如果本地已通过Ollama部署了DeepSeek等模型,
AnythingLLM会自动检测。这意味着模型和聊天记录仅在运行Ollama模型的机器上可访问,保证了数据的安全性和隐私
性。• Embedding Preference(嵌入偏好):使用AnythingLLM Embedder嵌入工具,文档文本会在AnythingLLM的
实例上私密嵌入,文本数据的处理和转换在本地进行,不会泄露给第三方。• Vector Database(向量数据库):使用
LanceDB作为向量数据库,向量和文档文本都存储在AnythingLLM实例上,进一步确保数据的私密性和安全性。
• 接入DeepSeek模型• 通过Ollama接入:先在本地通过Ollama部署DeepSeek模型,然后在AnythingLLM中选择
Ollama作为语言模型推理后端,AnythingLLM会自动连接到本地Ollama服务中的DeepSeek模型。• 通过DeepSeek R1
API接入:在AnythingLLM工作区右侧点击设置,选择聊天设置,更改LLM模型为DeepSeek,输入API Key并选择
DeepSeek R1模型,点击更新工作区即可。
• 搭建本地知识库• 在AnythingLLM左侧工作区找到上传按钮,选中要上传的文档,点击移动到工作区,再点击“Save
and Embed”,对文档进行切分和词向量化。• 完成后,点击图钉按钮,将文档设置为当前对话的背景文档,即可在聊
天窗口基于上传的文档内容与模型进行对话。
本地部署方法
ØOllama+Deepseek 下载模型Ollama
LM Studio
DeepSeek模型
ØLM Studio+DeepSeek
ØAnything LM+Ollama+Deepseek +向量模型(Embessing Model)
ØDify +Ollama +Deepseek+向量模型(Embessing Model)
调用模型 下载模型Anything LM
Dify
Ollama
LM Studio
DeepSeek模型
Ollama
u下载Ollama
u运行Ollama
u运行Ollama run deepseek-r1
LM Studio本地部署
• 前期准备:确保设备满足一定硬件要求,显卡需GTX 1060(6GB)及以上,推荐
RTX3060及以上;内存8GB及以上,推荐16GB及更高;C盘剩余20GB空间,建议
使用NVMe固态硬盘 。
• 安装LM Studio客户端:在官网下载对应操作系统的安装包,双击运
行并按提示完成安装。启动后,点击右下角设置图标将语言改为简体中文。
• 加载模型:自行下载获取模型,下载到本地后,点击左上方文件夹图标选择模型目
录导入;若不会找模型,可在LM Studio的设置里,勾选“Use LM Studio's
Hugging Face”,再点击左上方搜索图标搜索deepseek选择模型。注意参数规模
不同,性能和硬件需求有差异。例如,适合体验尝鲜,7B适合普通创作及开
发测试,8B适合对内容要求更高的场景,14B适合专业及深度内容创作。
LM Studio+DeepSeek
LM Studio可以通
过huggaface下载
Deepseek各种蒸
馏模型(GGUF)
DeepSeek UI客户端使用
Anything LM+Ollama+Deepseek
LLM首选项
向量数据库
Embedder首选项
文本分割
RAG数据库工程
RAG中的Embedding模型
Embedding模型贯穿RAG流程多环节
Cherry LM+DeepSeek API
大模型智能体工程
五大 AI Agent 多智能体开发框架
微软AutoGen: CrewAI
Github 地址: Github 地址: 微软Magentic-One
Github 地址:
main/python/packages/autogen-magentic-
one
OpenAI Swarm:LangGraph:
Github 地址: 地址:
DeepSeek业务流应用
DeepSeek业务流应用
• Coze+Deepseek API(Deepseep R1)业务流
• Dify+Deepseek API搭建本地知识库
• Langchain+Deepseek API
业务流工程
2025七款RAG
• 5. deepset的Haystack• 1. R2R:官网:
• 官网: 功能:用于开发本地RAG应用程序,支持多模态内容摄取、
混合搜索、知识图谱构建、GraphRAG,具备用户管理、可
观测性、配置及可视化交互等功能,适用于处理动态数据和
复杂实体关系的应用程序。
• 功能:用于构建基于NLP的搜索和问答系统,提供模块化架
构、多模型支持、高效检索、问答功能,可扩展性强,适用
于问答系统和文档检索应用。
• 2. Cognita:官网: • 6. LlamaIndex
• 功能:模块化框架,提供定制化管道,用于构建可扩展且生 • 官网:
产就绪的RAG应用程序,适合企业大规模AI应用。
• • 功能:简化外部知识库与LLM的集成,支持动态数据摄取和
• 3. LLMWare:官网: 自定义索引,可与多种预训练语言模型配合使用。
• 功能:提供统一框架构建基于LLM的应用,如RAG和代理,
包含RAG Pipeline和50 + 小型专用模型,适用于定制特定领
域解决方案。
• 7. txtai
• GitHub主页:
• 功能:一体化嵌入数据库,提供自然语言搜索、可自定义管
道,具备轻量级高效的特点,适合快速设置和有强大搜索需
求的项目。
• 4. LangChain:官网:
• •功能:构建于大语言模型之上,通过链式调用组合组件,简
化开发者与语言模型交互,可用于构建问答系统等,支持与
多种数据源集成。
DeepSeek 赋能各行业的应用场景
• 1. DeepSeek赋能酒企场景
- 市场分析与消费者洞察
- 智能营销与个性化推荐
- 生产优化与质量控制
- 供应链管理与库存优化
- 品牌故事与文化传播
- 智能客服与消费者互动
- 新品研发与口味预测
• 2. DeepSeek赋能房产装修
- 智能设计与方案生成
- 虚拟现实(VR)与增强现实(AR)
体验
- 施工进度管理与优化
- 材料采购与供应链优化
- 客户需求分析与个性化服务
- 智能客服与售后支持
- 装修质量检测与问题预测
- 市场趋势分析与营销策略优化
xu
• 3. DeepSeek赋能知识产权服务
- 专利检索与分析
• 4. DeepSeek赋能金融行业
- 智能投顾与投资分析
- 风险管理与欺诈检测
- 客户服务与智能客服
- 信用评分与贷款审批
- 市场趋势分析与预测
- 自动化交易与算法交易
- 金融产品设计与定价
- 合规管理与报告生成
- 侵权检测与风险评估
- 知识产权法律咨询
- 专利撰写与优化
- 知识产权交易与估值
- 知识产权管理与监控
- 知识产权培训与教育
- 知识产权战略规划
• 5. DeepSeek赋能跨境贸易
- 市场分析与需求预测
- 供应链优化与物流管理
- 跨境支付与汇率风险管理
- 合规管理与海关申报
- 多语言客户服务与沟通
- 贸易伙伴匹配与谈判支持
- 风险管理与信用评估
- 跨境电商营销与推广
• 6. DeepSeek赋能健康医美
- 个性化治疗方案设计
- 客户管理与智能咨询
- 市场分析与需求预测
- 治疗效果预测与优化
- 智能营销与个性化推荐
- 健康数据管理与分析
- 医美产品设计与优化
- 合规管理与报告生成
• 7. DeepSeek赋能智库咨询机构
- 智能研究与数据分析
- 政策分析与预测
- 行业趋势分析与市场预测
- 智能报告生成与优化
- 客户服务与智能咨询
- 知识管理与信息检索
- 多语言支持与跨文化分析
- 风险管理与决策支持
谢 谢!
幻灯片 1
幻灯片 2
幻灯片 3
幻灯片 4
幻灯片 5
幻灯片 6
幻灯片 7
幻灯片 8
幻灯片 9
幻灯片 10
幻灯片 11
幻灯片 12
幻灯片 13
幻灯片 14
幻灯片 15
幻灯片 16
幻灯片 17
幻灯片 18
幻灯片 19
幻灯片 20
幻灯片 21
幻灯片 22
幻灯片 23
幻灯片 24
幻灯片 25
幻灯片 26
幻灯片 27
幻灯片 28
幻灯片 29
幻灯片 30
幻灯片 31
幻灯片 32
幻灯片 33
幻灯片 34
幻灯片 35
幻灯片 36
幻灯片 37
幻灯片 38
幻灯片 39
幻灯片 40
幻灯片 41
幻灯片 42
幻灯片 43
幻灯片 44
幻灯片 45
幻灯片 46
幻灯片 47
幻灯片 48
幻灯片 49
幻灯片 50
幻灯片 51
幻灯片 52
幻灯片 53
幻灯片 54
幻灯片 55
幻灯片 56
幻灯片 57
幻灯片 58
幻灯片 59
幻灯片 60
幻灯片 61
幻灯片 62
幻灯片 63
幻灯片 64
幻灯片 65
幻灯片 66
幻灯片 67
幻灯片 68
幻灯片 69
幻灯片 70
幻灯片 71
幻灯片 72
幻灯片 73
幻灯片 74
幻灯片 75
幻灯片 76
幻灯片 77
幻灯片 78
幻灯片 79
幻灯片 80
幻灯片 81