在本地使用Ollama运行Deepseek模型指南 @ 胡巴 | 星期一，四月 14 日，2025 年 | 3 分钟阅读 | 更新于星期一，四月 14 日，2025 年

在人工智能快速发展的今天，越来越多的人希望能在本地运行强大的AI模型。本文将为您详细介绍如何使用Ollama在本地部署和运行Deepseek模型，让您能够在保护隐私的同时享受AI带来的便利。

什么是Ollama？

Ollama是一个开源的模型运行框架，它让在本地运行各种大语言模型变得异常简单。它的主要特点包括：

简单的安装和使用流程
支持多种流行的开源模型
优秀的性能优化
完善的API接口

什么是Deepseek？

Deepseek是一个由深度求索（Deepseek）公司开发的大语言模型系列，包括：

Deepseek-7B
Deepseek-67B
Deepseek-Coder系列

这些模型在各自的领域都展现出了优秀的性能，特别是在代码生成和理解方面。

安装步骤

1. 安装Ollama

首先，我们需要在本地安装Ollama。根据您的操作系统，选择相应的安装方法：

Windows用户

winget install Ollama.Ollama

MacOS用户

curl -fsSL https://ollama.com/install.sh | sh

Linux用户

curl -fsSL https://ollama.com/install.sh | sh

2. 下载Deepseek模型

安装完Ollama后，使用以下命令下载Deepseek模型：

# 下载基础模型
ollama pull deepseek-coder

# 或下载特定版本
ollama pull deepseek-coder:7b

使用方法

1. 命令行交互

启动模型进行交互很简单：

ollama run deepseek-coder

2. API调用

Ollama提供了简单的REST API，您可以通过HTTP请求与模型交互：

import requests

# 发送请求
response = requests.post('http://localhost:11434/api/generate', 
    json={
        'model': 'deepseek-coder',
        'prompt': '写一个Python的Hello World程序'
    }
)

# 获取响应
print(response.json()['response'])

性能优化建议

显存管理
- 为模型分配足够的显存
- 适当调整batch size
CPU使用
- 确保系统有足够的CPU资源
- 考虑使用量化版本的模型
硬件要求
- 最低8GB内存
- 推荐使用支持CUDA的显卡
- SSD存储以提升加载速度

常见问题解答

模型加载失败怎么办？
- 检查系统资源是否充足
- 验证模型文件是否完整
- 确认Ollama服务是否正常运行
生成速度慢怎么优化？
- 使用量化版本的模型
- 调整生成参数
- 考虑升级硬件配置
如何保存对话历史？
- 使用Ollama的内置历史记录功能
- 自行实现存储机制
- 使用第三方工具管理

结语

通过Ollama运行Deepseek模型是一个非常实用的解决方案，它既保证了数据的私密性，又提供了灵活的使用方式。随着硬件性能的提升和模型的优化，相信这种本地部署的方案会越来越受欢迎。

希望这篇教程能帮助您成功在本地部署和使用Deepseek模型。如果您在使用过程中遇到任何问题，欢迎在评论区留言讨论。

捐赠

感谢老板请我喝杯咖啡！Thank you for buying me a coffee!

WeChat	AliPay	PayPal
		PayPal

公众号: 无限递归

alt 搜索公众号:无限递归

2022.5 - 2025-08-08
- 公司：乐府互娱
- 职位：高级平台服务器开发工程师
- 荣誉：
  - 得到公司Leader的高度认可
- 所作所为：
  - 优化SDK接入流程，提升接入效率：通过重构SDK后端接入代码，提炼接入模板，显著提升接入时间，由7天缩短到4天
  - 参与公司两款游戏大推，保障SDK服务稳定：通过大推前代码持续review，大推前压测，发现问题并及时修复，设计告警机制，包括飞书及时告警及grafana监控告警及时发现服务问题并修复上线，保障大推期间服务稳定。同时能够和游戏研发、游戏运营、游戏运维团队保持紧密配合，保障大推期间服务稳定
  - 推动cursor在项目组内的应用，提升开发效率：通过AI工具分享，实战演示等，提升项目组内AI工具使用率，进而提升整个项目组开发效率，使IOS开发再也不惧怕Unity开发
  - 利用n8n搭建数据查询助手，提升财务工作效率：利用n8n+AI搭建了对账查询工作流，免去了财务与技术的沟通成本，至少使双方每月沟通时间成本减少2小时
  - 参与公司千目广告系统的开发及维护，提升广告系统稳定性，为公司发行买量业务保驾护航：异步任务优化
2019.6 - 2022.4
- 公司：萌推（上海突进网络科技有限公司）
- 职位：中级PHP工程师 & 初级golang工程师
- 荣誉：
  - 绩效A连续得主
  - 月度之星
  - 优秀个人奖
- 所作所为：
  - 利用ES优化OMS、MMS管理系统商品列表查询
  - 利用消息队列、Redis、乐观锁优化商品审核流程
  - 利用Redis对商家端接口进行有效限流
  - 优化商品相关表索引，提升SQL查询速度
  - 商品中台构建，统一商品相关操作
  - 大表优化（数据分离、分表、大字段拆分）
  - 掌握所有商品核心流程
2018.5 - 2019.5
- 公司：DaDa英语（上海卓赞教育信息科技有限公司）
- 职位：中级PHP开发工程师
- 荣誉：无
- 所作所为：
  - 利用ES优化教师CMS系统统计数据接口至500ms内
  - 工单系统开发及持续优化
  - 教师CMS系统的功能开发及持续优化
2018.3 - 2018.5
- 公司：波奇（上海）信息科技有限公司
- 职位：初级PHP开发工程师
- 荣誉：同下
- 所做作为：如下
2016.7 - 2018.3
- 公司：光橙（上海）信息科技有限公司
- 职位：初级PHP开发工程师
- 荣誉：
  - 年度最佳进步奖
- 所作所为：
  - 利用Redis提升商详接口最佳响应速度至50ms内
  - 利用Redis提升双11活动页可承受QPS至500以上
  - 利用Redis对接口进行简单限流
  - 与小伙伴合作提升搜索质量（ES初识）
  - 其他C端接口的开发及优化
  - B端商城老页面的维护及优化

在本地使用Ollama运行Deepseek模型指南 @ 胡巴 | 星期一，四月 14 日，2025 年 | 3 分钟阅读 | 更新于星期一，四月 14 日，2025 年

什么是Ollama？

什么是Deepseek？

安装步骤

1. 安装Ollama

Windows用户

MacOS用户

Linux用户

2. 下载Deepseek模型

使用方法

1. 命令行交互

2. API调用

性能优化建议

常见问题解答

结语

捐赠

公众号: 无限递归

BoBo`s Blog每天进步一点点，能多一点是一点

联系方式

博客地址

公众号

编程语言

数据库

消息中间件

文档撰写

技术框架

搜索引擎

抓包工具