复制成功
请遵守本站许可
REPORT
Chapter_Post // Field_Report

Post_Ref: RL-OLLAMA部署

2026.03.24

Ollama部署——8845HS、32G

Echo HaoRan
Echo HaoRan
ANALYSIS

简介:#

我的设备是机械革命 iminipro

  • cpu:8845hs
  • 内存:32G
  • 硬盘:990evo 1T
  • 系统:Ubuntu24.04

环境准备#

Docker#

PRTCL // SHELL
Terminal window
# 更新软件包索引
sudo apt update
# 安装 Docker 及其依赖
sudo apt install -y docker.io docker-compose-v2
# 启动并设置开机自启
sudo systemctl enable --now docker

配置用户权限#

PRTCL // SHELL
Terminal window
# 加入 Docker 组
sudo usermod -aG docker $USER
# 加入 GPU 访问组 ( 针对 AMD 核显 )
sudo usermod -aG render $USER
sudo usermod -aG video $USER

验证安装#

PRTCL // SHELL
Terminal window
docker --version
docker compose version

安装:#

AMD GPU 驱动与内核支持#

PRTCL // SHELL
Terminal window
# ========== AMD GPU 驱动与内核支持配置 ==========
# 更新软件包列表并安装 NUMA(非统一内存访问)开发库
sudo apt update && sudo apt install -y libnuma-dev
# 将当前用户加入 render 和 video 组以获得 GPU 访问权限
sudo usermod -aG render $USER
sudo usermod -aG video $USER

使用 Docker 部署 Ollama#

Docker 可以轻松管理显存映射,方便 Agent 调度

在你想要的目录下创建docker-compose.yml#

PRTCL // SHELL
Terminal window
version: '3.8' # Docker Compose 版本声明
services:
# --- Ollama 服务:AI 推理引擎主体 ---
ollama:
image: ollama/ollama:latest # 使用官方最新的 Ollama 镜像
container_name: ollama # 容器名称,方便后续通过 docker exec 调用
volumes:
- ./ollama:/root/.ollama # 将模型文件持久化存储在当前目录的 ollama 文件夹中
ports:
- "11434:11434" # 映射 11434 端口,允许宿主机或局域网访问 API
devices:
- "/dev/kfd:/dev/kfd" # AMD GPU 核心计算接口,必选
- "/dev/dri:/dev/dri" # 显卡渲染与显示接口,必选
restart: unless-stopped # 除非手动停止,否则始终自动重启(如机器开机自动运行)
environment:
# 针对 8845HS/780M 核显的关键黑科技:
# 由于 ROCm 可能不原生支持消费级 RDNA3 架构,强制指定版本号 11.0.2 开启加速
- HSA_OVERRIDE_GFX_VERSION=11.0.2
# 启用 Vulkan 实验性支持,提升在 Ubuntu 24.04 下的兼容性与显存利用率
- OLLAMA_VULKAN=1
# 允许跨域请求,防止 WebUI 访问时出现 403 错误
- OLLAMA_ORIGINS=*
# --- Open WebUI 服务:类似 ChatGPT 的交互界面 ---
open-webui:
image: ghcr.io/open-webui/open-webui:main # 使用 GitHub 官方源的镜像
container_name: open-webui
volumes:
- ./webui-data:/app/data # 持久化存储用户信息、聊天记录和 RAG 文档
ports:
- "3000:8080" # 映射到 3000 端口,浏览器访问 http://localhost:3000
environment:
# 容器间通信配置:
# 指向上面定义的 ollama 服务名,Docker 会自动解析为内网 IP
- 'OLLAMA_BASE_URL=http://ollama:11434'
# 用于加密本地数据库会话的密钥,建议保持默认或随意修改
- 'WEBUI_SECRET_KEY=imini_pro_8845hs_secret'
extra_hosts:
# 允许容器通过 host.docker.internal 访问宿主机服务
- "host.docker.internal:host-gateway"
depends_on:
- ollama # 确保 Ollama 引擎启动并准备好后,再启动 Web 界面
restart: unless-stopped

启动#

PRTCL // SHELL
Terminal window
docker compose up -d

若启动失败,配置 Docker 镜像源加速#

PRTCL // SHELL
Terminal window
sudo nano /etc/docker/daemon.json
  • 配置为以下内容
PRTCL // JSON
{
"registry-mirrors": [
"https://docker.m.daocloud.io",
"https://huecker.io",
"https://dockerhub.timeweb.cloud",
"https://noohub.ru"
]
}
  • 保存并重启
PRTCL // SHELL
Terminal window
sudo systemctl daemon-reload
sudo systemctl restart docker
  • 再次尝试拉取
PRTCL // SHELL
Terminal window
docker compose up -d

验证#

PRTCL // SHELL
Terminal window
docker logs ollama | grep -i "amdgpu"

如果看到类似 Detected AMD GPUusing ROCm 的字样,说明成功了。

  • 如果此处失败,在 bios 中调整显存至少到 8G
PRTCL // SHELL
Terminal window
docker ps

看到 ollama 容器启动则成功了。

  • 可以使用以下 ip+ 端口访问 WEBUI
PRTCL // SHELL
Terminal window
http://<IP>:3000/

监控#

PRTCL // SHELL
Terminal window
# 如果没安装就先安装:sudo apt install radeontop
sudo radeontop

可以使用 radeontop 进行监控Graphics PipeMemory Controller 的百分比。如果数值在跳动,说明 GPU 正在参与计算。

拉取模型#

此处使用 qwen2.514b 量化

PRTCL // SHELL
Terminal window
docker exec -it ollama ollama run qwen2.5:14b

常用模型推荐#

PRTCL // SHELL
Terminal window
#Qwen 2.5 7B ( 最推荐的生产力工具 )
docker exec -it ollama ollama run qwen2.5:7b
#Llama 3.1 8B ( 国际通用标准 )
docker exec -it ollama ollama run llama3.1:8b
#Mistral NeMo 12B ( 平衡之选 )
docker exec -it ollama ollama run mistral-nemo
#GLM-4 9B ( 中文长文本专家 )
docker exec -it ollama ollama run glm4
R P
Rhine Lab Pioneer Division
Auth_Verified: 2026.03.24
// END OF POST

订阅

通过 RSS 订阅本站,新文章发布时第一时间收到通知。

Follow
Classified
Chapter_06
Protocol_Ref: CC-BY-NC-SA-4.0

Ollama部署——8845HS、32G

Author: CHONGXIReleased: 2026.03.24

Licensed under CC BY-NC-SA 4.0

评论

© 2025-2026 EchoSpace
Powered by Astro & echohaoran Non-Collaborative_Entity // Protocol_V.4.21