ANALYSIS
简介:
我的设备是机械革命 iminipro
- cpu:8845hs
- 内存:32G
- 硬盘:990evo 1T
- 系统:Ubuntu24.04
环境准备
Docker
PRTCL // SHELL
# 更新软件包索引sudo apt update
# 安装 Docker 及其依赖sudo apt install -y docker.io docker-compose-v2
# 启动并设置开机自启sudo systemctl enable --now docker配置用户权限
PRTCL // SHELL
# 加入 Docker 组sudo usermod -aG docker $USER
# 加入 GPU 访问组 ( 针对 AMD 核显 )sudo usermod -aG render $USERsudo usermod -aG video $USER验证安装
PRTCL // SHELL
docker --versiondocker compose version安装:
AMD GPU 驱动与内核支持
PRTCL // SHELL
# ========== AMD GPU 驱动与内核支持配置 ==========# 更新软件包列表并安装 NUMA(非统一内存访问)开发库sudo apt update && sudo apt install -y libnuma-dev# 将当前用户加入 render 和 video 组以获得 GPU 访问权限sudo usermod -aG render $USERsudo usermod -aG video $USER使用 Docker 部署 Ollama
Docker 可以轻松管理显存映射,方便 Agent 调度
在你想要的目录下创建docker-compose.yml
PRTCL // SHELL
version: '3.8' # Docker Compose 版本声明
services: # --- Ollama 服务:AI 推理引擎主体 --- ollama: image: ollama/ollama:latest # 使用官方最新的 Ollama 镜像 container_name: ollama # 容器名称,方便后续通过 docker exec 调用 volumes: - ./ollama:/root/.ollama # 将模型文件持久化存储在当前目录的 ollama 文件夹中 ports: - "11434:11434" # 映射 11434 端口,允许宿主机或局域网访问 API devices: - "/dev/kfd:/dev/kfd" # AMD GPU 核心计算接口,必选 - "/dev/dri:/dev/dri" # 显卡渲染与显示接口,必选 restart: unless-stopped # 除非手动停止,否则始终自动重启(如机器开机自动运行) environment: # 针对 8845HS/780M 核显的关键黑科技: # 由于 ROCm 可能不原生支持消费级 RDNA3 架构,强制指定版本号 11.0.2 开启加速 - HSA_OVERRIDE_GFX_VERSION=11.0.2 # 启用 Vulkan 实验性支持,提升在 Ubuntu 24.04 下的兼容性与显存利用率 - OLLAMA_VULKAN=1 # 允许跨域请求,防止 WebUI 访问时出现 403 错误 - OLLAMA_ORIGINS=*
# --- Open WebUI 服务:类似 ChatGPT 的交互界面 --- open-webui: image: ghcr.io/open-webui/open-webui:main # 使用 GitHub 官方源的镜像 container_name: open-webui volumes: - ./webui-data:/app/data # 持久化存储用户信息、聊天记录和 RAG 文档 ports: - "3000:8080" # 映射到 3000 端口,浏览器访问 http://localhost:3000 environment: # 容器间通信配置: # 指向上面定义的 ollama 服务名,Docker 会自动解析为内网 IP - 'OLLAMA_BASE_URL=http://ollama:11434' # 用于加密本地数据库会话的密钥,建议保持默认或随意修改 - 'WEBUI_SECRET_KEY=imini_pro_8845hs_secret' extra_hosts: # 允许容器通过 host.docker.internal 访问宿主机服务 - "host.docker.internal:host-gateway" depends_on: - ollama # 确保 Ollama 引擎启动并准备好后,再启动 Web 界面 restart: unless-stopped启动
PRTCL // SHELL
docker compose up -d若启动失败,配置 Docker 镜像源加速
PRTCL // SHELL
sudo nano /etc/docker/daemon.json- 配置为以下内容
PRTCL // JSON
{ "registry-mirrors": [ "https://docker.m.daocloud.io", "https://huecker.io", "https://dockerhub.timeweb.cloud", "https://noohub.ru" ]}- 保存并重启
PRTCL // SHELL
sudo systemctl daemon-reloadsudo systemctl restart docker- 再次尝试拉取
PRTCL // SHELL
docker compose up -d验证
PRTCL // SHELL
docker logs ollama | grep -i "amdgpu"如果看到类似 Detected AMD GPU 或 using ROCm 的字样,说明成功了。
- 如果此处失败,在 bios 中调整显存至少到 8G
PRTCL // SHELL
docker ps看到 ollama 容器启动则成功了。
- 可以使用以下 ip+ 端口访问 WEBUI
PRTCL // SHELL
http://<IP>:3000/监控
PRTCL // SHELL
# 如果没安装就先安装:sudo apt install radeontopsudo radeontop可以使用 radeontop 进行监控Graphics Pipe 或 Memory Controller 的百分比。如果数值在跳动,说明 GPU 正在参与计算。
拉取模型
此处使用 qwen2.514b 量化
PRTCL // SHELL
docker exec -it ollama ollama run qwen2.5:14b常用模型推荐
PRTCL // SHELL
#Qwen 2.5 7B ( 最推荐的生产力工具 )docker exec -it ollama ollama run qwen2.5:7b
#Llama 3.1 8B ( 国际通用标准 )docker exec -it ollama ollama run llama3.1:8b
#Mistral NeMo 12B ( 平衡之选 )docker exec -it ollama ollama run mistral-nemo
#GLM-4 9B ( 中文长文本专家 )docker exec -it ollama ollama run glm4R P
Rhine Lab Pioneer Division
Auth_Verified: 2026.03.24
Auth_Verified: 2026.03.24
