如何使用本地模型连接Openclaw

概述#

OpenClaw 是一个开源的个人 AI 助理平台，支持多种模型提供商，包括云端模型（OpenAI、Claude 等）和本地模型（Ollama、vLLM 等）。使用本地模型连接 OpenClaw 可以带来以下优势：

隐私安全：数据不离开本地，适合处理敏感信息
成本控制：无需支付 API 费用，一次性硬件投入
离线可用：无网络依赖，适合内网环境
低延迟：本地推理，响应速度快
可定制：支持自定义模型和微调

本文详细介绍如何配置 OpenClaw 使用本地模型。

本地模型方案对比#

方案	优点	缺点	适用场景
Ollama	安装简单，模型丰富，社区活跃	性能相对较低	快速体验、个人使用
vLLM	性能优异，支持高并发	配置复杂，需要技术背景	生产环境、高并发
Llama.cpp	轻量级，支持多平台	功能相对简单	资源受限环境
LocalAI	兼容 OpenAI API，易于集成	性能一般	需要兼容 OpenAI 的场景
Text-Generation-WebUI	Web 界面友好，功能丰富	资源占用高	交互式使用

使用 Ollama 连接 OpenClaw#

安装和配置 Ollama#

安装 Ollama#

PRTCL // BASH

1
# ========== 安装 Ollama ==========
2
# macOS 使用 Homebrew 包管理器安装
3
brew install ollama
4

5
# Linux 使用官方安装脚本自动安装
6
curl -fsSL https://ollama.ai/install.sh | sh
7

8
# Windows 需要手动下载安装包
9
# 访问 https://ollama.ai/download 下载安装

启动 Ollama 服务#

PRTCL // BASH

1
# ========== 启动和验证 Ollama 服务 ==========
2
# 启动 Ollama 服务（默认监听 11434 端口）
3
ollama serve
4

5
# 验证服务是否正常运行，返回已下载的模型列表
6
curl http://localhost:11434/api/tags

下载模型#

PRTCL // BASH

1
# ========== 下载和管理模型 ==========
2
# 下载 Llama 3.2 3B 模型（轻量级，适合入门）
3
ollama pull llama3.2:3b
4

5
# 下载通义千问 7B 模型（中文能力强）
6
ollama pull qwen2.5:7b
7

8
# 下载 Mistral 7B 模型（开源友好，性能平衡）
9
ollama pull mistral:7b
10

11
# 查看已下载的所有模型列表
12
ollama list

配置 OpenClaw#

创建配置文件#

OpenClaw 的模型配置文件位于 ~/.openclaw/config/models.yaml：

PRTCL // YAML

1
# ========== OpenClaw 模型配置文件 ==========
2
# 定义可用的模型提供商
3
providers:
4
  # Ollama 本地模型配置
5
  - name: "ollama"                          # 提供商名称
6
    type: "local"                           # 类型：本地模型
7
    baseUrl: "http://localhost:11434"       # Ollama 服务地址
8
    api: "openai-completions"               # API 兼容类型
9
    models:                                 # 模型列表
10
      # Llama 3.2 3B 模型配置
11
      - id: "ollama/llama3.2:3b"            # 模型唯一标识
12
        name: "Llama 3.2 3B"                # 模型显示名称
13
        capabilities:                       # 模型能力
14
          - "text"                          # 支持文本生成
15
          - "code"                          # 支持代码生成
16
        config:                             # 模型参数配置
17
          temperature: 0.7                  # 温度参数（控制随机性）
18
          top_p: 0.9                        # 核采样概率
19
          max_tokens: 2048                  # 最大生成 token 数
20

21
      # 通义千问 7B 模型配置
22
      - id: "ollama/qwen2.5:7b"             # 模型唯一标识
23
        name: "通义千问 7B"                  # 模型显示名称
24
        capabilities:                       # 模型能力
25
          - "text"                          # 支持文本生成
26
          - "code"                          # 支持代码生成
27
          - "tool"                          # 支持工具调用
28
        config:                             # 模型参数配置
29
          temperature: 0.7                  # 温度参数
30
          top_p: 0.9                        # 核采样概率
31
          max_tokens: 4096                  # 最大生成 token 数
32

33
      # Mistral 7B 模型配置
34
      - id: "ollama/mistral:7b"             # 模型唯一标识
35
        name: "Mistral 7B"                  # 模型显示名称
36
        capabilities:                       # 模型能力
37
          - "text"                          # 支持文本生成
38
          - "code"                          # 支持代码生成
39
        config:                             # 模型参数配置
40
          temperature: 0.7                  # 温度参数
41
          top_p: 0.9                        # 核采样概率
42
          max_tokens: 2048                  # 最大生成 token 数
43

44
# 默认使用的模型
45
defaultModel: "ollama/qwen2.5:7b"

使用环境变量#

如果需要动态配置，可以使用环境变量：

PRTCL // YAML

1
# ========== 使用环境变量的动态配置 ==========
2
providers:
3
  - name: "ollama"                                          # 提供商名称
4
    type: "local"                                           # 类型：本地模型
5
    # 使用环境变量 OLLAMA_BASE_URL，默认值为 localhost:11434
6
    baseUrl: "${OLLAMA_BASE_URL:http://localhost:11434}"    # 动态配置服务地址
7
    api: "openai-completions"                               # API 兼容类型
8
    models:                                                 # 模型列表
9
      # 使用环境变量 DEFAULT_MODEL，默认值为 llama3.2:3b
10
      - id: "ollama/${DEFAULT_MODEL:llama3.2:3b}"           # 动态配置模型 ID
11
        name: "默认模型"                                    # 模型显示名称
12
        capabilities:                                       # 模型能力
13
          - "text"                                          # 支持文本生成
14
          - "code"                                          # 支持代码生成

测试连接#

PRTCL // BASH

1
# ========== 测试连接 ==========
2
# 测试 Ollama 服务是否正常运行（返回模型列表）
3
curl http://localhost:11434/api/tags
4

5
# 测试 OpenClaw 与 Ollama 的连接状态
6
openclaw model test ollama/llama3.2:3b
7

8
# 测试模型推理功能（发送"你好"并获取回复）
9
openclaw model chat ollama/llama3.2:3b "你好"

Docker 部署#

如果 OpenClaw 使用 Docker 部署，需要确保容器能够访问宿主机的 Ollama 服务：

PRTCL // YAML

1
# ========== Docker Compose 配置文件 ==========
2
# 定义 Docker Compose 版本
3
version: '3.8'
4

5
# 定义服务列表
6
services:
7
  # OpenClaw 服务配置
8
  openclaw:
9
    image: openclaw/openclaw:latest         # 使用最新版本的 OpenClaw 镜像
10
    container_name: openclaw                # 容器名称
11
    restart: unless-stopped                 # 重启策略：除非手动停止
12
    ports:                                  # 端口映射
13
      - "3000:3000"                         # 将容器 3000 端口映射到宿主机 3000 端口
14
    volumes:                                # 挂载卷配置
15
      - ./workspace:/home/node/.openclaw/workspace              # 工作空间
16
      - ./config:/home/node/.openclaw/config                   # 配置文件
17
    environment:                            # 环境变量
18
      - NODE_ENV=production                 # 运行环境：生产环境
19
    extra_hosts:                            # 额外的主机配置
20
      - "host.docker.internal:host-gateway"  # 允许容器访问宿主机
21
    networks:                               # 网络配置
22
      - openclaw-net                        # 使用 openclaw-net 网络
23

24
  # Ollama 服务配置
25
  ollama:
26
    image: ollama/ollama:latest            # 使用最新版本的 Ollama 镜像
27
    container_name: ollama                 # 容器名称
28
    restart: unless-stopped                # 重启策略：除非手动停止
29
    ports:                                 # 端口映射
30
      - "11434:11434"                      # 将容器 11434 端口映射到宿主机 11434 端口
31
    volumes:                               # 挂载卷配置
32
      - ollama_data:/root/.ollama         # 模型数据持久化存储
33
    environment:                           # 环境变量
34
      - OLLAMA_HOST=0.0.0.0               # 监听所有网络接口
35
    networks:                              # 网络配置
36
      - openclaw-net                       # 使用 openclaw-net 网络
37

38
# 定义网络
39
networks:
40
  openclaw-net:                            # 网络名称
41
    driver: bridge                         # 使用桥接网络驱动
42

43
# 定义数据卷
44
volumes:
45
  ollama_data:                             # Ollama 数据卷名称

OpenClaw 配置文件需要使用 Docker 网络中的服务名：

PRTCL // YAML

1
# ========== Docker 网络中的 OpenClaw 配置 ==========
2
providers:
3
  - name: "ollama"                       # 提供商名称
4
    type: "local"                        # 类型：本地模型
5
    # 使用 Docker 网络中的服务名作为地址
6
    baseUrl: "http://ollama:11434"       # Ollama 服务地址（Docker 网络中）
7
    api: "openai-completions"            # API 兼容类型
8
    models:                              # 模型列表
9
      - id: "ollama/llama3.2:3b"         # 模型唯一标识
10
        name: "Llama 3.2 3B"             # 模型显示名称
11
        capabilities:                    # 模型能力
12
          - "text"                       # 支持文本生成
13
          - "code"                       # 支持代码生成

使用 vLLM 连接 OpenClaw#

安装 vLLM#

PRTCL // BASH

1
# ========== 安装 vLLM ==========
2
# 使用 pip 安装 Python 包
3
pip install vllm
4

5
# 或使用 Docker 拉取预构建镜像
6
docker pull vllm/vllm-openai:latest

启动 vLLM 服务#

本地安装#

PRTCL // BASH

1
# ========== 启动 vLLM 服务器（本地安装） ==========
2
# 使用 Python 模块方式启动 vLLM OpenAI 兼容 API 服务器
3
python -m vllm.entrypoints.openai.api_server \
4
  --model meta-llama/Llama-3.2-3B-Instruct \  # 指定模型路径或名称
5
  --host 0.0.0.0 \                            # 监听所有网络接口
6
  --port 8000 \                               # 监听端口
7
  --dtype auto \                              # 自动选择数据类型
8
  --max-model-len 4096                        # 最大模型长度（上下文窗口）

Docker 部署#

PRTCL // BASH

1
# ========== 使用 Docker 部署 vLLM ==========
2
# 运行 vLLM 容器
3
docker run --gpus all \                                 # 使用所有 GPU
4
  -p 8000:8000 \                                       # 端口映射：宿主机 8000 -> 容器 8000
5
  --name vllm \                                        # 容器名称
6
  vllm/vllm-openai:latest \                            # 镜像名称
7
  --model meta-llama/Llama-3.2-3B-Instruct \           # 模型路径或名称
8
  --host 0.0.0.0 \                                     # 监听所有网络接口
9
  --port 8000                                          # 容器内监听端口

配置 OpenClaw#

PRTCL // YAML

1
# ========== OpenClaw 配置 vLLM ==========
2
providers:
3
  - name: "vllm"                              # 提供商名称
4
    type: "openai"                            # 类型：OpenAI 兼容
5
    baseUrl: "http://localhost:8000/v1"       # vLLM 服务地址
6
    apiKey: "dummy-key"                       # API 密钥（vLLM 不需要真实密钥）
7
    models:                                   # 模型列表
8
      - id: "vllm/Llama-3.2-3B-Instruct"     # 模型唯一标识
9
        name: "Llama 3.2 3B (vLLM)"          # 模型显示名称
10
        capabilities:                         # 模型能力
11
          - "text"                            # 支持文本生成
12
          - "code"                            # 支持代码生成
13
        config:                               # 模型参数配置
14
          temperature: 0.7                    # 温度参数
15
          top_p: 0.9                          # 核采样概率
16
          max_tokens: 2048                    # 最大生成 token 数

性能优化#

PRTCL // BASH

1
# ========== vLLM 性能优化 ==========
2
# 启用张量并行（多 GPU 场景）
3
python -m vllm.entrypoints.openai.api_server \
4
  --model meta-llama/Llama-3.2-70B-Instruct \  # 使用 70B 大模型
5
  --tensor-parallel-size 2 \                    # 张量并行大小（使用 2 个 GPU）
6
  --gpu-memory-utilization 0.9                  # GPU 内存利用率（90%）
7

8
# 启用量化（降低内存占用，提升速度）
9
python -m vllm.entrypoints.openai.api_server \
10
  --model meta-llama/Llama-3.2-3B-Instruct \    # 模型路径
11
  --quantization awq                             # 使用 AWQ 量化方法
12

13
# 调整批处理大小（提升吞吐量）
14
python -m vllm.entrypoints.openai.api_server \
15
  --model meta-llama/Llama-3.2-3B-Instruct \    # 模型路径
16
  --max-num-batched-tokens 4096                  # 最大批处理 token 数

使用 LocalAI 连接 OpenClaw#

安装 LocalAI#

PRTCL // BASH

1
# ========== 使用 Docker 安装 LocalAI ==========
2
# 运行 LocalAI 容器
3
docker run -d \                                   # 后台运行
4
  --gpus all \                                    # 使用所有 GPU
5
  -p 8080:8080 \                                  # 端口映射：宿主机 8080 -> 容器 8080
6
  -v $PWD/models:/models \                        # 挂载模型目录
7
  --name localai \                                # 容器名称
8
  localai/localai:latest                          # 镜像名称

下载模型#

PRTCL // BASH

1
# ========== 下载模型文件 ==========
2
# 进入模型目录
3
cd models
4

5
# 从 Hugging Face 下载模型文件（使用 wget）
6
wget https://huggingface.co/TheBloke/Llama-2-7B-Chat-GGUF/resolve/main/llama-2-7b-chat.Q4_K_M.gguf

配置 OpenClaw#

PRTCL // YAML

1
# ========== OpenClaw 配置 LocalAI ==========
2
providers:
3
  - name: "localai"                         # 提供商名称
4
    type: "openai"                          # 类型：OpenAI 兼容
5
    baseUrl: "http://localhost:8080/v1"     # LocalAI 服务地址
6
    apiKey: "dummy-key"                     # API 密钥（LocalAI 不需要真实密钥）
7
    models:                                 # 模型列表
8
      - id: "localai/llama-2-7b-chat"      # 模型唯一标识
9
        name: "Llama 2 7B (LocalAI)"        # 模型显示名称
10
        capabilities:                       # 模型能力
11
          - "text"                          # 支持文本生成
12
          - "code"                          # 支持代码生成

模型路由配置#

OpenClaw 支持根据任务类型自动选择模型：

基于任务类型的路由#

PRTCL // YAML

1
# ========== 基于任务类型的路由配置 ==========
2
router:
3
  enabled: true                               # 启用路由功能
4
  strategy: "task-type"                       # 路由策略：基于任务类型
5
  rules:                                      # 路由规则列表
6
    # 编码任务规则
7
    - condition: "task.type == 'coding'"       # 条件：任务类型为编码
8
      model: "ollama/codellama:7b"            # 使用 Code Llama 7B
9
      priority: 10                             # 优先级（数字越大优先级越高）
10

11
    # 写作任务规则
12
    - condition: "task.type == 'writing'"      # 条件：任务类型为写作
13
      model: "ollama/llama3.2:3b"             # 使用 Llama 3.2 3B
14
      priority: 9                              # 优先级
15

16
    # 分析任务规则
17
    - condition: "task.type == 'analysis'"     # 条件：任务类型为分析
18
      model: "ollama/qwen2.5:7b"              # 使用通义千问 7B
19
      priority: 8                              # 优先级
20

21
    # 默认规则（当其他规则都不匹配时使用）
22
    - default: "ollama/llama3.2:3b"            # 默认使用 Llama 3.2 3B

基于复杂度的路由#

PRTCL // YAML

1
# ========== 基于任务复杂度的路由配置 ==========
2
router:
3
  enabled: true                                  # 启用路由功能
4
  strategy: "complexity"                         # 路由策略：基于任务复杂度
5
  rules:                                         # 路由规则列表
6
    # 低复杂度任务（复杂度 < 3）
7
    - condition: "task.complexity < 3"           # 条件：复杂度小于 3
8
      model: "ollama/llama3.2:3b"               # 使用 Llama 3.2 3B（轻量级）
9
      priority: 10                               # 优先级
10

11
    # 中等复杂度任务（3 <= 复杂度 < 7）
12
    - condition: "task.complexity >= 3 and task.complexity < 7"  # 条件：复杂度在 3-7 之间
13
      model: "ollama/qwen2.5:7b"                # 使用通义千问 7B（平衡）
14
      priority: 8                                # 优先级
15

16
    # 高复杂度任务（复杂度 >= 7）
17
    - condition: "task.complexity >= 7"          # 条件：复杂度大于等于 7
18
      model: "ollama/llama3.2:70b"              # 使用 Llama 3.2 70B（高性能）
19
      priority: 6                                # 优先级
20

21
    # 默认规则
22
    - default: "ollama/llama3.2:3b"              # 默认使用 Llama 3.2 3B

混合模式（本地 + 云端）#

PRTCL // YAML

1
# ========== 混合模式配置（本地模型 + 云端模型） ==========
2
providers:
3
  # ========== 本地模型配置 ==========
4
  - name: "ollama"                           # 提供商名称
5
    type: "local"                            # 类型：本地模型
6
    baseUrl: "http://localhost:11434"        # Ollama 服务地址
7
    api: "openai-completions"                # API 兼容类型
8
    models:                                  # 模型列表
9
      - id: "ollama/llama3.2:3b"            # 模型唯一标识
10
        name: "Llama 3.2 3B"                # 模型显示名称
11
        capabilities:                        # 模型能力
12
          - "text"                           # 支持文本生成
13
          - "code"                           # 支持代码生成
14

15
  # ========== 云端模型配置（用于复杂任务） ==========
16
  - name: "openai"                           # 提供商名称
17
    type: "openai"                           # 类型：OpenAI API
18
    baseUrl: "https://api.openai.com/v1"     # OpenAI API 地址
19
    apiKey: "${OPENAI_API_KEY}"              # API 密钥（从环境变量读取）
20
    models:                                  # 模型列表
21
      - id: "gpt-4o"                        # 模型唯一标识
22
        name: "GPT-4o"                      # 模型显示名称
23
        capabilities:                        # 模型能力
24
          - "text"                           # 支持文本生成
25
          - "image"                          # 支持图像处理
26
          - "tool"                           # 支持工具调用
27

28
# ========== 路由配置 ==========
29
router:
30
  enabled: true                              # 启用路由功能
31
  rules:                                     # 路由规则列表
32
    # 低复杂度任务使用本地模型
33
    - condition: "task.complexity < 5"       # 条件：复杂度小于 5
34
      model: "ollama/llama3.2:3b"            # 使用本地 Llama 3.2 3B
35
      priority: 10                           # 优先级（高）
36

37
    # 高复杂度任务使用云端模型
38
    - condition: "task.complexity >= 5"      # 条件：复杂度大于等于 5
39
      model: "gpt-4o"                        # 使用云端 GPT-4o
40
      priority: 8                            # 优先级
41

42
    # 包含图像的任务使用云端模型
43
    - condition: "task.has_image"            # 条件：任务包含图像
44
      model: "gpt-4o"                        # 使用云端 GPT-4o
45
      priority: 10                           # 优先级（高）
46

47
    # 默认使用本地模型
48
    - default: "ollama/llama3.2:3b"          # 默认使用本地 Llama 3.2 3B

性能优化#

模型选择策略#

任务类型	推荐模型	原因
简单对话	3B 模型	快速响应，资源占用低
代码生成	Code Llama	专门优化代码能力
中文理解	Qwen 2.5	中文能力强
长文本	Llama 3.2 70B	上下文长，能力强
生产环境	vLLM	性能优异，高并发

并发优化#

PRTCL // YAML

1
# ========== 并发优化配置 ==========
2
# Ollama 配置（环境变量）
3
environment:
4
  - OLLAMA_NUM_PARALLEL=4                    # 并发请求数（同时处理的请求数量）
5
  - OLLAMA_MAX_LOADED_MODELS=3               # 最大加载模型数（内存中保持的模型数量）

缓存优化#

PRTCL // YAML

1
# ========== 缓存优化配置 ==========
2
# 启用模型保活（避免频繁加载 / 卸载模型）
3
environment:
4
  - OLLAMA_KEEP_ALIVE=30m                     # 模型保活时间（30 分钟）
5

6
# 启用 KV Cache（减少重复计算，提升性能）
7
environment:
8
  - OLLAMA_KV_CACHE_TYPE=q8_0                 # KV Cache 类型（使用 8-bit 量化）

GPU 加速#

PRTCL // BASH

1
# ========== GPU 加速配置 ==========
2
# 检查 GPU 使用情况
3
nvidia-smi
4

5
# 多 GPU 配置（使用 GPU 0 和 1）
6
docker run --gpus '"device=0,1"' ...
7

8
# GPU 分配（指定使用特定 GPU）
9
docker run --gpus all \
10
  --gpus '"device=0"' \
11
  --shm-size=16g \
12
  ...

监控与调试#

监控资源使用#

PRTCL // BASH

1
# ========== 监控资源使用 ==========
2
# Ollama 资源监控
3
nvidia-smi                                   # 查看 GPU 使用情况
4
top                                          # 查看 CPU 和内存使用情况
5

6
# vLLM 资源监控
7
nvidia-smi                                   # 查看 GPU 使用情况
8
curl http://localhost:8000/metrics          # 查看 vLLM 性能指标

查看日志#

PRTCL // BASH

1
# ========== 查看服务日志 ==========
2
# Ollama 日志（实时查看）
3
tail -f ~/.ollama/logs/server.log
4

5
# vLLM 日志（Docker 部署）
6
docker logs -f vllm
7

8
# OpenClaw 日志
9
openclaw logs -f

性能测试#

PRTCL // PYTHON

1
# ========== 性能测试脚本 ==========
2
import time
3
import requests
4

5
def test_latency(model, prompt="你好"):
6
    """
7
    测试模型响应延迟
8
    Args:
9
        model: 模型名称
10
        prompt: 测试提示词
11
    Returns:
12
        ( 延迟时间, 响应结果 )
13
    """
14
    start = time.time()                       # 记录开始时间
15
    response = requests.post(                 # 发送 POST 请求
16
        "http://localhost:11434/api/generate", # API 端点
17
        json={
18
            "model": model,                   # 模型名称
19
            "prompt": prompt,                 # 提示词
20
            "stream": False                   # 非流式输出
21
        }
22
    )
23
    end = time.time()                         # 记录结束时间
24
    return end - start, response.json()       # 返回延迟和响应
25

26
# 测试多个模型的性能
27
models = ["llama3.2:3b", "qwen2.5:7b", "mistral:7b"]
28
for model in models:
29
    latency, result = test_latency(model)     # 测试延迟
30
    print(f"{model}: {latency:.2f}s")         # 输出结果

故障排查#

连接失败#

症状：OpenClaw 无法连接到本地模型

解决方案：

PRTCL // BASH

1
# ========== 排查连接失败问题 ==========
2
# 检查服务状态（验证 Ollama 是否正常运行）
3
curl http://localhost:11434/api/tags
4

5
# 检查防火墙设置（开放 11434 端口）
6
sudo ufw allow 11434
7

8
# 检查配置文件（确认配置正确）
9
cat ~/.openclaw/config/models.yaml
10

11
# 测试连接（验证 OpenClaw 与 Ollama 的连接）
12
openclaw model test ollama/llama3.2:3b

性能问题#

症状：响应速度慢

解决方案：

PRTCL // BASH

1
# ========== 解决性能问题 ==========
2
# 检查 GPU 使用情况（确认 GPU 是否被正确使用）
3
nvidia-smi
4

5
# 使用量化模型（降低内存占用，提升速度）
6
ollama pull llama3.2:3b-q4_K_M
7

8
# 减少并发数（降低系统负载）
9
export OLLAMA_NUM_PARALLEL=1
10

11
# 使用 vLLM 替代 Ollama（vLLM 性能更优）

内存不足#

症状：程序崩溃

解决方案：

PRTCL // BASH

1
# ========== 解决内存不足问题 ==========
2
# 使用更小的模型（减少内存占用）
3
ollama pull llama3.2:3b
4

5
# 使用量化模型（进一步降低内存占用）
6
ollama pull llama3.2:3b-q4_K_M
7

8
# 增加 swap 空间（使用磁盘作为虚拟内存）
9
sudo fallocate -l 4G /swapfile                  # 创建 4GB swap 文件
10
sudo chmod 600 /swapfile                         # 设置权限
11
sudo mkswap /swapfile                            # 格式化为 swap
12
sudo swapon /swapfile                            # 启用 swap

最佳实践#

✅ 选择合适的模型：根据任务复杂度选择模型大小
✅ 使用量化模型：在精度和性能之间找到平衡
✅ 配置模型路由：根据任务类型自动选择模型
✅ 启用 GPU 加速：大幅提升推理速度
✅ 监控资源使用：及时发现问题
✅ 定期备份数据：防止数据丢失
✅ 使用混合模式：简单任务用本地，复杂任务用云端
✅ 优化并发配置：根据硬件调整并发数
✅ 启用缓存：减少重复计算
✅ 定期更新：获取最新功能和修复

关于我#

项目	内容
编辑	echowang
来源	echospace
邮箱	echohaoran@gmail.com
简介	AI 爱好者，专注于大语言模型应用与智能体开发，分享技术与实践心得
社交	欢迎交流讨论，共同成长

概述#

本地模型方案对比#

使用 Ollama 连接 OpenClaw#

安装和配置 Ollama#

安装 Ollama#

启动 Ollama 服务#

下载模型#

配置 OpenClaw#

创建配置文件#

使用环境变量#

测试连接#

Docker 部署#

使用 vLLM 连接 OpenClaw#

安装 vLLM#

启动 vLLM 服务#

本地安装#

Docker 部署#

配置 OpenClaw#

性能优化#

使用 LocalAI 连接 OpenClaw#

安装 LocalAI#

下载模型#

配置 OpenClaw#

模型路由配置#

基于任务类型的路由#

基于复杂度的路由#

混合模式（本地 + 云端）#

性能优化#

模型选择策略#

并发优化#

缓存优化#

GPU 加速#

监控与调试#

监控资源使用#

查看日志#

性能测试#

故障排查#

连接失败#

性能问题#

内存不足#

最佳实践#

相关资源#

关于我#

Related Posts

Comments