最新 Gemma 4模型 + llama.cpp 教程实现本地部署大模型

茂茂阿丶 · 发表于 2026-4-6 19:18:14

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？立即注册

×

本帖最后由茂茂阿丶于 2026-4-6 19:28 编辑

先说结论：Gemma 4 是谷歌开源模型的一次重大升级，31B 参数就能干翻 Llama 3 70B，本地部署门槛大幅降低，配合 OpenClaw 可实现免费私有 AI 助手。

博主使用的是绿联DXP 4800Plus +16G内存，用的gemma-4-E4B-it-Q5_K_M.gguf

用户请自行判断模型是否可用。
各个版本模型的区别请自行AI确认。

我用夸克网盘分享了「Gemma」，点击链接即可保存，提取码：DCyR

llama.cpp的Docker-Compose配置文件，教程使用的是

services:
llama-cpp-server:
image: ghcr.io/ggml-org/llama.cpp:server
container_name: gemma
volumes:
- ./models:/models:ro
environment:
- MODEL=/models/gemma-4-E4B-it-Q5_K_M.gguf
command: >
--port 8081
--host 0.0.0.0
--threads 6
--n-gpu-layers 0
-c 4096
--temp 0.7
--repeat-penalty 1.1
restart: unless-stopped
deploy:
resources:
limits:
memory: 12G # 严格限制内存

复制代码

大鸽饭 · 发表于 2026-4-7 07:44:47

速度怎么样？

cnmike · 发表于 2026-4-7 12:28:56

可以调用GPU吗？

茂茂阿丶 · 发表于 2026-4-7 20:44:59

cnmike 发表于 2026-4-7 12:28
可以调用GPU吗？

可以调用，看你设备

茂茂阿丶 · 发表于 2026-4-7 20:45:17

bTAG9j 发表于 2026-4-7 07:44
速度怎么样？

4800Plus 只能说可以用

大鸽饭 · 发表于 2026-4-8 20:15:33

茂茂阿丶发表于 2026-4-7 20:45
4800Plus 只能说可以用

我已经放弃用nas部署大模型了，玩玩还行……

[玩法教程] 最新 Gemma 4模型 + llama.cpp 教程实现本地部署大模型

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

电梯直达
评论5

评论

浏览过的版块

[玩法教程] 最新 Gemma 4模型 + llama.cpp 教程 实现本地部署大模型

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

电梯直达 评论5

评论

浏览过的版块

[玩法教程] 最新 Gemma 4模型 + llama.cpp 教程实现本地部署大模型

电梯直达
评论5