返回列表 发布新帖

[玩法教程] 最新 Gemma 4模型 + llama.cpp 教程 实现本地部署大模型

1962 5
发表于 2026-4-6 19:18:14 | 查看全部 阅读模式 IP:–江苏–苏州

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
本帖最后由 茂茂阿丶 于 2026-4-6 19:28 编辑

先说结论Gemma 4 是谷歌开源模型的一次重大升级,31B 参数就能干翻 Llama 3 70B,本地部署门槛大幅降低,配合 OpenClaw 可实现免费私有 AI 助手。

博主使用的是绿联DXP 4800Plus +16G内存,用的gemma-4-E4B-it-Q5_K_M.gguf

用户请自行判断模型是否可用。
各个版本模型的区别请自行AI确认。

image.png

我用夸克网盘分享了「Gemma」,点击链接即可保存提取码:DCyR
3.png


llama.cpp的Docker-Compose配置文件,教程使用的是
  1. services:
  2.   llama-cpp-server:
  3.         image: ghcr.io/ggml-org/llama.cpp:server
  4.         container_name: gemma
  5.         volumes:
  6.            - ./models:/models:ro
  7.         environment:
  8.            - MODEL=/models/gemma-4-E4B-it-Q5_K_M.gguf
  9.         command: >
  10.             --port 8081
  11.             --host 0.0.0.0
  12.             --threads 6
  13.            --n-gpu-layers 0
  14.            -c 4096
  15.            --temp 0.7
  16.            --repeat-penalty 1.1
  17.         restart: unless-stopped
  18.         deploy:
  19.             resources:
  20.                limits:
  21.                   memory: 12G  # 严格限制内存
复制代码




微信图片_20260406154536_18615_3456.png


评论5

大鸽饭Lv.1 发表于 2026-4-7 07:44:47 | 查看全部 IP:–广东–佛山–高明区
速度怎么样?
cnmikeLv.1绿联NAS社区会员用户 发表于 2026-4-7 12:28:56 | 查看全部 IP:–广东–佛山–高明区
可以调用GPU吗?
茂茂阿丶楼主Lv.1绿联NAS社区会员用户 发表于 2026-4-7 20:44:59 | 查看全部 IP:–江苏–苏州
cnmike 发表于 2026-4-7 12:28
可以调用GPU吗?

可以调用,看你设备
茂茂阿丶楼主Lv.1绿联NAS社区会员用户 发表于 2026-4-7 20:45:17 | 查看全部 IP:–江苏–苏州

4800Plus 只能说可以用
大鸽饭Lv.1 发表于 2026-4-8 20:15:33 | 查看全部 IP:–广东–佛山–高明区
茂茂阿丶 发表于 2026-4-7 20:45
4800Plus 只能说可以用

我已经放弃用nas部署大模型了,玩玩还行……

评论

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright © 2026 绿联NAS私有云社区 版权所有 All Rights Reserved. 粤公网安备44030002002555号| 粤ICP备12028978号
关灯 在本版发帖
联系技术支持
返回顶部
快速回复 返回顶部 返回列表