返回列表 发布新帖

[玩法教程] 减少openclaw大龙虾的token消耗。一点小技巧。见笑了。

1269 0
发表于 2026-3-10 15:57:56 | 查看全部 阅读模式 IP:–重庆–重庆

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
本帖最后由 KkoXCO 于 2026-3-10 19:38 编辑

一.docker部署ollama
1.拉取镜像,在镜像市场拉取ollama我用的第一个
image.png
然后本地镜像,创建点加号创建容器。
2.设置容器
设置容器的时候CPU最好不要全用,免得卡掉其他任务。我是绿源xd4600。我设置的3核。
内存根据自己的实际情况写,最好也不要无限制。比如我16G内存,我就乱写了一个10000MB反正不全部给他就行了。
image.png



其他的都默认就行了。注意一点就是端口好,他用的NAS端口38525,映射的容器11434端口。以后要访问这个ollama用得就是38525端口了。注意一下。
最后保存设置,运行容器。
在浏览器打开地址http://<你NAS的IP地址>:38525 看看网页是否能打开,并显示“Ollama is running"。显示就成功了,

3.链接ollama拉取大模型
用管理员身份,在windows电脑上贷款powershell。依次执行下面命令,中文部分是解释,不要照抄。
  1. $env:OLLAMA_HOST = "http://<你NAS的ip地址>:38525"            #设置powershell指向NSA

  2. ollama pull qwen2.5:0.5b                                                           #让ollama拉取qwen2.5:0.5b模型。
  3.                                                                                           #当然你也可以拉取其他模型,但是NSA算力有限,别用大模型。

  4. ollama list                                                                                       #拉取模型后,看是否拉取成功

  5. ollama run qwen2.5:0.5b                                                              #运行模型
复制代码
如果你能和模型聊天了。那么就成功了。如图:
image.png

二.配置openclaw对接ollama大模型
找到NAS中的openclaw.json文件,把下面代码添加到models标签——providers标签后面。
  1.       "ollama": {
  2.         "baseUrl": "http://你绿联NAS的IP地址:38525/v1",
  3.         "apiKey": "123456",
  4.         "auth": "token",
  5.         "api": "openai-completions",
  6.         "models": [
  7.           {
  8.             "id": "qwen2.5:0.5b",
  9.             "name": "qwen2.5:0.5b",
  10.             "api": "openai-completions",
  11.             "reasoning": false,
  12.             "input": [
  13.               "text"
  14.             ],
  15.             "cost": {
  16.               "input": 0,
  17.               "output": 0,
  18.               "cacheRead": 0,
  19.               "cacheWrite": 0
  20.             },
  21.             "contextWindow": 160000,
  22.             "maxTokens": 4096,
  23.             }
  24.           }
  25.         ]
  26.       },
复制代码
然后再在openclaw.json文件后面找到agents标签下面,填写如下代码。

  1.       "heartbeat": {
  2.         "model": "ollama/qwen2.5:0.5b"
  3.       },
复制代码
特别注意,缩进,缩进使用空格,不要用TAB。最后括号结尾逗号,如果后面没有代码,就不要逗号。
到这里就结束了,这样openclaw的心跳就设置在本地运行了,这样能减少一点token的消耗。
当然你也可以用这个方法去修改主要模型,让主要模型也用本地ollama,完全不用担心token。但是本地模型太笨。所以只用来挂心跳就好。减少并发,减少token消耗。

写在最后,我主力模型是用的免费的glm-4.7-flash,算是我找到的免费中的最聪明的了。但是因为是免费,所以迸发数,和速度都慢。只是因为穷,

免费token链接:https://www.bigmodel.cn/glm-coding?ic=Z4RO1JLMO7。你去注册一个,我也好拿点算力。这玩意太费token了。感谢!!!

注册后,在网址右上角找到——控制台。
进入控制台后,还是右上角回看到API KEY字样,点击进入。添加一个新的apikey然后复制保存。然后去设置openclaw.josh的主模型。调用glm-4.7-flash,因为他是我找到的免费的,又最聪明的唯一模型。虽然免费版慢,但是我穷又有什么办法呢?给那些只想玩玩,不想掏钱的玩家。大户请充值。
特别注意:是glm-4.7-flash模型免费,不要填错了,我能找到的最聪明,并且免费的。
其他的要收费,或者就是试用,或者太笨。如果你有更好,更聪明的,也谢谢你下面留言分享。当然要免费,我们主打一个白嫖。
当然就算免费,你也最好用我今天帖子的教程,把心跳改本地,因为免费也是有并发限制的,心跳改本地,减少并发,减少token,大龙虾会更流畅,不然会被限制访问,等几分钟,会好,但是浪费时间。
image.png
image.png

评论

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright © 2026 绿联NAS私有云社区 版权所有 All Rights Reserved. 粤公网安备44030002002555号| 粤ICP备12028978号
关灯 在本版发帖
联系技术支持
返回顶部
快速回复 返回顶部 返回列表