AI创想
标题:
OpenClaw skills
[打印本页]
作者:
米落枫
时间:
昨天 07:57
标题:
OpenClaw skills
作者:CSDN博客
claude skills
Claude 是由 Anthropic 公司开发的大型语言模型(LLM)。
Claude Skills 是 Anthropic 推出的一种模块化能力包,通过封装标准化的流程知识(SOP)实现任务自动化。它不是一次性提示词,而是一个可保存、复用、共享的“技能包”。
Claude Skills 是让 AI 拥有“工作手册”的能力
,而 MCP(也是Anthropic公司推出的) 是它的“工具箱”。
OpenClaw是什么
OpenClaw是一款能直接操控电脑的AI智能体工具,被称为“AI打工人”,它不是单纯的聊天机器人,而是可以听懂指令、自主调用系统工具链完成本地文件检索、稿件撰写、发送邮件等电脑操作的数字员工。
OpenClaw(原名 Clawdbot)火爆了。作为一款具备高度主动性的本地 Agent,它拥有深入系统底层的权限,无论是执行 Shell 命令、自动化提交 Git PR、管理数据库,还是无缝对接 Telegram 等通讯应用,OpenClaw 全都游刃有余。它最迷人的地方在于“Skills”插件,这意味着用户可以按需扩展功能,赋予它近乎无限的进化可能。
因版权缘故,它经历从 Clawdbot 到 moltbot 的演变,现更名为 OpenClaw(官网:openclaw.ai)。本教程将带你体验这一爆火工具,手把手教你如何在 openEuler 操作系统上完成 OpenClaw 的部署。
参考资料
https://developer.aliyun.com/article/1717849
原理
目前openclaw无法直接视觉,而是执行底层的shell及python命令。
对于视频的剪辑,它是生成字幕、判断重复语句检测,然后用时间戳切割工具,再拼接。
OpenClaw的学习:
https://www.openeuler.openatom.cn/zh/blog/20260128-OpenClaw/20260131-OpenClaw.html
nvm安装node.js
OpenClaw可以使用claude skills。
Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行环境。
JavaScript 原本只能在浏览器里跑(比如控制网页交互),Node.js 把浏览器的 JS 运行引擎抽出来,让 JS 能脱离浏览器,直接在电脑的操作系统(Windows/Mac/Linux)上运行。
JavaScript脚本运行步骤:
保存为 server.js;
终端执行 node server.js;
浏览器访问 http://localhost:3000,就能看到 Hello, Node.js!。
nvm 是一个用于管理Node.js 版本的命令行工具。
slack是一个类似如流的工具。
(, 下载次数: 0)
上传
点击文件名下载附件
(流程链路:用户消息 → 通道适配器 → 网关服务器 → 会话路由器 → 智能体运行器 → 模型解析器 → 系统提示词构建器 → 历史加载器 → 会话 → 任务通道队列 → 上下文窗口防护机制 → 大语言模型 API → 智能体循环 → 反馈通路 → 通道适配器 → 最终文本)
(, 下载次数: 0)
上传
点击文件名下载附件
(, 下载次数: 0)
上传
点击文件名下载附件
通道适配器
通道适配器接收用户消息并进行预处理,包括消息标准化、提取附件等。不同的即时通讯工具和输入流,都配有专属的适配器。
网关服务器
接收用户消息并将其分发至对应会话,是 Clawd 的核心模块,可处理多个并行的请求。
Clawd 采用了基于任务通道的命令队列:每个会话对应专属的任务通道,低风险、可并行的任务(如定时任务)则可在多个通道中并行执行。
默认串行执行,显式声明并行。
通信方式:通过 WebSocket 与各类客户端通信(macOS app、CLI、Web UI、自动化脚本、Nodes)。
协议:基于 JSON Schema 验证的 WebSocket API。
智能体运行器
智能体运行器会结合可用工具、技能、记忆内容动态生成系统提示词,再加入会话历史(存储于.jsonl 文件),随后将完整提示词传入上下文窗口防护机制,校验是否有足够的上下文空间。若上下文空间即将耗尽,系统会选择压缩会话内容(对上下文进行总结)或优雅降级终止执行。
大语言模型 API 调用
大模型调用环节会以流式方式返回结果,同时对不同服务商的 API 做了一层抽象封装
智能体循环
若大模型返回工具调用指令,Clawd 会在本地执行该指令,并将执行结果补充至对话中。这一过程会反复执行,直至大模型返回最终文本结果,或达到最大循环次数(默认约 20 次)。
Clawd 的记忆机制
1、前文提到的、以 jsonl 格式存储的会话记录;
2、存储为 Markdown 格式的记忆文件,文件位于 MEMORY.md 或 memory/文件夹中。这些 Markdown 记忆文件由智能体通过常规的“写入”文件工具生成,智能体只需向 memory/*.md 路径写入内容即可。
在检索环节,Clawd 采用了向量检索SQLite与关键词(SQLite 的扩展模块 FTS5)匹配相结合的混合检索方式。
当新的对话开始时,系统会提取上一轮的对话内容,并将其总结为 Markdown 格式的文件。
Clawd 的核心能力:电脑操作实现
Clawd 会向智能体开放较高权限的电脑操作能力,
它通过执行工具(exec tool)在设备上运行 Shell 命令,支持三种运行环境:
沙箱环境(默认):命令在 Docker 容器中运行;
本地宿主机;
远程设备。
除此之外,Clawd 还配备了各类工具:
文件系统工具(支持读取、写入、编辑); 基于 Playwright 实现的浏览器工具,可生成语义快照; 进程管理工具,用于执行后台长期运行的命令、终止进程等。
安全机制(或近乎缺失?)
与 Claude Code 类似,Clawd 为用户设置了命令白名单,用户可对各类命令进行权限审批,支持三种操作:单次允许、始终允许、拒绝,并会向用户弹出审批提示。
浏览器工具:语义快照而非截图
Clawd 的浏览器工具并非主要依赖截图,而是采用语义快照——一种基于页面无障碍树(ARIA)的文本化表示形式。
动态系统提示词</
原文地址:https://blog.csdn.net/commanderScott/article/details/158345435
欢迎光临 AI创想 (https://llms-ai.com/)
Powered by Discuz! X3.4