主模型:anthropic/claude-opus-4-6。因其卓越的推理能力、长上下文窗口和指令遵循能力而被选中,使其成为复杂、多步骤任务的理想选择。备用模型:google/gemini-3-pro-high。该模型作为热备份。当主模型端点出现 API 速率限制或错误响应(HTTP 429, 5xx)时,会自动触发备用模型。这种断路器模式可确保服务连续性。
该策略与 Claude 的 CLI 模式相结合,可以对 API 支出进行精细控制,防止成本失控,同时保持高水平的服务可用性。
3.2. 多模态输入和通信渠道
为了超越基于文本的交互,集成了 OpenAI 的 Whisper API 用于语音到文本的转录。选择使用付费 API 而非自托管模型,是为了保证更高的转录准确性和更低的维护开销。通过 Telegram 和 WhatsApp 建立了通信渠道,利用它们各自的机器人 API 和 webhook 实现近乎实时的异步消息传递。
Steinberger, P. (2026). OpenClaw - Personal AI Assistant. 检索自 https://openclaw.ai/
NVIDIA Corporation. (2024). Jetson Orin Nano Developer Kit. 检索自 https://developer.nvidia.com/embedded/learn/get-started-jetson-orin-nano-devkit
Yuan, L., et al. (2023). A Survey of Progress on Cooperative Multi-agent Reinforcement Learning. arXiv preprint arXiv:2312.01058. 检索自 https://arxiv.org/abs/2312.01058
IBM Research. (2024). What is a Multi-Agent System? 检索自 https://www.ibm.com/think/topics/multiagent-system
Anthropic. (2024). Claude API Documentation. 检索自 https://docs.anthropic.com/