✂️ 使用 QA Wolf,将您的 QA 周期缩短至几分钟(赞助内容)
如果缓慢的质量保证流程阻碍了您或您的软件工程团队,并因此导致发布速度变慢——您需要了解一下 QA Wolf。
QA Wolf 的 AI 原生服务支持 Web 和移动应用程序,可在数周内实现 80% 的自动化测试覆盖率,并将 QA 周期缩短至数分钟,从而帮助团队以 5 倍的速度交付产品。
QA Wolf让您摆脱测试的烦恼。他们可以帮您:
-
支持移动应用和 Web 应用的无限次并行测试运行
-
24 小时维护和按需测试创建
-
人工审核后的错误报告将直接发送给您的团队
-
零碎屑保证
好处是什么?无需再进行手动端到端测试。不再需要缓慢的质量保证周期。不再有缺陷进入生产环境。
借助 QA Wolf, Drata 的 80 多名工程师团队实现了 4 倍的测试用例数量和86% 的 QA 周期速度提升。
本周系统设计回顾:
-
Claude Code 与 OpenClaw:5 个设计维度
-
成为人工智能工程师 | 报名即将截止
-
人工智能如何用5个步骤伪装成人类
-
如何判断你的AI应用是否真的有效?
-
为什么 Git 回滚会导致冲突?
Claude Code 与 OpenClaw:5 个设计维度
Claude Code 会在每次任务完成后终止运行。OpenClaw 则永不休眠。两者都功能强大,但架构上存在关键差异。
系统范围
Claude Code 是一个生命周期很短的进程。启动它,运行一会儿,然后就退出。OpenClaw 则是一个长时间运行的后台守护进程,它有一个网关,用于维护与 Discord、Slack 和 WhatsApp 等应用程序的 WebSocket 连接。
代理运行时
Claude Code 使用单一的异步查询循环:思考、工具调用、观察、重复。OpenClaw 使用会话队列,其中网关将 RPC 请求路由到不同的队列中。
扩展架构
Claude Code 支持 MCP、插件、技能和钩子,所有这些都集成到代理中。OpenClaw 使用清单优先的插件系统。插件在到达代理之前会先经过中央注册表。
记忆
Claude Code 将 CLAUDE.md 视为记忆文件。OpenClaw 将 MEMORY.md 与日常笔记分开,并添加了跨结构化部分的混合向量/关键词搜索功能。
多代理与路由
Claude Code 采用的是引导代理到子代理的模式。OpenClaw 采用的是路由委托系统,其中入站通道被路由到专用代理,这些代理再将请求转交给共享的子代理。
现在轮到你了:你认为哪种模式代表了智能体的未来?
成为人工智能工程师 | 报名即将截止
我们的第六期“成为人工智能工程师”课程将于一周后开课。这是一门实时、小组授课的课程,由畅销书作家阿里·阿米尼安 (Ali Aminian) 合作创建,并由 ByteByteGo 出版。
以下是这一届学生的特别之处:
-
通过实践学习:构建现实世界的人工智能应用程序,而不仅仅是观看视频。
-
结构化、系统化的学习路径:遵循精心设计的课程,从基础知识到高级主题,循序渐进地学习。
-
实时反馈和指导:直接从导师和同伴那里获得反馈。
-
社群驱动:独自学习很难,与社群一起学习就容易多了!
我们注重技能培养,而非理论或被动学习。我们的目标是让每位参与者都能掌握构建人工智能系统的坚实基础。
如果你想从零开始学习人工智能,这绝对是你的理想平台。
人工智能如何用5个步骤伪装成人类
一张自拍,一段伪造视频。以下是深度伪造技术的大致工作原理。
下图展示了将参考图像(如自拍)、语音片段和提示信息转换为虚假视频的完整流程。
第一步:提示语优化。对文本提示语进行清理,添加更多细节,并配以否定提示语,以消除诸如手部变形等不必要的瑕疵。
步骤 2:参考图像准备。将目标对象的一张自拍照输入 VAE 编码器,VAE 是一种神经网络,可将图像压缩成紧凑的潜在表示。
步骤 3:扩散推理引擎。从纯噪声开始,运行基于扩散的去噪器,并以精炼后的提示、参考潜在帧和音频为条件,生成干净的视频潜在帧。然后,VAE 解码器将这些潜在帧转换回视频帧。
步骤 4:后期处理。将原始帧放大到更高分辨率,进行颜色校正以保持一致性,通过 NSFW 分类器筛选,并添加水印。
步骤 5:多模态同步器。音频被转换为音素(语音中不同的声音单位)。唇形同步模型将嘴部动作与这些音素对齐。
输出结果是一段视频,视频中的CEO从未说过那些话,也从未进入过那个房间。
轮到你了:你会关注哪些方面来判断一段视频是真实的还是人工智能制作的?
如何判断你的AI应用是否真的有效?
你需要进行评估。但大多数团队会跳过这一步(或者做得不对),因为“评估”这个词听起来很模糊。其实不然。
好的评估都是一个三步流程。
第一步:选择一项任务。人工智能系统具有不同的能力和评估维度。对于低层管理模型(LLM),可以是安全性或数学能力;对于红黄绿灯系统(RAG),可以是着陆和回收。选择其中一项。
步骤二:收集评估数据。对于每项任务,收集与正确答案或预期行为相对应的输入信息。安全集将风险提示与“拒绝”选项配对。
步骤三:开发评分系统。如何判断输出结果是否优秀?
-
对于有明确正确答案的问题,使用基于代码的评分器(if/else、单元测试),并修补通过单元测试的问题。
-
对于安全等主观任务,使用基于模型的评分器(LLM 作为评判员)。
-
对于特殊情况以及任何比吞吐量更重要的细节要求,请使用人工评分。
大多数生产环境评估都会结合这三种方法:代码评估用于检查成本低廉的部分;模型评估用于规模化;人工评估用于检查最重要的部分。
轮到你了:你觉得评分任务中最难的部分是什么?你用哪种评分方式来评分?
为什么 Git 回滚会导致冲突?
git revert 命令看起来很简单,但有时会引发冲突。以下是发生这种情况的原因。
-
`git revert` 的实际作用:与 `reset` 不同,`revert` 不会重写历史记录。相反,它会创建一个新的提交,撤销之前提交所做的更改。这可以保持历史记录的清晰、可追溯性,并确保共享分支的安全。
-
为什么会发生回滚冲突:当后续提交更改了与您要撤销的提交相同的行时,就会出现冲突。
图示示例:
-
提交 C2 添加了一项功能
-
提交 C3 修改了相同的几行。
-
回滚 C2 现在与 C3 的更改相冲突。
Git 无法确定哪个版本才是正确的,因此会触发回滚冲突。
-
如何解决这个问题:
1. 运行 git revert C2
2. Git 在遇到冲突时会暂停。
3. 你手动修复了文件
4. 上演
5. 继续恢复
然后 Git 会创建一个新的提交,干净利落地撤销 C2,同时保持 C3 不变。
轮到你了:你是否曾在最糟糕的时刻遇到过冲突?你是如何解决的?
原文: https://blog.bytebytego.com/p/ep214-claude-code-vs-openclaw-5-design





