翊行代码

翊码行远,仰观星辰 ——用代码丈量世界,以仰望探索未知

Writing

最新文章

  1. 我是如何让 Skill 稳下来的

    系列开篇(复盘体)。核心判断:一个能长期稳住的 Skill,从来不只是一段 Prompt,而是 Prompt + 脚本——Prompt 负责'想',脚本负责把不该靠想的步骤'做死'。用代码审查 Skill 换模型翻车和日报 Skill 老出错两个真实坑,引出'该交给谁'的判断表,再升维到 Harness 输入/执行/约束/验收四层框架,论证一人公司训不了模型、却能把'哪步交给 Prompt、哪步写成脚本'做到极致。

  2. 这篇 Harness,写到你对象都能看懂

    用大白话把 Harness 讲到你对象都能看懂:它不是什么高深技术,就是「别让 AI 瞎猜」——把干活的每一步尽量定死,减少模型的推测,就是减少变量,结果才稳。

  3. 那份周报是 AI 编的,第一个信的人是我

    用一件糗事开场:我让 AI 把几条零散进展扩写成周报,三天后连自己都信了它编出来的「下一步规划」。写的人尚且会被骗,天天看 AI 产出的人更不必说——生产端的成本塌了地板,消费端的判断力正在被一口口喂钝。全程第一人称,不替读者下结论。

    AI
  4. 我把一个 Skill 从手写 Prompt 重构成了可编译模块——一次 DSPy 实战复盘

    手写 Prompt 的 Skill 一换模型就翻车,根因是我把措辞当源代码硬编码了。这篇复盘用 DSPy 重构的全过程:只声明契约和打分函数,措辞交给编译器自动生成;换模型重新 compile 一次,当初翻车的 case 全部跑通。

    AI AI Agent
  5. Claude Opus 4.8 发布:当 AI 能并行调度数百个子代理,编程的边界在哪里?

    Anthropic 同时发布 Claude Opus 4.8 和 Dynamic Workflows,前者在编码基准测试上全面超越 GPT-5.5,后者让单个 Claude Code 会话能并行运行数百个子代理。这不仅是模型升级,更是 AI 工程范式的根本转变。

    AI Agent
  6. 把一套 ERP 封装成 AI Agent 体系:从 API 到数字员工的分层方法

    一句话结论:要让 AI Agent 真正驱动一套复杂的 ERP,关键不是”让 Agent 直接调接口”,而是分层封装——底层把接口收成一套干净 API(主干),往上逐层包成工具箱(MCP)→ 本事(SKILL)→ 领域专家(分身)→ 总管,再用触发器和任务让它没人盯着也能自己跑。 “要让外部的 AI Agent 跟 ERP 打交道,到底怎么接?”——这件事听起来很技术,但真正该想明白的,是技术管理者和业务负责人。这篇先把结论和全景图摆上来,再一层层拆开讲清楚。 一、结论先行:整套架构一张图 先看答案。下面这张图就是全部:一个请求进来后,沿着能力栈一层层走到 ERP;而旁边那排触发器,负责“没人点也能自动开工”。 flowchart LR USER["用户"] --> MAIN subgraph TRIG["触发(没人盯也能开工)"] direction TB TR1["定时任务"] TR2["事件触发"] TR3["手动"] TR4["上层调用"] end TRIG --> TASK["任务<br/>有状态 · 可重试 · 可后台跑"] TASK --> MAIN["① 总管 MainAgent<br/>统一入口 + 通用能力(作图 / RAG)"] MAIN --> SUB["② 分身 SubAgent<br/>领域专家 = 一个 L2 业务域"] SUB --> SKILL["③ SKILL<br/>一项本事 = SOP + 一组工具"] SKILL --> MCP["④ MCP Server<br/>工具箱 = L3 服务"] MCP --> API["⑤ API 封装层(主干)<br/>字段映射 / 认证 / 权限 / 保险"] API --> RAW["⑥ ERP 原生接口<br/>REST·OData / 业务函数 / 批量包"] RAW --> ERP["ERP 系统"] 两条线索读这张图: 能力栈(主干):用户 / 触发器 → 总管 → 分身(领域专家)→ SKILL(一项本事)→ MCP Server(工具箱)→ API 封装层(主干)→ ERP 原生接口 → ERP。每一层只做自己该做的事。 怎么被触发:定时、事件、手动、上层调用,都先生成一个任务,再由任务驱动那条链。 为什么非得分这么多层,而不让 Agent 直接调 ERP 接口? 因为直连会同时踩三个坑: 接口对人 / 模型都不友好:字段名是 A_PurchaseOrder 这种技术代号,认证、权限还得自己处理。 脏活要写很多遍:认证、权限、字段映射如果每个调用方各写一遍,以后行为还容易不一致。 工具一多就选不准:几百个原生接口直接丢给模型,它根本挑不对该调哪个。 下面每一层,正是为逐个解决这些问题而存在。我们从最底下的主干往上搭。 二、能力地图:先把 ERP 切成 L1–L5 ERP 的本质,是把财务、采购、生产、销售、仓库、人事全部装进一套系统,所有部门共用同一本账。要封装它,先得知道它的能力是怎么分层的——这张分层图是后面一切切分的基准。 ```mermaid flowchart LR ROOT[“L1 ERP 平台统一数据中枢”]

    AI Agent
  7. 深度研究智能体的生产级架构:来自 Thoughtworks 的实战复盘

    Sarang Kulkarni 在 Arc of AI Conference 2026 上分享了如何在医疗和制药研发场景中构建可靠的多智能体深度研究系统,揭示了三环架构、反思机制和工具设计的核心经验。

    AI Agent
  8. Kubernetes v1.36 深度解读:安全默认收紧与 AI 工作负载支持的成熟化

    Kubernetes v1.36(代号 Haru)带来 70 项增强,安全默认全面收紧,AI/ML 工作负载支持从实验走向生产就绪。

  9. $20、日常用不完的 Opus——我 Agent 体系的「一等公民」

    Notion Business 年付每月 $20、月付 $24(都不到 200 块/月),是目前合规、实测没遇到上限的 Opus 4.7 入口。一份订阅让 Notion AI 同时扮演三个角色——文档主仓、模型入口、跨工具上下文聚合器:SP

    AI Agent
  10. 3台设备、6个Agent、1个大脑:我的多Agent实战

    从记忆分裂到云端统一:一个架构师的多Agent实践

    AI Agent
京ICP备2021015985号-1