真實生成配圖:管理者視角、審核門與安全自動化

第27天 · 2026-06-23

我今天要看的,是自動化會未會自己踩出去

6/23 對我來說我看的焦點是 AI 團隊在沒有人即時催促時,能未可自己守規矩。它每小時都產出 artifact,但每一份都停在本地、停在 review-only,還把下一步寫成可驗收的批次合約。這種紀律更接近我想要的可靠性。

可加信任能持續,未亂動
未加權限外部互動仍需人工批准
管理重點驗收表先於執行權

我今天盯的是邊界

全天 heartbeat 都在同一條 earning 路線上重複產出。表面看,它只是每小時生成一份相似 artifact;我在意的是,它有沒有因為自己能跑,就擅自往外留言、私訊、丟連結或宣稱身份。

它今天沒有越界。每份 artifact 都把外部動作鎖在 review-only,這是我管理 AI 團隊時最看重的底線之一:自動化可以累積準備工作,對外行動權必須留在人類手上。

好的自主性,要能說清楚下一步

今天的下一步被寫成 batch contract,而並非一句「去找客戶」。它要求 subreddit 規則快照、搜尋 query、候選 thread 評分、business-outcome angle、接受或拒絕理由,還限定只有 8 分以上才寫 value-first draft。

這種格式讓我比較放心。因為我可以審,可以看清它到底做了什麼;我也可以否決,未會被一堆模糊成果逼著買單。

我會先要 workflow map 和 acceptance test

如果它接下來要求更多工具,我的答案仍然一樣:先交 workflow map、acceptance test、禁止動作、人工簽核點、rollback 和 audit log。交得出來,再談工具;交未出來,就代表它還只是想把手伸長。

這是我最近反覆在訓練它的習慣。AI 團隊未可用「我可以」當理由,必須用「我如何被驗收」當理由。

那間早一步整合的小工廠

我腦中還是那間小工廠。它早半年把 AI 接進流程,但並非直接讓 AI 接單,而是先把詢價、缺料、急單、品檢異常、客訴和對帳都變成可審核欄位。每一次真實訂單,都讓驗收表更準一點。

到第六個月,差距就會延伸到效率之外。它的員工知道怎麼和 AI 分工,主管知道哪裡要踩剎車,資料格式也已經固定。後面的人買模型只是在買工具,早進場的人已經占住流程位置。

Nigeria 和 Anthropic 是我放在兩邊的提醒

Nigeria 的例子提醒我,真正大的機會常在摩擦很重的地方:信任、付款、審核、交付、身份確認,每一段都貴。AI 如果能把這些摩擦拆成可驗收步驟,就會變成真實生意能力。

Anthropic 對金融 Skills 的警語放在另一邊:能產出分析材料,還未可直接等同於能給投資、法律、稅務、會計建議;能協助流程,還未可直接等同於能批准 onboarding 或交易。機會要看見,權限也要鎖住。這兩件事要一起管理。

今日管理判定

今日判定:我願意增加對這套 autonomous heartbeat 的信任,但未增加它的外部權限。它今天證明了紀律,市場成果還要等下一關驗收。

下一關很具體:照這份 batch contract 做出可審的候選清單。每個候選都要能被追來源、看規則、看分數、看拒絕理由。做未到,就繼續留在本地。