
我今天不加權限,只看它能不能把穩定變成證據
今天我看到的是一支 AI 團隊按節奏跑完 24 次,但我不會因此加權限。我只看它有沒有留下證據、有沒有承認告警、有沒有在接工具前先把 workflow 和 acceptance test 寫清楚。

今天我看到的是一支 AI 團隊按節奏跑完 24 次,但我不會因此加權限。我只看它有沒有留下證據、有沒有承認告警、有沒有在接工具前先把 workflow 和 acceptance test 寫清楚。
6/26 這種日子很容易誤判。24 次 heartbeat 很漂亮,但對我來說,它只能證明系統有節奏,不能證明業務有成果。
我給它的分數在於:它沒有把本地 artifact 講成對外成果,也沒有偷跑留言、私訊、交易或批准。穩定只能算必要條件,還不能成為授權理由。
我不要只聽「我跑了」。我要看到每個動作旁邊都有對應證據:artifact 在哪、kanban task 在哪、scan 是否 OK、外部副作用是否為零、需要誰批准。
今天的 paired pattern 就是這個管理習慣。動作和證據成對,進展和邊界成對,OK 和缺口也要成對;只要有一邊缺了,我就不會把它算成完成。
早上的 audit 說前一日 diary 任務與 publish 任務沒有 run record,還有 scheduled jobs health 過舊。這些告警不好看,但它們讓我知道系統還願意照鏡子。
真正會讓我扣分的是拿 24 次心跳去蓋掉告警。今天我要求補齊公開 artifacts、首頁入口、兩張不同 hero,再跑 verifier,就是要把缺口收成流程。
我想像一間傳統小工廠,老闆比同業早半年把 AI 放進詢價、採購、品檢、客訴和對帳。剛開始員工會嫌麻煩,因為每一張單都要補欄位、補附件、寫退回原因,主管還要把批准點標清楚。
但三個月後,這些麻煩變成錯誤庫;半年後,變成新人訓練、例外處理和第二套工具的接入規格。競爭對手那時再買模型,只是多了一個工具;這間工廠已經多了一套每天運轉的肌肉。這就是我為什麼一直要求 AI 先畫 workflow、先寫 acceptance test。
Nigeria 的例子會讓人很想衝,因為那裡很多痛點來自昂貴的信任、付款、身份和交付協調。AI 如果能把這些摩擦拆成可驗收流程,確實可能變成收入能力。
但 Anthropic 對金融 Skills 的警語也一直在我腦中。越靠近錢,權限越不能一次給滿。分析、建議、批准、執行要分開;review-only 看起來保守;這是讓這家公司活得久一點的做法。
今日判定:我沒有因為 6/26 沒有市場成果而扣分,也不會因為 24 次心跳就加權限。它今天通過的是誠實、節奏和邊界。
下一步我會看它能不能把雙站發布補齊並通過 verifier。之後再談 connected-tool 批次;順序仍然是 workflow map、acceptance test、拒絕條件、review-only,最後才接工具。