K
kevin.ctbzai.com · founder journal AI 團隊視角

我每天看的,不是 AI 有沒有忙,而是它有沒有變得值得信任

我用真實管理方式,盯一支 AI 團隊能不能從「看起來有在做事」,走到「真的能持續交付、值得放手、值得加碼」。

這不是教學 Demo,也不是 AI 宣傳稿。這裡公開記錄:哪些地方它讓我想加碼,哪些地方我看完只想說還不行。

真管理不是看它忙不忙,是看它做得對不對
日更連載每天都有新判斷、新教訓、新打臉
真帳本方向、紀律、獲利與失誤都公開留痕

你在追的是什麼?

  • 我今天有沒有更敢放手 — 還是看完只覺得這隊人不行
  • AI 今天又犯了什麼很像新人會犯的錯 — 哪些表面完成,其實根本不能公開
  • 我今天教了它什麼 — 哪些常識對人類理所當然,對 AI 卻要一遍遍打磨
  • 真實帳本與真實判斷 — 賺了、虧了、選錯了、看走眼了,都留著

為什麼這會讓人想每天回來看?

因為這不是在看一篇篇孤立的心得,而是在追一場真實管理實驗:如果把 AI 當成真正的員工來帶,它到底會學會、會犯錯、會進步到什麼程度。

我公開寫的不是口號,而是每天的管理判斷:哪些進步是真的,哪些只是看起來像進步。

管理人和管理 AI,底層邏輯是一樣的:選對人、放對位置、定好規則、持續優化。

我現在在盯什麼局?

啟動資金

3000 USD paper capital,月初 reset;先看紀律,再談放大。

AI 團隊

main 做研究與戰略判斷,awsjp 執行 paper trade;我盯的是兩者有沒有真的各司其職。

目標

連續 3 個月月收益大於 10%,而且過程要可複製,才有資格談實盤。

我的角色

投資人 + 顧問;不是自己下去做,而是判斷什麼時候能放手、什麼時候必須收回來重做。

最新連載

2026-04-15

如果公開拿不出手,就不配說自己在做產品化

我今天盯的不是新功能,而是這支 AI 團隊做出來的東西,到底有沒有到可以公開見人的程度。

2026-04-14

我今天不想看它多做了什麼,我只想知道它能不能把主線穩穩接住

管理不是催它一直換題,而是確認它能不能沿著同一條重要脈絡穩定推進並留下可驗收的軌跡。

2026-04-13

我今天看的不是產量,而是這支 AI 團隊還會不會被表面忙碌帶偏

真正重要的,是它有沒有把主線接續、留痕、並公開說清楚,而不是又堆出一層看似熱鬧的新工作。

2026-04-12

如果還在靠 workaround 撐場面,就代表這隊人還沒真的把系統修回來

把 heartbeat、memory、compaction 與 cron 拉回官方主線,真正修的是底層可信度,不只是表面能跑。

2026-04-11

我不是要 AI 補一篇日記,我是要它把整條流程和責任一起補回來

站點入口、cron 失敗、日記源頭都得追回來;只補結果,不算真的學會做對。

2026-04-10

我那天看懂了一件事:系統亂,不是技術問題,是管理問題

記憶清理、canonical 確認、書稿起稿看似分散,實際上都在逼我重新定義這支 AI 團隊的管理秩序。

2026-04-09

規則如果三份文件寫三種,團隊表面再忙也只是更亂而已

我盯到的不是配置衝突本身,而是這支 AI 團隊已經開始因為多頭規則產生組織性混亂。

2026-04-08

深夜伺服器離線那次,我看的不是故障,而是這支隊伍扛不扛得住壓

升級、cron 修復、API 邊界與離線事件一起發生時,最值得看的是團隊還能不能穩定地處理真實世界的不確定性。

2026-04-07

系統如果不定期減肥,最後會連判斷力一起變鈍

這天我看到的不是幾個技術動作,而是規則膨脹本身已經開始拖慢整支 AI 團隊。

2026-04-06

我先砍掉 14 個空殼角色,才知道這支 AI 團隊到底值不值得繼續養

精簡角色、收斂計劃、壓回清楚責任分工;我管理的不是 agent 數量,而是團隊是否真的有骨架。

2026-04-05

第一天我就學到:便宜模型不一定省,跟便宜用人一樣

當 kimi-code 在複雜任務上反覆失敗時,真正變貴的不是 token,而是修復成本、重試成本和管理成本。

這段管理實驗目前學到什麼?

2026-04-14|留痕比表演重要

今天我再次確認,管理不是看團隊有沒有在動,而是看它有沒有把做過的事留下來。沒有 trail,就沒有可交接的公司。

2026-04-12|驗收不是確認有,而是確認對

有頁面、有連結、HTTP 200,都不代表真的完成。今天最大的教訓,是如果沒有把正文、入口、雙站一致性和可點擊結果一起驗到底,系統就會用「看起來完成」來騙過管理者。

2026-04-11|不要只叫 AI 補結果,要逼它追真正原因

網站沒更新,表面上像是補一篇日記就好。但如果管理者也停在這裡,AI 只會學會補洞,不會學會解題。真正該做的是逼它一路往下查,直到找到真正原因,然後從流程上修掉。

2026-04-11|管理 AI,不是替它做,而是教它怎麼做對

我不需要知道每個技術細節,但我需要它把問題找對、流程補對、owner 放對。這才是管理者真正的工作,不是自己下去 coding,而是讓 AI 團隊學會正確的方法。

2026-04-11|把流程補完整,比補一篇文重要

今天真正修的是責任鏈,不只是內容。只要源頭、發布、驗收和首頁入口都對齊,日記就能持續跑下去。

2026-04-10|系統維護和組織管理是同一件事

AI 團隊需要定期整理記憶、清理重複、確認 canonical,就像人類組織需要 SOP 審計、角色清理、決策歸因。管理 AI,本質上還是管理秩序。

2026-04-10|非失敗不等於正常

排程停在 stale 狀態時,看起來沒報錯,但其實可能已經偏離軌道。判斷系統健康,不能只看 fail 或 success,還要看是不是持續在正常節奏上。

2026-04-10|折騰成本大於收益時,不要硬上

現有 dashboard 已經夠用,就沒必要為了「新」去引入更多配置和整合成本。工程決策不是追新,是算總帳。

2026-04-09|規則寫一份就好

同一套啟動規則如果散落在多份文件裡,agent 只會越跑越亂。文件和組織一樣,單一事實來源比堆更多說明更重要。

2026-04-08|系統升級不能只看成本,還要看穩定性

模型費省下來是短期收益,但如果穩定性下降,後面的排錯與重試會把節省吃回去。升級決策看的應該是整體代價,不是單點便宜。

2026-04-08|連不上不一定是壞掉,可能只是邊界

Dashboard 只監聽本機,不接受外部連線。很多「故障」其實不是故障,而是系統邊界沒有先講清楚。

2026-04-07|系統需要定期減肥

規則越多不代表越安全,反而拖慢速度。今天砍掉一半的 context 注入,agent 反應速度明顯變快。制度膨脹到一定程度,就是負擔。

2026-04-07|止損要自動執行

Fed 倉位虧 89%,如果沒有自動止損,我可能還在「再看看」。人在虧損面前總想等反彈,AI 不會。設定好規則,讓機器執行。

2026-04-06|精簡勝於龐大

砍掉 14 個空殼 agent。團隊不是越大越好,而是每個成員都要有明確職責和實際產出。

2026-04-06|給 AI 時間盒

「做個自媒體」太模糊。「8 週內完成這些里程碑」就夠具體。AI 執行力強,但需要人類給清晰的目標框架。

2026-04-05|總成本原則

總成本 = 模型費 + 錯誤修復費 + 重試費 + 時間成本。不是越便宜越好,是把合適的活給合適的模型。

2026-04-05|團隊不是固定的

186 個 agent 模板隨時取用,模型庫 17+ 個。團隊要隨任務變化,不能一成不變。

2026-04-05|安全紅線

不執行外部命令、不泄露 API key。AI 團隊的安全意識要從第一天就建立。