Andrej Karpath 在過去幾周裏大量使用 Claude 編碼的體驗

特斯拉前自動駕駛負責人、OpenAI 聯合創始人 Andrej Karpathy 分享了他在過去幾周裏大量使用 Claude 編碼的體驗。

🌟編碼工作流

隨着大模型編碼能力的最新一波提升，和很多人一樣，我在 11 月還大約是 80% 手寫+自動補全、20% 用 agent；到 12 月就迅速變成了 80% agent 編碼、20% 修改和收尾。

也就是説，我現在基本是在用英語寫程序了，有點不好意思地用“文字”告訴 LLM 要寫什麼代碼。這多少會傷一點自尊，但能在軟件層面做大規模的“代碼級操作”實在是太有用，只要你適應它、配置好它、學會怎麼用，並且真正理解它能做什麼、不能做什麼。

這是我近二十年編程生涯裏，對基礎編碼工作流影響最大的一次變化，而且只用了幾周時間。

我估計，工程師羣體裏已經有兩位數百分比的人正在經歷類似的轉變，但普通大眾的感知度可能還停留在個位數的低位。

🌟IDE / agent 羣 / 出錯性

不管是“已經不需要 IDE 了”，還是“agent 羣將一切自動化”，我都覺得現在有點過度宣傳。模型確實還會犯錯，如果是你真正關心的代碼，還是要在旁邊開一個好用的大 IDE，盯緊它們。

錯誤的類型已經變了——不再是簡單的語法問題，而是那種略顯草率、匆忙的初級工程師會犯的概念性錯誤。

最常見的一類是：模型替你做了錯誤假設，然後一路跑下去卻不做校驗。它們也不太會管理自己的困惑，不會主動澄清、不太會暴露不一致、不善於呈現取捨點，該反駁的時候也不反駁，而且多少有點迎合。

進入 plan 模式後情況會好一些，但感覺還需要一種輕量、內聯的計劃模式。它們還很喜歡把代碼和 API 搞複雜：抽象膨脹、遺留死代碼不清理等等。

經常會寫出 1000 行低效、臃腫、脆弱的實現，然後你提醒一句“呃，其實這樣不就行了嗎？”，它們就會説“當然！”並立刻壓縮到 100 行。

有時它們還會順手改掉或刪掉一些自己不喜歡、或沒完全理解的註釋和代碼，即便這些和當前任務並不相關。即使在 CLAUDE.md 裏寫了一些簡單約束，也很難完全避免這些問題。

即便如此，整體依然是巨大提升，很難想象再回到純手工編碼。

TLDR：每個人都有自己的流程，我現在是左邊開幾個 CC 會話（ghostty 的窗口或標籤頁），右邊開 IDE 用來看代碼和手動修改。

🌟韌性

看 agent 死磕一個問題非常有意思。它們不會累，不會泄氣，只會不斷嘗試；換成人，可能早就放棄，改天再説了。

看着它掙扎很久，30 分鐘後突然成功，會有一種“觸碰到 AGI 感覺”的瞬間。你會意識到，耐力本身是工作的一個重要瓶頸，而有了 LLM，這個瓶頸被大幅抬高了。

🌟提速

很難準確衡量 LLM 帶來的“提速”到底是多少。當然，我明顯感覺自己做原本要做的事情更快了，但更大的變化在於：我做了更多原本根本不會去做的事情，因為一是很多以前不值得寫的東西，現在隨手就能寫；二是一些以前因知識或技能限制而不敢碰的代碼，現在也能上手。所以這既是速度提升，也更像是一種能力範圍的擴展。

🌟槓桿

LLM 特別擅長反覆循環，直到滿足明確的目標，這也是很多“AGI 既視感”所在。

與其告訴它一步步怎麼做，不如給出成功標準，看它自己跑。讓它先寫測試，再把測試跑通；把它和瀏覽器 MCP 放進同一個循環；先寫一個很可能正確但樸素的算法，再要求它在保持正確性的前提下優化；把思路從命令式改成聲明式，讓 agent 循環得更久、獲得更大槓桿。

🌟樂趣

我沒預料到，用 agent 編程反而更有趣了，因為大量填空式的苦活被拿走，留下的是更偏創意的部分。

我也更少卡住（而卡住本身並不好玩），膽子變大了，因為幾乎總能找到一種和它配合、往前推進的方式。

我也見過相反的看法；LLM 編碼可能會把工程師分成兩類：主要喜歡寫代碼的人，和主要喜歡做產品、做系統的人。

🌟退化

我已經注意到，自己手寫代碼的能力在慢慢退化。生成（寫代碼）和判別（讀代碼）是大腦中不同的能力。編程裏有大量偏語法、偏細節的東西，即便你寫得不順，讀和評審代碼依然可以做得不錯。

🌟Slopacolypse

我對 2026 年已經做好心理準備：GitHub、Substack、arXiv、X/Instagram，以及幾乎所有數字媒體，都會迎來一波內容氾濫。

同時也會出現更多“AI 提效表演”，夾雜在真實、實質性的改進之中。

🌟一些問題

最近常在想：“10X 工程師”會發生什麼變化？平均工程師和頂尖工程師之間的生產力差距，可能會被進一步放大。

配上 LLM 後，通才是否會越來越壓過專才？

LLM 在補齊細節層面（micro）很強，但在整體戰略層面（macro）相對弱一些。

未來的 LLM 編碼體驗會更像什麼？打《星際爭霸》？玩《Factorio》？還是演奏音樂？

社會中有多少環節，其實被數字化知識工作所限制？

🌟TLDR / 去向

到 2025 年 12 月左右，LLM agent 的能力（尤其是 Claude 和 Codex）似乎跨過了某個連貫性的門檻，在軟件工程及相關領域引發了一次相變。

智能本身的進展，已經明顯快於其他配套因素——工具與知識的整合、新的組織流程與工作方式、以及更廣泛的擴散。2026 年註定會是一個能量密度很高的年份，整個行業都在消化這種新能力。

🔗來源：https://weibo.com/2194035935/5259977354643037（微博：蟻工廠）

發佈評論

Product

Company

Support

Company

Andrej Karpath 在過去幾周裏大量使用 Claude 編碼的體驗

發佈 評論

發佈評論