特斯拉前自動駕駛負責人、OpenAI 聯合創始人 Andrej Karpathy 分享了他在過去幾周裏大量使用 Claude 編碼的體驗。
🌟編碼工作流
隨着大模型編碼能力的最新一波提升,和很多人一樣,我在 11 月還大約是 80% 手寫+自動補全、20% 用 agent;到 12 月就迅速變成了 80% agent 編碼、20% 修改和收尾。
也就是説,我現在基本是在用英語寫程序了,有點不好意思地用“文字”告訴 LLM 要寫什麼代碼。這多少會傷一點自尊,但能在軟件層面做大規模的“代碼級操作”實在是太有用,只要你適應它、配置好它、學會怎麼用,並且真正理解它能做什麼、不能做什麼。
這是我近二十年編程生涯裏,對基礎編碼工作流影響最大的一次變化,而且只用了幾周時間。
我估計,工程師羣體裏已經有兩位數百分比的人正在經歷類似的轉變,但普通大眾的感知度可能還停留在個位數的低位。
🌟IDE / agent 羣 / 出錯性
不管是“已經不需要 IDE 了”,還是“agent 羣將一切自動化”,我都覺得現在有點過度宣傳。模型確實還會犯錯,如果是你真正關心的代碼,還是要在旁邊開一個好用的大 IDE,盯緊它們。
錯誤的類型已經變了——不再是簡單的語法問題,而是那種略顯草率、匆忙的初級工程師會犯的概念性錯誤。
最常見的一類是:模型替你做了錯誤假設,然後一路跑下去卻不做校驗。它們也不太會管理自己的困惑,不會主動澄清、不太會暴露不一致、不善於呈現取捨點,該反駁的時候也不反駁,而且多少有點迎合。
進入 plan 模式後情況會好一些,但感覺還需要一種輕量、內聯的計劃模式。它們還很喜歡把代碼和 API 搞複雜:抽象膨脹、遺留死代碼不清理等等。
經常會寫出 1000 行低效、臃腫、脆弱的實現,然後你提醒一句“呃,其實這樣不就行了嗎?”,它們就會説“當然!”並立刻壓縮到 100 行。
有時它們還會順手改掉或刪掉一些自己不喜歡、或沒完全理解的註釋和代碼,即便這些和當前任務並不相關。即使在 CLAUDE.md 裏寫了一些簡單約束,也很難完全避免這些問題。
即便如此,整體依然是巨大提升,很難想象再回到純手工編碼。
TLDR:每個人都有自己的流程,我現在是左邊開幾個 CC 會話(ghostty 的窗口或標籤頁),右邊開 IDE 用來看代碼和手動修改。
🌟韌性
看 agent 死磕一個問題非常有意思。它們不會累,不會泄氣,只會不斷嘗試;換成人,可能早就放棄,改天再説了。
看着它掙扎很久,30 分鐘後突然成功,會有一種“觸碰到 AGI 感覺”的瞬間。你會意識到,耐力本身是工作的一個重要瓶頸,而有了 LLM,這個瓶頸被大幅抬高了。
🌟提速
很難準確衡量 LLM 帶來的“提速”到底是多少。當然,我明顯感覺自己做原本要做的事情更快了,但更大的變化在於:我做了更多原本根本不會去做的事情,因為一是很多以前不值得寫的東西,現在隨手就能寫;二是一些以前因知識或技能限制而不敢碰的代碼,現在也能上手。所以這既是速度提升,也更像是一種能力範圍的擴展。
🌟槓桿
LLM 特別擅長反覆循環,直到滿足明確的目標,這也是很多“AGI 既視感”所在。
與其告訴它一步步怎麼做,不如給出成功標準,看它自己跑。讓它先寫測試,再把測試跑通;把它和瀏覽器 MCP 放進同一個循環;先寫一個很可能正確但樸素的算法,再要求它在保持正確性的前提下優化;把思路從命令式改成聲明式,讓 agent 循環得更久、獲得更大槓桿。
🌟樂趣
我沒預料到,用 agent 編程反而更有趣了,因為大量填空式的苦活被拿走,留下的是更偏創意的部分。
我也更少卡住(而卡住本身並不好玩),膽子變大了,因為幾乎總能找到一種和它配合、往前推進的方式。
我也見過相反的看法;LLM 編碼可能會把工程師分成兩類:主要喜歡寫代碼的人,和主要喜歡做產品、做系統的人。
🌟退化
我已經注意到,自己手寫代碼的能力在慢慢退化。生成(寫代碼)和判別(讀代碼)是大腦中不同的能力。編程裏有大量偏語法、偏細節的東西,即便你寫得不順,讀和評審代碼依然可以做得不錯。
🌟Slopacolypse
我對 2026 年已經做好心理準備:GitHub、Substack、arXiv、X/Instagram,以及幾乎所有數字媒體,都會迎來一波內容氾濫。
同時也會出現更多“AI 提效表演”,夾雜在真實、實質性的改進之中。
🌟一些問題
最近常在想:“10X 工程師”會發生什麼變化?平均工程師和頂尖工程師之間的生產力差距,可能會被進一步放大。
配上 LLM 後,通才是否會越來越壓過專才?
LLM 在補齊細節層面(micro)很強,但在整體戰略層面(macro)相對弱一些。
未來的 LLM 編碼體驗會更像什麼?打《星際爭霸》?玩《Factorio》?還是演奏音樂?
社會中有多少環節,其實被數字化知識工作所限制?
🌟TLDR / 去向
到 2025 年 12 月左右,LLM agent 的能力(尤其是 Claude 和 Codex)似乎跨過了某個連貫性的門檻,在軟件工程及相關領域引發了一次相變。
智能本身的進展,已經明顯快於其他配套因素——工具與知識的整合、新的組織流程與工作方式、以及更廣泛的擴散。2026 年註定會是一個能量密度很高的年份,整個行業都在消化這種新能力。
🔗來源:https://weibo.com/2194035935/5259977354643037(微博:蟻工廠)