The best ChatGPT that $100 can buy.
10 月 13 日,AI 領域大神 AndrejKarpathy 發佈了自己的最新開源項目。截至當前,GitHub 項目上已經達到 29.1KStar。
nanochat 是什麼
nanochat 是 AI 領域專家 AndrejKarpathy 發佈的開源項目,該項目包含從數據準備、預訓練、中期訓練、監督微調(S
01 論文概述
論文名稱:
Direct Preference Optimization: Your Language Model is Secretly a Reward Model
—— DPO:你的語言模型,其實就是個獎勵模型
論文鏈接:https://arxiv.org/pdf/2305.18290
👉Lab4AI 鏈接:
https://www.lab4ai.cn/paper/det