博客 / 列表

HuggingFace - Codex 正在推動開源 AI 模型的訓練與發佈

繼我們使用 Claude Code 訓練開源模型的項目之後,現在我們更進一步,將 Codex 引入這一流程。這裏的重點不是“Codex 自己開源模型”,而是讓 Codex 作為編碼代理,參與並自動化開源模型的訓練、評估與發佈全流程。為此,我們為 Codex 接入了 Hugging Face Skills 倉庫,該倉庫包含了許多與機器學習和 AI 相關的“技能”,比如模型訓練與評估等任務。通過 H

AI

HuggingFace - 經同意的語音克隆

在這篇博客文章中,我們介紹了“語音同意驗證機制 (voice consent gate)”的概念,支持通過明確同意來進行語音克隆。我們還提供了一個 示例 Space 應用 和 相關代碼,幫助大家快速上手這一想法。 近年來,逼真的語音生成技術已經達到了令人驚訝的水平。在某些情況下,生成出來的合成語音幾乎能以假亂真,和真人的聲音非常相似。如今,曾經只存在於科幻小説中的“語音克隆”已經成為現實。只需要

AI

HuggingFace - 流式數據集:效率提升 100 倍!

快速瞭解(TLDR) 現在只需一行代碼,就能通過 load_dataset('dataset', streaming=True) 以流式方式加載數據集,無需下載! 無需複雜配置、不佔磁盤空間、不再擔心 “磁盤已滿” 或 429 請求過多錯誤,立即開始訓練 TB 級數據集! 性能非常強勁:在 64×H100、256 個併發 worker 環境下,流式加載速度甚至超過本地 SSD!

AI

HuggingFace - huggingface_hub 1.0 正式版現已發佈:開源機器學習基礎五週年回顧

簡要總結: 經過五年的持續開發,huggingface_hub 發佈 v1.0 正式版!這一里程碑標誌着這個庫的成熟與穩定。它已成為 Python 生態中支撐 20 萬個依賴庫 的核心組件,並提供訪問超過 200 萬公開模型、50 萬公開數據集 和 100 萬 Space 應用 的基礎能力。本次更新包含為支持未來十年開源機器學習生態而做出的重大變更,由近 300 位貢獻者和數百萬用户共同推動發展。

AI

HuggingFace - huggingface_hub 1.0 正式版現已發佈:開源機器學習基礎五週年回顧

簡要總結: 經過五年的持續開發,huggingface_hub 發佈 v1.0 正式版!這一里程碑標誌着這個庫的成熟與穩定。它已成為 Python 生態中支撐 20 萬個依賴庫 的核心組件,並提供訪問超過 200 萬公開模型、50 萬公開數據集 和 100 萬 Space 應用 的基礎能力。本次更新包含為支持未來十年開源機器學習生態而做出的重大變更,由近 300 位貢獻者和數百萬用户共同推動發展。

人工智能

HuggingFace - Hugging Face 論文頁面功能指南

在飛速變化的研究世界中,緊跟最新進展至關重要。為幫助開發者與研究人員把握 人工智能 前沿動態,我們推出了 Daily Papers 頁面。自上線以來,Daily Papers 已收錄超過 1 萬 篇由 AK 與社區研究者精選的高質量論文。 不過,許多朋友可能還沒有充分體驗 Daily Papers 的全部功能。本文將帶你發現一些“隱藏功能”,幫助你把它用到極致。 認領論文 在 Daily Pape

AI

HuggingFace - 用開源模型強化你的 OCR 工作流

我們在這篇文章中新增了 Chandra 和 OlmOCR-2,並附上了它們在 OlmOCR 基準上的得分 🫡 摘要: 強大的視覺語言模型 (Vision-Language Models, VLMs) 的崛起,正在徹底改變文檔智能 (Document AI) 的格局。每種模型都有其獨特的優勢,因此選擇合適的模型變得棘手。相比閉源模型,開源權重的模型在成本效率和隱私保護上更具優勢。為了幫

AI

HuggingFace - 用開源模型強化你的 OCR 工作流

我們在這篇文章中新增了 Chandra 和 OlmOCR-2,並附上了它們在 OlmOCR 基準上的得分 🫡 摘要: 強大的視覺語言模型 (Vision-Language Models, VLMs) 的崛起,正在徹底改變文檔智能 (Document AI) 的格局。每種模型都有其獨特的優勢,因此選擇合適的模型變得棘手。相比閉源模型,開源權重的模型在成本效率和隱私保護上更具優勢。為了幫助你快

ocr , 人工智能

HuggingFace - 用 AI Sheets 解鎖圖像的力量

🧭簡要概覽:Hugging Face AI Sheets 是一款開源工具,能夠用 AI 模型增強數據集的處理能力,無需編寫任何代碼。現在新增視覺功能:可以從圖像 (如收據、文檔) 中提取數據、根據文本生成圖像、甚至編輯圖片——一切都能在電子表格中完成。依託 Inference Providers,可調用數千個開放模型。 我們非常高興地發佈 Hugging Face AI Sheets 的

AI

HuggingFace - 參加 Hugging Face 組織的 Gradio & MCP 智能體主題黑客鬆

🌟 歡迎參加 Gradio MCP 智能體主題黑客鬆! 準備好了嗎?一場以智能體(Agent)和模型上下文協議(Model Context Protocol,簡稱 MCP)為核心的全球在線黑客鬆即將來襲! 本次活動由 Hugging Face 舉辦,我們將共同探索基於 Anthropic MCP 和 AI Agentic 系統的最新可能性。 📅 活動時間: 2025 年 6 月

AI , mcp

HuggingFace - Hugging Face 開源 HopeJR 機器臂!今日直播帶你深入技術核心

我們的 LeRobot 項目又有了新動作 - HopeJR 正式開源! HopeJR 是一款擁有 23 自由度的開源仿生機械臂系統🦾,支持遙操作控制,具備完成複雜任務的能力,適用於科研與開發場景。整個機械臂用 3D 打印即可完成構建,硬件成本僅約 500 歐元!點擊這裏查看演示視頻。 亮點 23 自由度 :包括手部 16 個關節,可獨立控制五指每個指節。還有手臂 7 自由度,包含肩、肘、腕三軸聯

Scala

HuggingFace - LeRobot v0.4.0 正式發佈:全面提升開源機器人的學習能力

我們非常高興地宣佈,LeRobot 迎來一系列重大升級,讓開源的機器人學習比以往更強大、更可擴展、也更易用!從重構的數據集到靈活的編輯工具、新的仿真環境,以及面向硬件的全新插件系統,LeRobot 正在持續演進,以滿足前沿具身智能 (Embodied AI) 不斷髮展的需求。 簡要總結 LeRobot v0.4.0 為開源機器人領域帶來重要升級:引入可擴展的 Datasets v3.0、強大的新

機器人 , 人工智能

HuggingFace - 在 Transformers 中使用對比搜索生成可媲美人類水平的文本 🤗

1. 引言 自然語言生成 (即文本生成) 是自然語言處理 (NLP) 的核心任務之一。本文將介紹神經網絡文本生成領域當前最先進的解碼方法 對比搜索 (Contrastive Search)。提出該方法的論文 “A Contrastive Framework for Neural Text Generation” 最初發表於 NeurIPS 2022 (論文、官方實現)。此後, “Contrasti

人工智能 , transform

HuggingFace - 如何生成文本: 通過 Transformers 用不同的解碼方法生成文本

簡介 近年來,隨着以 OpenAI GPT2 模型 為代表的基於數百萬網頁數據訓練的大型 Transformer 語言模型的興起,開放域語言生成領域吸引了越來越多的關注。開放域中的條件語言生成效果令人印象深刻,典型的例子有: GPT2 在獨角獸話題上的精彩續寫,XLNet 以及 使用 CTRL 模型生成受控文本 等。促成這些進展的除了 transformer 架構的改進和大規模無監督訓練數據外,更

人工智能 , transform , huggingface