博客 / 詳情

返回

一枚笑臉 emoji,估值 20 億美元!這個開源項目有點強...

從事 AI 技術開發的同學應該知道,GitHub 上有一個 Logo 為笑臉 Emoji 的開源項目:Hugging Face。它的 transformer 模型在 GitHub 擁有 6.2 萬 star 量,從當前項目估值來看,一個 Star 價值 1600 美元。

圖片

五年前,一家來自紐約的創業公司 Hugging Face 宣佈,它為那些頗感無聊的青少年打造了一款 iPhone 聊天機器人應用,可以分享一些電腦生成的人臉和笑話,也可以和 Siri 玩互動。換句話説,他們想打造一個可以理解任何類型對話主題的聊天機器人。

「我們可以和人工智能談論一切,就像你在科幻小説中看到的那樣。」

這款應用完全符合三位創始人的商業理念 —— 關於「開放領域的對話式人工智能」的想象,但基本沒有讓 Hugging Face 賺到什麼錢。

轉機發生在 2018 年,相應的對象不是青少年,而是開發者。那時候,Hugging Face 的創始人開始在線免費分享應用程序的底層代碼,包括谷歌、微軟在內的一些知名科技公司的研究人員開始將其應用於自己的 AI 程序。

如今,聊天機器人早已從 App Store 中下架,Hugging Face 已成為即用型機器學習模型的中心,超過 10000 家組織以這裏為起點,為其業務創建了 AI 驅動的工具。

前不久,這家備受矚目的開源創業公司 Hugging Face 宣佈完成 1 億美元 C 輪融資,本輪融資仍由 Lux Capital 領投,紅杉資本和 Coatue 首次參與跟投,其他跟投的投資方包括 Addition、Betaworks 等 Hugging Face 原有的投資方。

圖片

「機器學習正在成為構建技術、取代軟件的新方式,」Hugging Face 的聯合創始人兼 CEO Clément Delangue 説道,Hugging Face 的名字來源於一個表情符號,看起來像一張帶有手勢的笑臉。

據官方公告,本輪融資將用於 Hugging Face 未來在人工智能研究、開源、產品和負責任的民主化方面的投入。

因 Transformer 開源庫走紅

「自 2018 年首次開源 PyTorch BERT 以來,我們已經走了很長一段路,而且才剛剛開始!」

圖片

大約在同一時間,谷歌和 OpenAI 的研究人員公佈了 Transformer 模型,這種全新的 NLP 模型打破了當時 AI 模型閲讀理解能力的最好記錄。隨後,谷歌開始使用這種模型為其搜索結果提供支持。

對於想要利用這些 NLP 突破,但不可能像谷歌一樣從頭從搭建模型的機構來説,Hugging Face Transformer 開源庫的出現正趕上一個完美的時機。

在此後的時間裏,隨着機器學習社區越來越多成員將 Hugging Face 作為部署 Transformer 模型的中心基地,這家公司幾乎一炮而紅。「我們發佈東西時沒有考慮太多,而社區的爆炸式增長甚至讓我們感到驚訝,」Clément Delangue 説。

目前,Hugging Face 在 GitHub 平台上的 Transformer 開源庫已經有 62000 個 Star 和 14000 個分支。

圖片

由於該工具的成功,Hugging Face 很快成為所有機器學習模型相關內容的主要存儲庫 —— 不僅是自然語言處理。在該公司的網站上,人們現在可以瀏覽數千個預訓練的機器學習模型,使用你自己的模型參與開發者社區、下載數據集等等。

現在,Hugging Face 已經成為增長最快的社區和最常用的機器學習平台,擁有 10 萬個預訓練模型和 10000 個數據集,涵蓋自然語言處理、計算機視覺、語音、時間序列、生物、強化學習、化學等領域。

Hugging Face 正在試圖打造「機器學習領域的 GitHub」。它是一個社區驅動型的平台,擁有大量資源。開發人員可以在機器學習模型、數據集和 ML 應用程序上不斷創建、創新和互相協作。

Hugging Face 還提供託管服務,允許你通過編程接口使用數千個模型的推理 API,以及「自動訓練」模型的能力。

CEO:不想和 GitHub 一樣賣公司

在接受福布斯採訪時,Clément Delangue 表示,GitHub 是面向軟件的開源社區,而 Hugging Face 正在成為面向機器學習的社區。

2018 年,GitHub 以 75 億美元的價格被微軟收購,它最後的收入記錄是 3 億美元。目前,超過 7000 萬開發人員使用 GitHub 來共享和協作代碼。

據三位熟悉其財務狀況的人士稱,相比之下,Hugging Face 去年的收入不到 1000 萬美元。Delangue 沒有對這個數字發表評論,但他和投資者都認為機器學習已經成為 2020 年代最重要的一項技術。

Delangue 認為,如果 Hugging Face 有足夠多的忠實用户,那麼公司就能從僱傭這些用户的企業身上獲得資金。

「基於機器學習的價值以及它正在成為主流,會存在遞延收入,」Delangue 説。「我不確定機器學習是否會成為構建技術的默認方式,也不確定 Hugging Face 會成為這方面的 No.1 平台,我們也未曾設法創造數十億美元的收入。」

過去一年裏,Hugging Face 的團隊成員從 30 多人增加到了 120 多人。

圖片

在本輪融資過後,Hugging Face 計劃繼續現有的道路,現在已有超過 1 萬家公司正在使用該公司的服務。

Clément Delangue 透露,Hugging Face 去年才開始提供付費功能,並擁有 1000 多家公司作為客户,其中包括英特爾和他的老東家 eBay。藥企輝瑞(Pfizer)和羅氏(Roche)為企業級安全功能付費,而彭博社則通過 Hugging Face 為其實時終端運行機器學習。微軟不是客户,但使用了 Hugging Face 作為基礎來訓練必應搜索引擎,以更好地理解自然語言查詢。

本輪融資領投機構 Lux Capital 的合夥人 Brandon Reeves 表示:「無論是谷歌、亞馬遜還是 Facebook,你一開始會認為是競爭對手的公司,現在幾乎都成為了支持者,就像生態系統中的一塊不動產。」\
Clément Delangue 則認為:「作為一名企業家,我的個人心得之一是不要對十年的大型商業計劃進行過多的戰略思考,而是更多地進行實驗,遵循社區的驗證以及他們告訴你的內容。」\
如果願景成真,Brandon Reeves 認為獎金可能是 500 億美元或 1000 億美元的股市市值。這或許可以解釋,Clément Delangue 為何説自己拒絕了多個「有意義的收購要約」,並且不會像 GitHub 對微軟那樣出售自己的業務。

關於未來,Hugging Face CEO 還有一些有趣的想法:「我們希望成為第一家以表情符號上市的公司,而不是三個字母的股票代碼。」

他帶着類似公司 Logo 表情符號的微笑説:「我們必須開始對納斯達克進行一些遊説,以確保這件事能夠發生。」

更多技術乾貨內容前往公眾號【Python編程學習圈】瞭解,大量學習資料以及教程等你來領!

user avatar
0 位用戶收藏了這個故事!

發佈 評論

Some HTML is okay.