博客 / 詳情

返回

Nari Labs 更新 TTS 模型 Dia2,將推出語音到語音引擎;谷歌或重啓 AI 眼鏡,最快明年四季度發佈丨日報

開發者朋友們大家好:

這裏是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的技術」、「有亮點的產品」、「有思考的文章」、「有態度的觀點」、「有看點的活動」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。

本期編輯:@鮑勃 @Gemini(即將帶👓版)

01有話題的技術

1、Nari Labs 發佈 Dia2:流式對話式 TTS 模型,提供 1B 和 2B 參數版本

Nari Labs 發佈了名為「Dia2」的流式對話式文本到語音(TTS)模型,其核心亮點在於能夠邊接收輸入邊生成音頻,實現實時、自然的語音交互。該模型目前提供 1B 和 2B 參數版本,旨在加速 TTS 領域的研究。

  • 流式生成: 「Dia2」模型無需等待完整文本輸入即可開始生成音頻,大大縮短了響應延遲,適用於實時對話場景。
  • 條件生成: 支持通過音頻輸入進行條件生成,可以利用現有音頻(如前段對話)來生成更符合上下文的語音,提升對話的自然度。
  • 模型版本: 提供 1B 和 2B 參數兩種模型檢查點,滿足不同性能和資源需求的研究場景。
  • 易於集成: 提供快速上手指南(Quickstart)和 Gradio 應用,方便開發者快速部署和體驗。

目前,「Dia2」支持不超過 2 分鐘的英文音頻生成。Nari Labs 計劃推出「Dia2 TTS Server」以支持真正的流式傳輸,併發布基於「Dia2」的語音到語音引擎「Sori」。

https://huggingface.co/nari-labs/Dia2-2B

(@Huggingface)

2、消息稱谷歌重啓 AI 眼鏡:富士康代工、三星設計,最快明年四季度發佈

11 月 27 日消息,據報道,谷歌已於去年年底立項兩個 AI 眼鏡項目,目前兩項目已經進入 POC(小批量試產)階段,正在密集推進選型、ID 設計。知情人士透露,谷歌 AI 眼鏡的硬件代工由富士康負責,參考設計由三星提供,而芯片則由高通供應。此外,谷歌近期還與包括歌爾在內的中國供應商進行了接觸。

報道稱,谷歌的 AI 眼鏡預計最早將於 2026 年第四季度發佈。在產品方面,該設備大概率將採用波導片光學方案,並配備攝像頭。項目負責人之一是 Google Labs 的平台工程負責人 Michael Klug,他曾是明星創業公司 Magic Leap 的核心成員,在光場顯示等領域擁有豐富經驗。

據瞭解,谷歌是智能眼鏡行業的先驅。早在 2012 年,谷歌創始人謝爾蓋・布林通過一場跳傘直播演示,向全世界發佈了 Google Glass,開啓了可穿戴設備及增強現實概念的新篇章。然而,由於公眾場合拍照引發的隱私問題,Google Glass 在 2015 年宣告關閉。2017 年以後,谷歌重新啓動相關項目,策略也更加審慎。產品思路從炫技的概念機轉變為解決實際問題的工具,商業化方向也從消費級市場轉向企業級(toB)應用。

(@IT 之家)

3、全國首例「醫保價」腦機接口手術完成 置入費 6552 元/次

11 月 27 日消息,據媒體綜合報道,11 月 26 日,在華中科技大學同濟醫院神經外科,我國首例按照政府核定醫療服務價格項目執行的腦機接口手術順利完成。

此次手術採用武漢衷華腦機融合科技發展有限公司生產的植入式腦機接口設備,可用於監測大腦手部運動和感覺區域的腦電信號。

值得一提的是,本次手術是我國首例按照政府核定醫療服務價格項目執行的腦機接口臨牀操作(即侵入式腦機接口置入費 6552 元/次,不含腦機接口設備等費用),標誌着腦機接口技術從科研探索階段正式進入醫療服務收費目錄體系,在推動技術普惠化與產業化方面邁出重要一步。

今年 3 月 31 日,湖北省醫保局率先發布全國首個腦機接口醫療服務價格,明確「侵入式腦機接口置入費」為 6552 元/次。這一開創性的政策,為腦機接口技術納入規範化診療體系鋪設了制度通道。

但從政策出台到臨牀落地仍需關鍵一躍。同濟醫院負責人表示,本次手術的費用雖然是由研究經費承擔,無需患者自付費用,但這是全國率先將腦機接口手術納入醫院診療項目體系,並按照規範標準進行收費結算的臨牀實踐。

(@快科技)

02有亮點的產品

1、無問芯穹完成近 5 億元 A+輪融資

近日,完成近 5 億元 A+ 輪融資,本輪融資由珠海科技集團、孚騰資本(元創未來基金)領投,惠遠資本、尚頎資本和弘暉基金跟投,老股東洪泰基金、達晨財智、尚勢資本&海棠基金、聯想創投、君聯資本、申萬宏源、徐匯科創投、元智未來持續追投。此次融資陣容匯聚國家產業資本與頭部市場化基金,「國資+市場」的雙重認可,既肯定了公司面向國家重大戰略需求的技術創新,也充分鼓勵着無問芯穹,在人工智能產業落地及基礎設施生態建設中持續夯實價值創造。

本輪募集資金將主要被投入三大方向:一是持續擴大無問芯穹軟硬協同、多元異構的技術領先優勢;二是推動 AI 雲產品與 AI 終端方案在產業中的規模化拓展;三是加大智能體基礎設施研發投入,構建一流的智能體服務平台及配套雲、端基礎設施,加速實現智能體在數字世界與物理世界中的規模化普惠應用。

(@無問芯穹)

2、Klariqo AI Voice Assistants:面向中小企業,實現 3 分鐘部署全天候智能客服

Klariqo AI Voice Assistants 推出了一個「業務優先」的 AI 語音智能體平台,旨在革新中小企業和 SaaS 公司的客户支持體驗。該平台通過提供無代碼、3 分鐘快速部署的全天候智能體,簡化了傳統 AI 工具的複雜性,有效解決企業電話和網站客服痛點,從而提升客户滿意度和銷售轉化率。

  • 極簡部署與無代碼體驗: Klariqo 宣稱用户可在 3 分鐘內完成設置,無需任何 API、webhook 或複雜開發知識,徹底降低了 AI 語音智能體的技術門檻,讓非技術背景的企業主也能輕鬆上手。
  • 全渠道 24/7 智能互動: 智能體能以自然語音和口音(如美式、澳式)全天候接聽電話,並同步處理網站聊天,確保客户的諮詢總能得到及時響應,告別傳統枯燥的文本聊天機器人。
  • 內置業務管理功能: 集成「日曆」和「潛在客户管理」功能,智能體能自動預訂預約、捕獲潛在客户信息,並回答常見問題,幫助企業在非工作時間也能持續運營和銷售。
  • 智能體與人工無縫協作: Klariqo 提供按需轉接人工客服的功能,以應對複雜查詢或客户明確要求,實現了自動化與個性化服務之間的靈活切換。
  • 深度數據洞察: 平台允許用户追蹤通話記錄、閲讀對話記錄,並分析用户情緒,為企業提供寶貴的數據支持,以便持續優化客户服務策略。

(@Product Hunt)

3、Quo (原 OpenPhone) 融資 1.05 億美元,提供中小企業客服

原「OpenPhone」公司現已更名為「Quo」,並宣佈獲得包括 General Catalyst 在內的現有投資者 1.05 億美元(9600 萬美元增長投資 + 900 萬美元股權)融資。此次融資將加速其 AI 驅動的商業電話解決方案的產品創新和市場擴張,標誌着公司進入高速增長新階段。

  • 品牌重塑與融資: OpenPhone 正式更名為 Quo,並獲得 1.05 億美元融資,將重點投入到 AI 功能的研發和市場拓展上。
  • AI 驅動的「智能體」Sona: Quo 推出的 AI 電話「智能體」Sona 現已對所有客户免費開放,並升級了轉接和更智能的場景處理能力,已處理超過 200,000 通電話,顯著提升了中小企業的客户溝通效率。
  • 中小企業市場聚焦: Quo 致力於為佔美國和加拿大公司總數近 99% 的中小企業提供先進的通訊解決方案,幫助它們在 AI 時代更好地服務客户,縮小與大型企業的技術差距。
  • 產品創新與定價模型: 新的定價模型採用分級、按使用量付費,並增加了多級電話菜單和臨時呼叫流程等功能,以滿足不同規模企業的靈活需求。
  • 用户增長顯著: 過去六個月,Quo 吸引了超過 30,000 家新客户,總用户數接近 90,000 家,並在 G2 平台上獲得 #1 的客户滿意度評級。

(@Quo)


03有態度的觀點

1、 Cognitive Resonance 創始人:AI 並不能思考

Cognitive Resonance 創始人 Benjamin Riley 認為 AI 並不能思考。

今天的 AI 熱是基於一個根本性的誤解:語言的建模並不等同於智能。根據目前的神經學,人類的思維在很大程度上獨立於人類語言,幾乎沒有理由相信,越來越複雜的語言建模能達到甚至超越人類水平的智能。

人類用語言交流,用語言創造比喻去描述推理過程。失去語言能力的人仍然能展示出推理能力。當人類對現有的比喻不滿時他們能創造出新的知識。愛因斯坦的相對論不是基於科學研究。他是在思想實驗的基礎上發展起來的,因為他不滿足於當時的比喻。常識不過是一堆死氣沉沉的比喻,而 AI 只會以有趣的方式重新排列舊的比喻,AI 永遠不會對現有的數據或比喻感到不滿。AI 基於的大語言模型使用的數據收集自互聯網。互聯網上使用的語言並不能代表現實世界上的語言。比如因紐特人的語言使用的比喻在歐洲語言中找不到。而如果互聯網上沒有這些比喻,那麼 AI 也不可能創造出來。這並不意味着 AI 毫無用處。但它與人類智能相去甚遠。

(@Solidot)

寫在最後:

我們歡迎更多的小夥伴參與 「RTE 開發者日報」 內容的共創,感興趣的朋友請通過開發者社區或公眾號留言聯繫,記得報暗號「共創」。

對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、項目、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。

作者提示:個人觀點,僅供參考

user avatar
0 位用戶收藏了這個故事!

發佈 評論

Some HTML is okay.