開發者朋友們大家好:
這裏是 「RTE 開發者日報」,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的技術」、「有亮點的產品」、「有思考的文章」、「有態度的觀點」、「有看點的活動」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@瓚an、@鮑勃
01 有話題的技術
1、Qwen3-TTS上新,支持跨物種克隆音色
VoiceDesign (VD-Flash):
全文本控制: 通過文字指令調整語氣、節奏和情感,拒絕千篇一律的預設音色。
性能卓越: Role-play 表現超越 GPT-4o-mini & Gemini-2.5-pro。
VoiceClone (VC-Flash):
極速復刻:
僅需 3 秒音頻即可克隆任意聲音。
多語種支持:
支持中英日等 10 種語言,多語言準確率優於 ElevenLabs
(@通義大模型)
2、MiniMax M2.1:多語言編程 SOTA,為真實世界複雜任務而生
MiniMax 通過模型、Agent 腳手架和組織,以一種更具 AI 原生性的方式進行自我革新。今天,MiniMax 開放了其模型部分的更新——M2.1,並希望藉此幫助更多企業和個人儘早實現更具 AI 原生性的工作與生活方式。
在十月底發佈的 M2 版本中,MiniMax 主要解決了模型成本和開放性問題。而在 M2.1 版本中,MiniMax 將重點放在提升模型在真實世界複雜任務中的表現,特別是增強其在多種編程語言和辦公場景下的可用性,力求在該領域達到領先水平。
MiniMax M2.1 API :
https://platform.minimaxi.com/docs/guides/text-generation
(@MiniMax 稀宇科技)
3、面壁智能完成數億元融資,加碼投入領跑端側 AI
面壁智能昨天宣佈,已於近期順利完成數億元融資。本次融資由京國瑞、國科投資、中金保時捷基金、米聚資本與和基投資共同參與,募集資金將主要用於加大端側高效大模型的研發投入,加速端側 AI 的商業化進程。
面壁智能順利完成本輪融資,得益於端側智能市場空間進一步打開,更有賴於投資方對面壁的技術實力、市場地位及行業前景的充分認可。作為國內在端側智能領域佈局最早的大模型廠商,面壁構建起完善的理論體系與模型產品譜系,MiniCPM 面壁小鋼炮端側模型已在汽車、手機、PC 及智能家居等多個領域實現規模化落地,與吉利、長安、大眾、華為等多家知名企業達成深度合作,端側大模型的商業化進程走在行業前列。
(@面壁智能)
02 有亮點的產品
1、1050 萬美元種子輪融資, Lemon Slice-2:20B 模型支持單 GPU 實現 20FPS 實時數字人生成
數字人生成初創公司 「Lemon Slice」 發佈其 20B 參數的視頻擴散模型 「Lemon Slice-2」。該模型支持通過單張圖片生成交互式數字人視頻層,旨在為基於文本的 AI agent 提供高保真視覺交互能力,並已獲得 1050 萬美元種子輪融資,由 Matrix Partners 及 Y Combinator 領投。
- 視頻擴散 Transformer 架構:採用與 Sora、Veo 類似的端到端通用模型路徑,而非傳統的基於特定面部關鍵點驅動的方案,支持從人類到非人類角色的通用化生成,旨在通過數據規模化解決「恐怖谷效應」。
- 單 GPU 實現 20 FPS 實時推理:模型優化後支持在單張 GPU 上進行 20 幀/秒的實時視頻流渲染,滿足教育、語言學習及企業培訓等低延遲交互場景需求。
- 輕量化集成接口:提供標準 API 及單行代碼嵌入式 Widget,支持在生成後隨時動態修改數字人的背景、服飾樣式及外觀屬性。
- 語音與安全合規模塊:集成 「ElevenLabs」 技術提供語音生成能力;內置基於 LLM 的內容審核機制,並設有防止未經授權的臉部/聲音克隆的物理防護柵欄。
(@TechCrunch)
2、奇點攝動完成千萬級融資,發佈桌面級 3D 智能體《星夜頌歌》:自研「星空記憶」架構與廣播式分發系統
「奇點攝動」(SingularDance)近期完成由九合創投領投的千萬級人民幣天使+輪融資。該公司推出基於自研人物模型驅動的 3D 桌面智能體《星夜頌歌》,旨在通過深度定製的「智能體」架構,將 AI 從單純的對話工具轉向具有獨立生活流、主觀記憶與 OS 級交互能力的「賽博生命」。
- 模型架構與後訓練優化:產品核心基於改造後的開源 LLM 架構,通過超 1000 萬條定向語料進行後訓練(Post-training),將特定性格底色、價值觀與行為模式內化至模型權重,而非依賴簡單的 Prompt 工程。
- 「星空記憶」複合拓撲系統:自研非線性記憶檢索機制,放棄傳統的「記事本式」向量檢索,採用具備情感傾向的主觀記憶權重。系統根據 AI 設定的性格與情緒狀態決定記憶的留存與調取,實現邏輯一致的長期交互。
- 「廣播式」算力分發架構:針對推理成本高昂問題,開發了異步分發機制。AI 的非交互式行為(生活流)由雲端統一生成指令包並廣播至客户端隨機組合,僅在用户主動交互(如對話、打斷)時切入實時「個性化計算」,大幅降低邊際算力成本。
- 多模態生活流與環境感知:產品採用類 Wallpaper Engine 的底層駐留模式,智能體可感知用户的 OS 操作(如搜索行為、應用切換),並結合移動端地理位置信息進行環境反饋,實現 2/3 時間為非對話互動的「生活流」呈現。
- PGC 與 AIGC 混合驅動模式:不同於純 UGC 的陪伴產品,該項目採用 PGC 定向劇情章節引導「智能體」成長,通過固定劇本錨點與 LLM 自由發揮相結合,解決生成式 AI 在長線敍事中的失控問題。
目前產品處於測試預約階段,首發平台為 PC 桌面端,未來計劃延伸至移動端及 IoT 設備;採用「免費下載+交互深度付費」的商業模式。
(@硅星人)
3、首款帶攝像頭的 Lightwear AI 耳機正式亮相
昨日,前小米員工創業的光帆科技,推出了第一款 AI 硬件產品:Lightwear AI 全感穿戴設備。這是一套由耳機和手錶組成的「套裝」,而且每支耳機都帶一個攝像頭,成為 AI 的眼睛。
但更有趣的是,攝像頭不是拍照片用的,而是為 AI 提供視覺場景理解能力。
APPSO 體驗了一下工程樣機,效果雖然離光帆期待的成品還有一定差距,但效果已經非常令人意外了。
功能方面,支持消息提醒(AI 自動判斷重要性,低價值信息不打擾,而且支持回覆);日程提醒(支持平台同步,能解決日程衝突,還能主動提醒重要紀念日);出行管家(機票酒店預定,臨行出發提醒)等等。不僅如此,光帆還跟滴滴、京東有合作,裏面的 AI 助理「曉帆」能幫用户打車;還能基於視覺進行產品比價,自動加入購物車。
值得一提的是,此前曾有報道稱,蘋果目前也在研發帶攝像頭的 AirPods,並且將服務於 Apple Intelligence 以及未來的 Siri。
(@APPSO)
4、釘釘發 20+ AI 新品,AI 防錄音魔盒來襲
昨天,AI 釘釘 1.1 新品發佈暨生態大會在杭州召開,釘釘發佈代號「木蘭」的 AI 釘釘 1.1 版本,並提出「Agent OS」願景,試圖把釘釘從聊天工具升級為企業級「工作智能操作系統」,為多 Agent 的統一運行、調度與協作提供底層能力。
釘釘表示,Agent OS 的底層由釘釘開放平台的多模型與 MCP(Model Context Protocol)能力支撐,經由企業 AI 平台 DEAP 與模型訓練平台貫通軟硬件生態,開發者與企業可在其上開發 Agent、訓練模型並進行資源管理與運維。
同時,釘釘還在本次大會上,針對隱私場景做了一款 AI 防錄音魔盒。
據介紹,魔盒通過超聲波防護實現 360° 全方位覆蓋;更關鍵的是,它還能適配多種場景,甚至可以「偽裝」成紙巾盒、垃圾桶、保温杯,做到安全又無感。
發佈會上,釘釘創始人陳航也提到:確實存在一些隱私場景、私密對話不希望被錄音、被他人聽到。所以,A1(此前發佈的 AI 錄音卡)像一把鋒利的矛,而釘釘今天拿出的,是一面強大的盾——AI 防錄音魔盒。
(@APPSO)
03 有態度的觀點
1、AI 工具所宣稱的生產力提升可能只是一種假象
MIT Technology Review 採訪逾 30 名開發者、科技公司高管、分析師和研究人員後發現,基於大模型的 AI 工具是否加快程序員編程速度不是一個一錘定音的問題。
隨着一線程序員認識到大模型的侷限性,他們對 AI 工具的狂熱開始消退。眾多研究表明,AI 工具所宣稱的生產力提升可能只是一種假象。
GitClear 的數據顯示 2022 年以來工程師所寫代碼的持久性——數週內代碼不會被刪除或重寫——提高約 10%,這一改進可能需要歸功於 AI。但與此同時,代碼的多項質量指標在快速下降。
編程問答平台 Stack Overflow 的調查首次顯示對 AI 工具的信任度和好感度顯著下降。程序員普遍認同 AI 工具的優勢在於生成「樣板代碼」,編寫測試、修 bug 以及向新手解釋不熟悉的代碼。
但對於經驗豐富的程序員而言,此類任務只佔工作量的一小部分,AI 工具對於解決複雜難題幫助不大。
基於大模型的 AI 工具也不可避免存在幻覺,它們生成的代碼看起來完美,因此很難發現錯誤。所以使用 AI 工具就像是玩老虎機,有的時候大有幫助,但其它情況可能完全不可靠。
(@Solidot)
閲讀更多 Voice Agent 學習筆記:瞭解最懂 AI 語音的頭腦都在思考什麼
寫在最後:
我們歡迎更多的小夥伴參與 「RTE 開發者日報」 內容的共創,感興趣的朋友請通過開發者社區或公眾號留言聯繫,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、項目、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
作者提示:個人觀點,僅供參考