Inworld 推出 TTS-1.5:低延遲,成本相較同類便宜 25 倍

新聞
HongKong
6
02:31 PM · Jan 22 ,2026

Inworld AI 宣佈推出 Inworld TTS-1.5,號稱目前速度最快、質量最高的實時語音 AI 模型。

公告稱,1.5 Max 的 P90 首聲延遲低於 250 毫秒,1.5 Mini 低於 130 毫秒(相較上一代產品快 4 倍)。Max 型號現在能夠提供以往只有在更高延遲下才能實現的音質,運行速度幾乎與 Mini 型號一樣快,同時還能呈現更豐富、更富有表現力的語音。

改進後的 TTS-1.5 表現力提升了 30%,詞錯誤率降低 40%,同時減少了幻聽、斷音和語音失真等問題。最終生成的語音幾乎與真人説話無異:情感細膩、語境感知準確且可靠。

並增強了多語言支持,語言支持現已擴展至 15 種語言。此外,它的成本比其他替代方案低 25 倍以上。1.5 Mini 版每分鐘僅需 0.005 美元,1.5 Max 版每分鐘僅需 0.01 美元。

Inworld TTS-1.5 Max 適用於大多數應用,而 TTS-1.5 Mini 則針對對延遲高度敏感的應用進行了優化。

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.