國產TTS新標杆?Qwen3-TTS深度體驗:49種音色、10語種、8大方言,卻“只開API不開源”
閲讀原文
建議閲讀原文,始終查看最新文檔版本,獲得最佳閲讀體驗:《國產TTS新標杆?Qwen3-TTS深度體驗:49種音色、10語種、8大方言,卻“只開API不開源”》
https://docs.dingtalk.com/i/nodes/P0MALyR8klgD64gdf2Olrk3jW3bzYmDO
前言
最近,阿里雲悄悄放出了一枚“語音核彈”——Qwen3-TTS。
它支持 49種官方音色,覆蓋 10種國際語言 + 8種中國方言,合成效果自然到讓人懷疑是不是真人錄音;在多個公開評測中,甚至超越了 GPT-4o Audio Preview 和 ElevenLabs 這類國際頂流。
今天,我們就來深度拆解:Qwen3-TTS 到底強在哪?普通開發者如何用?值不值得接入?
🔊 Qwen3-TTS 的三大“殺手鐗”
✅ 1. 音色豐富,情感細膩
- 49種官方音色:從温柔女聲“曉曉”、沉穩男聲“雲揚”,到兒童、客服、新聞播報等場景專用音色;
- 支持 語速、語調、停頓、情感強度 精細調節;
- 部分音色具備 多情感模式(如開心、悲傷、嚴肅),適用於有聲書、虛擬主播等高階場景。
✅ 2. 多語言 & 方言全覆蓋
- 10種語言:中文、英文、日文、韓文、法語、西班牙語等;
- 8種中國方言:粵語、四川話、上海話、閩南語、陝西話……連天津話都有!
- 中英混讀流暢自然,無明顯“切換卡頓”。
✅ 3. 合成質量媲美真人
根據阿里內部評測:
- MOS(平均意見得分)達 4.3+(5分制),接近真人水平;
- 在長文本連貫性、韻律控制上顯著優於前代 Qwen-TTS;
- 支持 24kHz 高採樣率輸出,音質清晰飽滿。
缺點
Qwen3-TTS不開源,只能通過api調用,另外,它不支持克隆聲音,只能選擇內置的音色
💡 適合哪些應用場景?
- 智能客服:7×24小時語音應答,支持方言用户;
- 有聲內容生產:自動生成播客、課程、小説朗讀;
- 無障礙服務:為視障用户提供網頁/APP語音導航;
- IoT設備:智能音箱、車載系統、機器人語音交互;
- 短視頻配音:快速生成多語種解説音軌。
官方文檔
API文檔:
Qwen-TTS API-大模型服務平台百鍊(Model Studio)-阿里雲幫助中心
模型名稱列表:
多語言方言擬人音色語音合成-語音合成-通義千問-大模型服務平台百鍊-阿里雲
qwen3-tts-flash-2025-11-27支持的音色列表:
多語言方言擬人音色語音合成-語音合成-通義千問-大模型服務平台百鍊-阿里雲
api調用價格
官方價格説明:多語言方言擬人音色語音合成-語音合成-通義千問-大模型服務平台百鍊-阿里雲
示例
通過調用阿里雲百鍊平台的api,讓qwen3-tts-flash進行中英文語音合成,並且設置音色為普通話(女聲小蘿莉)
要合成的文本為:
你好!Welcome to Qwen3-TTS-Flash——阿里雲最新推出的超高速語音合成引擎。它支持中英混讀,比如:“這個 feature 真的很 smart!” 無論是 technical documentation 還是 daily conversation,都能流暢自然地表達。Try it now,讓你的應用 instantly 擁有專業級 voice 能力!
詳細命令
# 請安裝 DashScope SDK 的最新版本
import os
import dashscope
# 以下為北京地域url,若使用新加坡地域的模型,需將url替換為:https://dashscope-intl.aliyuncs.com/api/v1
dashscope.base_http_api_url = 'https://dashscope.aliyuncs.com/api/v1'
# 配置api key
export DASHSCOPE_API_KEY="sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
text = "你好!Welcome to Qwen3-TTS-Flash——阿里雲最新推出的超高速語音合成引擎。它支持中英混讀,比如:“這個 feature 真的很 smart!” 無論是 technical documentation 還是 daily conversation,都能流暢自然地表達。Try it now,讓你的應用 instantly 擁有專業級 voice 能力!"
# SpeechSynthesizer接口使用方法:dashscope.audio.qwen_tts.SpeechSynthesizer.call(...)
response = dashscope.MultiModalConversation.call(
# 僅支持qwen-tts系列模型,請勿使用除此之外的其他模型
model="qwen3-tts-flash-2025-11-27",
# 新加坡和北京地域的API Key不同。獲取API Key:https://help.aliyun.com/zh/model-studio/get-api-key
# 若沒有配置環境變量,請用阿里雲百鍊API Key將下行替換為:api_key="sk-xxx"
api_key=os.getenv("DASHSCOPE_API_KEY"),
text=text,
voice="Bella",
language_type="Auto"
)
print(response)
輸出如下:
輸出中有一個url,這就是音頻的下載網址了,從瀏覽器打開就能下載合成好的語音了,下面是我合成的語音,效果非常棒
請至釘釘文檔查看附件《904fda31-1b37-43a9-815e-40c6677ff9c4.wav》