tag 語音

標籤
貢獻4
77
06:21 AM · Nov 04 ,2025

@語音 / 博客 RSS 訂閱

李小轟 - 純算法AEC:播錄並行場景的回聲消除實戰筆記

引言 最近在做一款 AI 語音應用,場景類似“實時通話”:一邊讓 TTS 播報,一邊把麥克風打開做 STT。 問題在於,揚聲器出來的聲音下一秒就會被麥克風原封不動地錄回去,STT 立刻把它當成用户再説一遍,形成“自己聽懂自己”的無限循環。 為了切斷這條回聲通路,我試了一圈硬件方案無果後,決定用純算法在軟件層把播報聲音從錄音裏“摳”掉。 參考 WebRTC 在我原有的設計裏,TTS 播報走的是系統自

aec , 語音 , Android

收藏 評論

comehope - AI實戰:用 TensorFlow 識別數字 0-9

摘要 本項目的目標是使用深度學習來檢測數字 0-9 的語音。 我們將利用深度學習技術,把語音文件轉譯為文本數據,例如把英語 three 的發音轉譯為文本 "three"。 我們將使用 TensorFlow/Keras 來創建模型、訓練模型,再使用測試數據評估它的性能。 本教程的 Jupyter 文件地址: https://openbayes.com/console/public/tutori

tensorflow , librosa , ai開發 , 語音

收藏 評論

啓英AI平台 - 受夠了複雜的OSD菜單?手把手教你為顯示器嵌入“聽懂人話”的離線語音識別能力

面對顯示器上密密麻麻的OSD按鍵和複雜的多級菜單,我作為一家顯示器廠商選擇用一塊不足掌心大小的語音識別模塊,讓傳統顯示器聽懂人話,開啓了人機交互的新篇章。 想象一下,你不需要在顯示器側面摸索那些難以區分的物理按鍵,也不用在複雜的屏幕菜單中逐級尋找亮度調節選項,只需説出“調亮一點”或“切換到HDMI輸入”,顯示器便能瞬間響應——這不再是科幻電影的場景。 基於啓英泰倫CI-D03GS01J離線語音識別

交互 , ai開發 , 顯示器 , 語音 , 人工智能

收藏 評論

七牛開發者 - 七牛靈矽 AI 正式發佈:把“對話”裝進每一台智能硬件

8 月 15 日,七牛雲正式發佈靈矽 AI ——為新一代智能硬件而生的語音交互新範式,讓智能硬件不僅會“説話”,更能聽懂情緒、自然交流。這不僅是語音交互技術從“能用”到“好用”的升級,更是語音交互從“功能附加”躍升為“核心必備競爭力”的開始。 據 Canalys 預測,2025 年全球個人智能音頻設備出貨量將突破 5.33 億台。然而,儘管市場高速增長,但大多數語音交互體驗產品依然普遍存在延遲高、

智能硬件 , 七牛雲存儲 , 機器人 , 語音 , 人工智能

收藏 評論

啓英AI平台 - 從“聽不清”到“聽得清”:我讓普通對講機擁有了AI降噪黑科技

近期因使用需要,準備購買一套對講機,在網上看了許久後,感覺都差不多,幾乎沒有什麼亮點;然而市面上的降噪對講機動輒上千,又讓人望而卻步。最近,我偶然發現啓英泰倫的一款AI降噪模塊,萌生了一個大膽的想法:能不能花小錢,親手給普通對講機裝上‘AI降噪’的黑科技? 答案是肯定的!下面就來分享這次從‘聽不清’到‘聽得清’的硬核改裝全過程。 一、準備工作 1. 播報音模塊板購買 ①在啓英泰倫官方商城購買一套C

嵌入式 , 語音 , 人工智能 , c , 硬件

收藏 評論