語音

標籤

貢獻4

306

06:21 AM · Nov 04 ,2025

@語音 / 博客 RSS 訂閱

Dec 23 2025

李小轟 - 純算法AEC：播錄並行場景的回聲消除實戰筆記

引言最近在做一款 AI 語音應用，場景類似“實時通話”：一邊讓 TTS 播報，一邊把麥克風打開做 STT。問題在於，揚聲器出來的聲音下一秒就會被麥克風原封不動地錄回去，STT 立刻把它當成用户再説一遍，形成“自己聽懂自己”的無限循環。為了切斷這條回聲通路，我試了一圈硬件方案無果後，決定用純算法在軟件層把播報聲音從錄音裏“摳”掉。參考 WebRTC 在我原有的設計裏，TTS 播報走的是系統自

aec , 語音 , Android

收藏評論

Jun 24 2024

comehope - AI實戰：用 TensorFlow 識別數字 0-9

摘要本項目的目標是使用深度學習來檢測數字 0-9 的語音。我們將利用深度學習技術，把語音文件轉譯為文本數據，例如把英語 three 的發音轉譯為文本 "three"。我們將使用 TensorFlow/Keras 來創建模型、訓練模型，再使用測試數據評估它的性能。本教程的 Jupyter 文件地址： https://openbayes.com/console/public/tutori

tensorflow , librosa , ai開發 , 語音

收藏評論

Dec 29 2025

啓英AI平台 - 受夠了複雜的OSD菜單？手把手教你為顯示器嵌入“聽懂人話”的離線語音識別能力

面對顯示器上密密麻麻的OSD按鍵和複雜的多級菜單，我作為一家顯示器廠商選擇用一塊不足掌心大小的語音識別模塊，讓傳統顯示器聽懂人話，開啓了人機交互的新篇章。想象一下，你不需要在顯示器側面摸索那些難以區分的物理按鍵，也不用在複雜的屏幕菜單中逐級尋找亮度調節選項，只需説出“調亮一點”或“切換到HDMI輸入”，顯示器便能瞬間響應——這不再是科幻電影的場景。基於啓英泰倫CI-D03GS01J離線語音識別

交互 , ai開發 , 顯示器 , 語音 , 人工智能

收藏評論

Nov 04 2025

七牛開發者 - 七牛靈矽 AI 正式發佈：把“對話”裝進每一台智能硬件

8 月 15 日，七牛雲正式發佈靈矽 AI ——為新一代智能硬件而生的語音交互新範式，讓智能硬件不僅會“説話”，更能聽懂情緒、自然交流。這不僅是語音交互技術從“能用”到“好用”的升級，更是語音交互從“功能附加”躍升為“核心必備競爭力”的開始。據 Canalys 預測，2025 年全球個人智能音頻設備出貨量將突破 5.33 億台。然而，儘管市場高速增長，但大多數語音交互體驗產品依然普遍存在延遲高、

智能硬件 , 七牛雲存儲 , 機器人 , 語音 , 人工智能

收藏評論

Nov 07 2025

啓英AI平台 - 從“聽不清”到“聽得清”：我讓普通對講機擁有了AI降噪黑科技

近期因使用需要，準備購買一套對講機，在網上看了許久後，感覺都差不多，幾乎沒有什麼亮點；然而市面上的降噪對講機動輒上千，又讓人望而卻步。最近，我偶然發現啓英泰倫的一款AI降噪模塊，萌生了一個大膽的想法：能不能花小錢，親手給普通對講機裝上‘AI降噪’的黑科技？答案是肯定的！下面就來分享這次從‘聽不清’到‘聽得清’的硬核改裝全過程。一、準備工作 1. 播報音模塊板購買 ①在啓英泰倫官方商城購買一套C

嵌入式 , 語音 , 人工智能 , c , 硬件

收藏評論

語音

@語音 / 博客 RSS 訂閱

李小轟 - 純算法AEC：播錄並行場景的回聲消除實戰筆記

comehope - AI實戰：用 TensorFlow 識別數字 0-9

啓英AI平台 - 受夠了複雜的OSD菜單？手把手教你為顯示器嵌入“聽懂人話”的離線語音識別能力

七牛開發者 - 七牛靈矽 AI 正式發佈：把“對話”裝進每一台智能硬件

啓英AI平台 - 從“聽不清”到“聽得清”：我讓普通對講機擁有了AI降噪黑科技

Product

Company

Support

Company