博客 / 詳情

返回

我們為什麼需要另一個“桌面助手”?

一、起點:從手動查找到一鍵問答

開發初期,我只是想解決自己的一個高頻痛點:
在寫代碼、看PDF、甚至答題時,經常需要複製一段文本 → 打開瀏覽器 → 打開AI對話頁 → 粘貼 → 等待回覆 → 再切回原窗口。
這個過程重複、低效,且打斷心流。

於是,第一個版本誕生了:
一個簡單的窗口程序,內置大模型調用,支持本地文檔加載。
它解決了基礎問答問題,但依然需要“主動打開軟件、切換窗口”。

問答頁面

 


二、迭代思路:從“工具”到“夥伴”的進化路徑

1. V1:本地化 + 多文檔支持

  • 支持Word、PDF直接導入,構建個人知識庫。

  • 大模型接口可配置,適應不同模型供應商。

  • 但交互方式仍是“你問我答”,屬於被動工具。

2. V2:場景化答題 + 快捷鍵提問

  • 加入“答題模式”,可綁定在線答題界面,實現實時查題。

  • 快捷鍵 Alt+Q 支持快速框選文本並提問,減少窗口切換。

  • 開始嘗試“無縫嵌入用户當前操作”。

3. V3:筆記整合 + 提示詞自定義

  • 支持選中內容一鍵保存到筆記,構建個人答題庫。

  • 開放系統提示詞自定義,讓工具可變為“翻譯官”“代碼助手”“文案生成器”等。

  • 工具開始具備“身份切換”能力,更像一個可塑形的智能夥伴。

    image

     


三、終極形態:鷹眼模式——在任何界面,隨時提問

這是我最想分享的部分,也是QA-Assistant的核心設計理念。

設計目標:

讓大模型像“空氣”一樣無處不在,卻又不必佔據你的屏幕。

實現方式:

  • 開啓鷹眼模式後,軟件縮小為一個始終置頂的迷你應答框。

  • 無論你在瀏覽器、IDE、PDF閲讀器、甚至圖片中——

  • 按下 Alt+Q,框選任意區域(支持截圖OCR識別),問題即刻傳入,答案即時返回。

為什麼這是“終極交互”?

  • 你不再需要“打開某個軟件”。

  • 你不再需要“複製粘貼”。

  • 你甚至不需要“離開當前窗口”。

  • 大模型成了你電腦系統層級的“隱形助手”。

    image

     


四、技術實現中的幾個關鍵點

  1. 全局快捷鍵監聽:確保在任何焦點下都能觸發提問。

  2. 屏幕截圖與OCR集成:支持圖片中的文字提取,擴展使用場景。

  3. 多模型接口統一封裝:兼容不同API格式,預留配置空間。

  4. 本地存儲與隱私保護:所有文檔、筆記不離本地,適合敏感資料場景。


五、未來方向:更輕、更智能、更插件化

  • 計劃支持“語音提問”與“語音播報回答”。

  • 考慮開放插件系統,讓開發者自定義功能模塊。

  • 嘗試集成本地化小模型,實現完全離線的輕量問答。


六、寫給同樣在開發工具的你

如果你也在做一個“提升效率”的桌面工具,我的建議是:

不要一開始就追求功能全面,而是抓住一個核心痛點,把它做到“無需思考即可使用”。
交互的極致,往往是讓用户感受不到“交互”的存在。


七、體驗與交流

如果你對這款工具的開發思路感興趣,或者也想嘗試構建自己的“場景化AI助手”,歡迎下載體驗:產品使用指南。


我們不是在做一個工具,而是在設計一種更自然的交互方式。
讓AI不再是一個需要“打開”的軟件,而是隨時待命的“第二大腦”。

這就是QA-Assistant的故事,也是我作為一個開發者的堅持。

歡迎下載體驗:產品使用指南。(閒魚搜索:問答助手)

user avatar
0 位用戶收藏了這個故事!

發佈 評論

Some HTML is okay.