博客 / 列表

是嶼小夏呀 - 昇騰平台多模態微調與推理實戰:從理論到落地的完整探索

多模態大模型正在改變AI的應用邊界,從文生圖到文生視頻,從圖像理解到全模態交互,這些能力的背後離不開強大的算力支持和高效的推理框架。 最近我在昇騰平台上完成了一次完整的多模態項目實踐——使用MindSpeed MM進行Qwen2.5-VL模型微調,並通過MindIE SD實現Wan2.1視頻生成模型的高性能推理。 這次經歷讓我深刻體會到,多模態模型的訓練和部署遠比想象中複雜,但昇

Exchange , 服務器 , 權重 , 模態 , Git

是嶼小夏呀 - vLLM-ascend 下的 PD 分離實戰:從DeepSeek-V3-w8a8模型到壓測,一次把坑踩完

vLLM-ascend 下的 PD 分離實戰:從DeepSeek-V3-w8a8模型到壓測,一次把坑踩完 Prefill 計算密集、Decode 訪存密集——這對天然割裂的階段,決定了大模型推理並非一鍋燉。 把兩者解耦(PD 分離)+ 用 vLLM 的 PagedAttention 精準管控 KV Cache,是目前在昇騰場景下把吞吐與成本同時打上去的可靠路徑。 我們就用 D

Exchange , 服務器 , ip , bash , Git

是嶼小夏呀 - 音符躍然眼前-Rokid AR眼鏡賦能的沉浸式音樂靈感捕捉系統

摘要 本文詳細介紹瞭如何基於Rokid CXR-M SDK開發一款面向音樂創作者的沉浸式靈感捕捉系統。該系統充分利用AR眼鏡的實時音頻捕獲、AI場景定製和自定義界面能力,解決了傳統音樂創作中靈感易逝、記錄繁瑣、創作中斷等核心痛點。文章從系統架構設計入手,深入剖析了音頻處理、AI輔助創作、AR界面交互等關鍵技術的實現細節,並提供了完整的代碼示例和性能優化方案。通過本系統,音樂人可以在任

數據 , 初始化 , 人工智能 , 數據結構與算法 , ide

是嶼小夏呀 - openEuler性能優化實操:提升服務器效率與資源利用

引言 隨着現代計算需求的不斷提升,操作系統的性能優化變得尤為重要,尤其是在高併發和高負載的環境中。作為一款高性能的開源操作系統,openEuler 提供了豐富的優化手段,能夠幫助企業高效地利用計算資源,提升服務器的性能。無論是在雲計算、大數據處理、還是智能邊緣設備,openEuler 都能通過合理的資源調度和配置,保證系統在各種應用場景下高效、穩定地運行。 本文將聚焦於

性能優化 , 優先級 , bash , 開源