博客 / 列表

超神經HyperAI - 【TVM教程】設計與架構

本文檔適用於想要了解 TVM 架構或積極開發項目的開發者。本文檔組織結構如下: 整體編譯流程示例:概述 TVM 如何將一個高級模型描述轉換為可部署模塊的各個步驟。建議首先閲讀本節以瞭解基礎流程。 簡要介紹 TVM 棧中的關鍵組件。您也可以參考TensorIR 深度解析和Relax 深度解析,瞭解 TVM 棧中兩個核心部分的詳細內容。 本指南提供了架構的一些補充視圖。首先研

機器學習 , 人工智能 , 深度學習

超神經HyperAI - 甲骨實物高保真數據歸國,AI助力古文釋讀,發現甲骨新圖像

「明年我們去法國接甲骨文回家」,2024 年 12 月下旬,安陽師範學院甲骨文信息處理教育部重點實驗室的研究人員遠赴法國,與法國國家圖書館等 4 家甲骨文收藏機構簽訂合作協議,將以數字化形態將已經遠離故土許久的甲骨文文化遺產「接回家」。 2024 年 8 月 5 日,「全球甲骨數字迴歸計劃」正式啓程,實驗室主任劉永革帶領團隊成員張展、李邦、郭安、龔慕凡飛往韓國,於 8 月 13 日帶回了 7 片甲

機器學習 , llm , 3d , 人工智能 , 深度學習

超神經HyperAI - 【Triton 教程】triton_language.expand_dims

Triton 是一種用於並行編程的語言和編譯器。它旨在提供一個基於 Python 的編程環境,以高效編寫自定義 DNN 計算內核,並能夠在現代 GPU 硬件上以最大吞吐量運行。 更多 Triton 中文文檔可訪問 →https://triton.hyper.ai/ triton.language.expand_dims(input, axis) 通過插入新的長度為 1 的維度來擴展張量的形狀。 軸

函數調用 , 索引 , 編譯器 , cpu , Python

超神經HyperAI - 30分鐘內輸出結果,新加坡國立大學/MIT等基於SVM構建微生物污染檢測模型

細胞治療產品 (CTP) 作為先進治療藥物 (ATMPs) 的重要組成部分,正為罕見病和疑難雜症患者帶來希望。然而,其生產過程極易受到微生物的侵擾,微生物污染始終如陰霾般籠罩着這束希望之光。傳統的無菌檢測方法,如沿用半個世紀的 USP 71(美國藥典第 71 章記錄的無菌檢測法),在面對精準醫療的新需求時顯得力不從心:長達兩週的培養週期、繁瑣的預處理步驟、依賴主觀判斷的渾濁度觀察,不僅嚴重滯後於細

論文 , 學習 , 算法 , 人工智能 , 模型

超神經HyperAI - 【vLLM 學習】Mistral-small

vLLM 是一款專為大語言模型推理加速而設計的框架,實現了 KV 緩存內存幾乎零浪費,解決了內存管理瓶頸問題。 更多 vLLM 中文文檔及教程可訪問 →https://vllm.hyper.ai/ *在線運行 vLLM 入門教程:零基礎分步指南 源碼examples/offline_inference/mistral-small.py # SPDX-License-Identifier: Apac

llm , 內存管理 , 零基礎 , 源碼 , kv存儲

超神經HyperAI - 僅用1年成為DeepMind頂樑柱,John Jumper博士畢業7年拿諾獎,開啓蛋白摺疊新時代

「我以為我只有 10% 的機會獲得諾貝爾化學獎」,得知獲獎消息後,John Jumper 在電話採訪中笑着説道。他的語氣中帶着謙遜與感慨,而這份殊榮的背後,則是 AlphaFold2 帶來的科學革命,徹底改變了蛋白質結構預測的方式。 截至目前,已有來自 190 個國家的 200 多萬人使用這一工具,它不僅加速了新藥研發和疾病研究,也為基礎科學探索提供了前所未有的支持,深刻影響了生命科學的未來發展。

機器學習 , 強化學習 , google , 人工智能 , 深度學習

超神經HyperAI - Apple Intelligence深夜炸場!蘋果發佈4顆自研芯片,iPhone/iWatch/AirPods大升級

今年 6 月,蘋果在 WWDC 上正式推出 Apple Intelligence。消息發佈次日,蘋果股價在盤中突破 200 美元大關,創 2022 年 11 月 10 日以來最大漲幅,截至收盤,蘋果總市值升至 3.18 萬億美元(約合人民幣 23 萬億)。 從某種程度上來看,Apple Intelligence 的亮相令市場對蘋果重拾信心。有分析人士指出,在 AI 的加持下,這一輪暴漲或許是市場對

芯片 , iphone , apple

超神經HyperAI - 【Triton 教程】triton_language.broadcast_to

Triton 是一種用於並行編程的語言和編譯器。它旨在提供一個基於 Python 的編程環境,以高效編寫自定義 DNN 計算內核,並能夠在現代 GPU 硬件上以最大吞吐量運行。 更多 Triton 中文文檔可訪問 →https://triton.hyper.ai/ triton.language.broadcast_to(input, *shape) 嘗試將給定的張量廣播到新的shape。 參數:

編輯器 , 算法 , 編程語言 , cpu , Python

超神經HyperAI - 【vLLM 學習】歡迎來到 vLLM!

vLLM 是一款專為大語言模型推理加速而設計的框架,實現了 KV 緩存內存幾乎零浪費,解決了內存管理瓶頸問題。 更多 vLLM 中文文檔及教程可訪問 →https://vllm.hyper.ai/ vLLM 是一個快速且易於使用的庫,專為大型語言模型 (LLM) 的推理和部署而設計。 vLLM 的核心特性包括: 最先進的服務吞吐量 使用 PagedAttention 高效管理注意力鍵和值的內

機器學習 , llm , 框架 , 人工智能 , 深度學習

超神經HyperAI - 效率至高提升20倍!加州大學開發OmniCast,解決自迴歸天氣預報模型誤差累計問題

次季節至季節(Subseasonal-to-seasonal, S2S)尺度天氣預報介於短期天氣預報與長期氣候預測之間,聚焦未來 2 周至 6 周的天氣演變,精準填補了中遠期氣象預測空白,為農業規劃、災害防禦等提供關鍵依據。但 S2S 天氣預測既難依託快速衰減的大氣初始信息(中短期預報條件),又難捕捉尚未充分顯現的慢變邊界信號(氣候預測條件),在混沌的大氣系統與複雜的海陸氣相互作用下,預報難度顯著

機器學習 , 資訊 , openai , 人工智能 , 深度學習

超神經HyperAI - 黃仁勳最新演講:10億美元投資諾基亞,Rubin明年量產,AI工廠推進落地……

美國東部時間 10 月 28 日下午 12:00,英偉達 CEO 黃仁勳在華盛頓舉行的 GTC 大會上發表主題演講。這是繼今年 3 月聖何塞主會後的又一場區域性 GTC,地點首次來到美國政治中心華盛頓, 會議包含 70 多場,涵蓋 Agentic AI、機器人技術、量子計算和 AI 原生電信(AI-native telecom networks)等議題,一度被外界視為英偉達從「AI 領域引領者」向

機器學習 , 資訊 , 機器人 , 人工智能 , 深度學習

超神經HyperAI - 【TVM 教程】自定義優化

TVM 先已更新到 0.21.0 版本,TVM 中文文檔已經和新版本對齊。 Apache TVM 是一個深度的深度學習編譯框架,適用於 CPU、GPU 和各種機器學習加速芯片。更多 TVM 中文文檔可訪問 →Apache TVM Apache TVM 的一個主要設計目標是便於自定義優化流程,無論是用於科研探索還是工程開發,都可以靈活迭代優化過程。本教程將涵蓋以下內容: 目錄 審查整體流程 可

機器學習 , 自然語言處理 , 教程 , 人工智能 , 深度學習

超神經HyperAI - 【Triton 教程】triton_language.join

Triton 是一種用於並行編程的語言和編譯器。它旨在提供一個基於 Python 的編程環境,以高效編寫自定義 DNN 計算內核,並能夠在現代 GPU 硬件上以最大吞吐量運行。 更多 Triton 中文文檔可訪問 →https://triton.hyper.ai/ triton.language.join(a, b) 在 1 個新的次要維度中連接給定的張量。 For example, given

算法 , gpu , 編譯器 , cpu , Python

超神經HyperAI - 從結合式異構加速到融合式 AI 加速,多位院士齊聚CCF HPC China共探科研新範式

在現代科學研究中,高性能計算(HPC)已成為推動重大突破的核心引擎,其以遠超常規計算機的算力,為科學家提供了探索未知世界的「放大鏡」和「加速器」。從模擬宇宙演化、預測氣候變化,到揭示生命分子的運作機制、加速新藥研發,HPC 正不斷拓展人類認知的邊界。 尤其在數據爆炸與人工智能快速發展的時代,AI for Science 發展提速,在很多科研領域,AI 仍存在精度不足、泛化能力弱、通用性不強等問題,

gpu , ai開發 , 人工智能 , 高性能計算 , cpu

超神經HyperAI - 【TVM 教程】Python Target 參數化

Apache TVM 是一個深度的深度學習編譯框架,適用於 CPU、GPU 和各種機器學習加速芯片。更多 TVM 中文文檔可訪問 →https://tvm.hyper.ai/ 摘要 對於任何支持的 runtime,TVM 都應該輸出正確的數字結果。因此,在編寫驗證數字輸出的單元測試時,這些單元測試應該在所有支持的 runtime 上都能正常運行。由於這是一個非常常見的用例,TVM 的輔助函數可以對

gpu , 編譯器 , 參數傳遞 , cpu , Python

超神經HyperAI - 【TVM 教程】向 TVM 中添加 Codegen

Apache TVM 是一個深度的深度學習編譯框架,適用於 CPU、GPU 和各種機器學習加速芯片。更多 TVM 中文文檔可訪問 →https://tvm.hyper.ai/ 隨着深度學習工作負載所針對的硬件設備數量不斷增加,用户在各種設備上實現高性能所需的知識也在不斷增加。為了讓數據科學家在開發新模型時不必擔心性能問題,硬件廠商或是基於一些常見的深度學習算子,提供 MKLDNN 或 cuDNN

算法 , gpu , 代碼編輯器 , cpu , Python

超神經HyperAI - 【vLLM 學習】Lora With Quantization Inference

vLLM 是一款專為大語言模型推理加速而設計的框架,實現了 KV 緩存內存幾乎零浪費,解決了內存管理瓶頸問題。 更多 vLLM 中文文檔及教程可訪問 →https://vllm.hyper.ai/ *在線運行 vLLM 入門教程:零基礎分步指南 源碼examples/offline_inference/lora_with_quantization_inference.py # SPDX-Licen

llm , 內存管理 , kv存儲 , 量化 , Python

超神經HyperAI - 入選ICML 2025,Meta/劍橋/MIT提出全原子擴散Transformer框架,首次實現週期性與非週期性原子系統統一生成

在當今科學研究與工業應用的前沿領域,原子系統三維結構的生成建模正展現出顛覆性潛力,有望徹底重塑新型分子和材料的逆向設計版圖。從精準的結構預測到靈活的條件生成,當前最先進的擴散模型及流匹配模型已在生物分子解析、新材料研發及基於結構的藥物設計等關鍵任務中嶄露頭角,成為科研人員突破技術瓶頸的核心工具。 然而,在這一蓬勃發展的領域背後,一個關鍵難題始終制約着技術躍遷——現有模型缺乏跨系統的通用性。 儘管所

機器學習 , 資訊 , tensorflow , 人工智能 , 深度學習

超神經HyperAI - 【TVM教程】為 Mobile GPU 自動調優卷積網絡

Apache TVM 是一個深度的深度學習編譯框架,適用於 CPU、GPU 和各種機器學習加速芯片。更多 TVM 中文文檔可訪問 →https://tvm.hyper.ai/ 作者:Lianmin Zheng, Eddie Yan 針對特定設備的自動調優對於獲得最佳性能至關重要。本文介紹如何調優整個卷積網絡。 TVM 中 Mobile GPU 的算子實現是以 template 形式編寫的。該 te

編程 , 機器學習 , 人工智能 , 編譯器 , 深度學習

超神經HyperAI - 【TVM教程】為 ARM CPU 自動調優卷積網絡

Apache TVM 是一個深度的深度學習編譯框架,適用於 CPU、GPU 和各種機器學習加速芯片。更多 TVM 中文文檔可訪問 →https://tvm.hyper.ai/ 作者:Lianmin Zheng, Zhao Wu, Eddie Yan 針對特定 ARM 設備的自動調優對於獲得最佳性能至關重要,本文介紹如何調優整個卷積網絡。 TVM 中 ARM CPU 的算子實現是以 template

機器學習 , arm , 人工智能 , 編譯器 , 深度學習

超神經HyperAI - 【TVM 教程】為 x86 CPU 自動調優卷積網絡

Apache TVM 是一個深度的深度學習編譯框架,適用於 CPU、GPU 和各種機器學習加速芯片。更多 TVM 中文文檔可訪問 →https://tvm.hyper.ai/ 作者:Yao Wang, Eddie Yan 本文介紹如何為 x86 CPU 調優卷積神經網絡。 注意,本教程不會在 Windows 或最新版本的 macOS 上運行。如需運行,請將本教程的主體放在 if name == "

gpu , 人工智能 , 編譯器 , 深度學習 , cpu

超神經HyperAI - 【Triton 教程】分組 GEMM

Triton 是一種用於並行編程的語言和編譯器。它旨在提供一個基於 Python 的編程環境,以高效編寫自定義 DNN 計算內核,並能夠在現代 GPU 硬件上以最大吞吐量運行。 更多 Triton 中文文檔可訪問 →https://triton.hyper.ai/ 分組 GEMM 內核通過啓動固定數量的 CTA 來計算一組 gemms。調度是靜態的,並且在設備上完成。 Out: group-ge

機器學習 , 自然語言處理 , 人工智能 , 編譯器 , 深度學習

超神經HyperAI - 【TVM 教程】在 NVIDIA GPU 上調優高性能卷積

Apache TVM 是一個端到端的深度學習編譯框架,適用於 CPU、GPU 和各種機器學習加速芯片。更多 TVM 中文文檔可訪問 →https://tvm.hyper.ai/ 作者:Lianmin Zheng 本教程介紹如何為 NVIDIA GPU 編寫高性能可調模板。通過在此模板上運行自動調優器,可在許多情況下勝過供應商提供的 cuDNN 庫。 注意,本教程不會在 Windows 或最新版本的

機器學習 , gpu , 人工智能 , 編譯器 , 深度學習

超神經HyperAI - 地平線/智源/字節/凌川科技齊聚上海,共探編譯器優化新進展

2023 年,HyperAI超神經在北京、上海、深圳舉辦了 4 場 Meet TVM 線下聚會,聚集了超 1 千位資深從業者及愛好者,逐步建立了豐富的社區生態。 2024 年,HyperAI超神經聚焦 AI 編譯器領域,繼續為業內人士提供開放的交流平台,在今年 7 月舉辦了 Meet AI Compiler 技術沙龍的第 5 期。如今,2024 年接近尾聲,大模型賽道激戰未停,AI 編譯器有哪些新

ai開發 , 人工智能 , 編譯器 , 深度學習 , 編譯器優化