tag 模型

標籤
貢獻12
72
10:07 AM · Nov 04 ,2025

@模型 / 博客 RSS 訂閱

合合技術團隊 - 【論文解讀】用於代碼處理的語言模型綜述

1.簡要介紹 在這項工作中,論文系統地回顧了在代碼處理方面的最新進展,包括50個+模型,30個+評估任務和500個相關工作。論文將代碼處理模型分解為由GPT家族表示的通用語言模型和專門預訓練的代碼模型,通常具有定製的目標。論文討論了這些模型之間的關係和差異,並強調了代碼建模從統計模型和rnn到預訓練的transformer和LLM的歷史轉變,這與NLP所採取的過程完全相同。還討論了特定於代碼的特

code , llm , 人工智能 , 模型

收藏 評論

騰訊藍鯨智雲 - LLMOps+DeepSeek:大模型賦能一體化運維

本文來自騰訊藍鯨智雲社區用户: CanWay 01.背景 蛇年伊始,DeepSeek憑藉其卓越表現火爆出圈,讓AI大模型瞬間成為街頭巷尾熱議的焦點,也讓大眾重新燃起對AGI(通用人工智能)“平民化”的信心,DeepSeek通過先進的模型架構,帶來的高效率與低成本優勢,加快了應用場景的百花齊放。 嘉為藍鯨早在23年初就接入GPT等大模型在運維領域中孵化應用場景,而到本次DeepSeek評測和應用,又

運維 , deepseek , 人工智能 , cmdb , 模型

收藏 評論

一點人工一點智能 - 《分數階行為建模:若干非典型工具的分析與應用》

書籍:Fractional Behaviours Modelling: Analysis and Application of Several Unusual Tools 作者:Jocelyn Sabatier,Christophe Farges,Vincent Tartaglione 出版:Springer​ 編輯:陳萍萍的公主@一點人工一點智能 下載:書籍下載-

工具 , 人工智能 , 深度學習 , 模型

收藏 評論

超神經HyperAI - 30分鐘內輸出結果,新加坡國立大學/MIT等基於SVM構建微生物污染檢測模型

細胞治療產品 (CTP) 作為先進治療藥物 (ATMPs) 的重要組成部分,正為罕見病和疑難雜症患者帶來希望。然而,其生產過程極易受到微生物的侵擾,微生物污染始終如陰霾般籠罩着這束希望之光。傳統的無菌檢測方法,如沿用半個世紀的 USP 71(美國藥典第 71 章記錄的無菌檢測法),在面對精準醫療的新需求時顯得力不從心:長達兩週的培養週期、繁瑣的預處理步驟、依賴主觀判斷的渾濁度觀察,不僅嚴重滯後於細

論文 , 學習 , 算法 , 人工智能 , 模型

收藏 評論

OpenBayes - OpenBayes 教程上新丨開源代碼推理模型 DeepCoder-14B-Preview 狂攬 3k stars

4 月 9 日凌晨,Agentica 團隊攜手 Together AI 聯合開源了名為 DeepCoder-14B-Preview 的代碼推理模型,這個僅需 14B 即可媲美 OpenAI o3-Mini 的新模型迅速引起業界廣泛關注,在 GitHub 狂攬 3k stars。 DeepCoder 在多項評測中的得分情況具體而言,DeepCoder-14B-Preview 是一款基於 DeepS

code , 教程 , 人工智能 , 開源 , 模型

收藏 評論

Alluxio - Alluxio在數據索引和模型分發中的核心價值與應用

在當前的技術環境下,搜索、推薦、廣告、大模型、自動駕駛等領域的業務依賴於海量數據的處理和複雜模型的訓練。這些任務通常涉及從用户行為數據和社交網絡數據中提取大量信息,進行模型訓練和推理。這一過程需要強大的數據分發能力,尤其是在多個服務器同時拉取同一份數據時,更是考驗基礎設施的性能。 在這樣的背景下,Alluxio Enterprise AI 在數據索引與模型分發/部署方面展示了其獨特的優勢,特

大數據 , 索引 , 人工智能 , 模型

收藏 評論

得物技術 - 深入剖析時序Prophet模型:工作原理與源碼解析|得物技術

隨着得物業務的快速發展,積累了大量的時序數據,這些數據對精細化運營,提升效率、降低成本有着重要作用。在得物的時序數據挖掘場景中,時序預測Prophet模型使用頻繁,本文對Prophet的原理和源碼進行深入分析,歡迎閲讀和交流。 一、引入 時間序列是指按照時間先後順序收集或觀測的一系列數據點,這類數據通常都具有一定時間相關性,基於這種順序性,我們可以對時間序列進行多種數據挖掘任務,包括分類、聚類、異

序列化 , 大數據 , 時序數據庫 , 源碼分析 , 模型

收藏 評論

隱語SecretFlow - 廈門大學站回顧|大模型時代的聯邦學習

“隱語”是開源的可信隱私計算框架,內置 MPC、TEE、同態等多種密態計算虛擬設備供靈活選擇,提供豐富的聯邦學習算法和差分隱私機制。 開源項目: https://github.com/secretflow https://gitee.com/secretflow 4月27日,由「廈門大學安全智能計算實驗室」發起,聯合「隱語開源社區」、「福建省智慧城市感知與計算重點實驗室」共同舉辦的「廈

學習 , 開源 , 活動 , 模型

收藏 評論

BizSeer必示科技 - 大語言模型及提示工程在日誌分析任務中的應用 | 頂會IWQoS23 & ICPC24論文分享

本文是根據華為技術專家陶仕敏先生在2023 CCF國際AIOps挑戰賽決賽暨“大模型時代的AIOps”研討會閃電論文分享環節上的演講整理成文。 陶仕敏 華為技術專家 簡介:現任華為2012文本機器翻譯實驗,技術研究及創新負責人,技術專家。曾任百度運維平台及智能運維技術經理。主要研究方向:機器翻譯、AIOps等。 論文: BigLog:面向統一日誌表示的無監督大規模預訓練方法 BigL

運維 , 日誌 , 模型

收藏 評論

阿里雲大數據AI - 基於PAI-ChatLearn的GSPO強化學習實踐

引言 近期,阿里通義千問團隊創新性提出了 GSPO 算法,PAI-ChatLearn 框架第一時間支持並復現了GSPO的強化學習訓練過程,本文將介紹在 PAI 平台復現 GSPO 的最佳實踐。 GSPO 算法介紹 強化學習(Reinforcement Learning, RL)是拓展語言模型、增加其深度推理與問題求解能力的關鍵技術範式。為了持續拓展 RL,首要前提是確保穩定、魯棒的訓練過程。現有的

大數據處理 , 強化學習 , 最佳實踐 , 人工智能 , 模型

收藏 評論

阿里雲大數據AI - Post-Training on PAI (4):模型微調SFT、DPO、GRPO

引言 Post-Training(即模型後訓練)作為大模型落地的重要一環,能顯著優化模型性能,適配特定領域需求。相比於 Pre-Training(即模型預訓練),Post-Training 階段對計算資源和數據資源需求更小,更易迭代,因此備受推崇。 近期,我們將體系化地分享基於阿里雲人工智能平台 PAI 在強化學習、模型蒸餾、數據預處理、SFT等方向的技術實踐,旨在清晰地展現 PAI 在 Post

大數據處理 , 雲計算 , 算法 , 人工智能 , 模型

收藏 評論

阿里雲大數據AI - PAI Physical AI Notebook詳解3:基於仿真的導航模型訓練

在前兩期,我們已經分別基於仿真環境和世界模型進行了針對Manipulation(動作控制)模型的訓練數據合成與模仿學習。我們來回顧下整個過程: 針對具身智能場景,除了Manipution,Navigation(導航)也是一類非常重要的控制模型,本期我們就來詳細解讀基於仿真環境的導航模型訓練的全過程。 和動作控制模型類似,對導航模型的訓練也可以通過人工演示、數據擴增、數據增強、模仿學習和模型

阿里雲 , 人工智能 , 模型

收藏 評論

MatrixOrigin - 技術解讀|MatrixOne Intelligence模型解析原理及微調實踐

1. 解析模型 1.1 解析模型(Parsing Model) MOI 解析模型是指用於從複雜文檔(如 PDF、掃描圖、報告等)中識別結構要素(如標題、段落、表格、圖像等)並提取其內容模型。在MatrixOne Intelligence(下文簡稱MOI)產品中,採用了 MinerU (mineru.readthedocs.io),一個開源的將PDF轉化為markdown 解析工具。 MinerU

技術 , 模型

收藏 評論

阿里雲大數據AI - Post-Training on PAI (2):Ray on PAI,雲上一鍵提交強化學習

1. 前言 1.1 Ray Ray是一個開源的分佈式計算框架,集成了多個AI庫,擁有豐富的生態系統,包括Ray Tune(超參數調優)、Ray RLlib(強化學習)、Ray Serve(模型部署)、RaySGD 的分佈式運行環境,提供了全面的AI解決方案,使得AI並行訓練更容易和高效。 OpenAI 聲明使用了 Ray 作為ChatGPT 大模型訓練的底層平台,參考 ​​How Does Ray

大數據處理 , 開發 , 標註 , 人工智能 , 模型

收藏 評論

阿里雲開發者 - 展心展力 metaapp:基於 DeepRec 的稀疏模型訓練實踐

1 背景 推薦場景大模型在國內的使用很早,早在 10 年前甚至更早,百度已經用上了自研的大規模分佈式的 parameter server 系統結合上游自研的 worker 來實現 TB 級別的萬億參數的稀疏模型。後來,各家平台也陸續基於這種方案,開發了自己的分佈式訓練系統,普遍特點是大量使用 id embedding,因此參數量巨大,模型大小也非常誇張。當然,隨着開源訓練工具 TensorFlow

機器學習 , 大數據 , 人工智能 , meta , 模型

收藏 評論

阿里雲大數據AI - Post-Training on PAI (2):Ray on PAI,雲上一鍵提交強化學習

1. 前言 1.1 Ray Ray是一個開源的分佈式計算框架,集成了多個AI庫,擁有豐富的生態系統,包括Ray Tune(超參數調優)、Ray RLlib(強化學習)、Ray Serve(模型部署)、RaySGD 的分佈式運行環境,提供了全面的AI解決方案,使得AI並行訓練更容易和高效。 OpenAI 聲明使用了 Ray 作為ChatGPT 大模型訓練的底層平台,參考 ​​How Does Ray

開發 , 標註 , 數據庫 , 人工智能 , 模型

收藏 評論

阿里雲大數據AI - 【新模型速遞】PAI-Model Gallery雲上一鍵部署MiniMax-M1模型

MiniMax-M1 模型是由 MiniMax 公司6月17日全新推出的大語言模型,使用hybrid Mixture-of-Experts (MoE) 架構,並使用了 lightning attention 機制。 MiniMax 公司稱其為世界上第一個開源的大規模混合架構的推理模型。 MiniMax-M1 模型原生支持 1 百萬個 token 的上下文長度, 並且 lightning atten

llm , 大數據處理 , 雲計算 , 人工智能 , 模型

收藏 評論