博客 / 列表

美團技術團隊 - 美團 LongCat-Video-Avatar 正式發佈,實現開源SOTA級擬真表現

今年 8 月,美團開源的 InfiniteTalk 項目憑藉無限長度生成能力與精準的唇形、頭部、表情及姿態同步表現,迅速成為語音驅動虛擬人領域的主流工具,吸引全球數萬名開發者的使用。10月底,LongCat 團隊開源了LongCat-Video視頻生成模型,尤其在長視頻生成領域具備顯著優勢。 在 InfiniteTalk 和 LongCat-Video 基座的良好基礎上,LongCat 團隊針對實

開源 , 大模型 , 美團

美團技術團隊 - 美團 LongCat Interaction 團隊發佈大模型交互系統技術報告 WOWService

在本地生活服務領域,大模型技術落地正遭遇 “三重困境”:通用能力與領域需求難以適配,複雜場景下服務可靠性與個性化無法兼顧,高昂的數據成本與漫長的訓練週期進一步增加了開發難度。更關鍵的是,行業內缺乏可複用的業務適配框架與真實場景優化方案,導致技術落地效率較低。 如何打破僵局,實現 “體驗與效率” 的極致平衡?成為了行業共同面臨的難題。 基於此,結合美團自身在智能客服、多業務場景落地的實戰經驗,Lon

大模型 , 美團

美團技術團隊 - 美團 LongCat 團隊發佈全模態一站式評測基準UNO-Bench

多模態人工智能正從單一感知能力邁向視覺、音頻與文本的統一融合,即全模態大模型(Omni-models)時代。然而,相應的評測體系卻相對滯後。現有的評測工具不僅稀缺、各自為戰,且幾乎完全以英文為中心,缺乏對中文場景的有效支持。此外,一些現存的數據集在設計上存在侷限性,例如部分問題的解答路徑並非嚴格依賴於多模態信息的融合,這為科學評估模型真實的跨模態能力帶來了一定的複雜性。 針對這些痛點,美團Lon

大模型 , 美團

美團技術團隊 - 美團開源LongCat-Audio-Codec,高效語音編解碼器助力實時交互落地

語音大語言模型(Speech LLM)想落地,繞不開一個死結:既要快速理解語音裏的語義,又要説出自然的音色,還得實時響應。比如智能音箱 “聽不懂” 語音,車載助手 “説” 得像機器人,實時翻譯延遲卡半秒 ——深究根源,全在 “語音 Token 化”:作為拆分語音為 Speech LLM “離散單元” 的關鍵步驟,傳統方案始終沒平衡好 —— 要麼缺語義、要麼丟聲學、要麼延遲高,剛好卡了 Speech

開源 , 大模型 , 美團

美團技術團隊 - OR算法+ML模型混合推理框架架構演進

本文介紹了OR算法+ML模型混合推理能力建設思路及業務背景,此場景相比常規模型推理更具特殊性和複雜性,在工程實現上面臨多維挑戰,因此本文分別從性能、穩定性和擴展性三個維度分析問題和解法,並以推理框架架構演進為線總結了過去兩年的分期迭代實踐歷程和收益,其中有一些較為通用的經驗,希望能夠給大家帶來一些幫助或啓發。 1 背景 調度系統主要職責是需要在合適的時間以合適的方式將合適的運單分給合適的騎手,承載

算法 , 架構設計 , 美團

美團技術團隊 - MTGR:美團外賣生成式推薦Scaling Law落地實踐

美團外賣推薦算法團隊基於HSTU提出了MTGR框架以探索推薦系統中Scaling Law。MTGR對齊傳統模型特徵體系,並對多條序列利用Transformer架構進行統一建模。通過極致的性能優化,樣本前向推理FLOPs提升65倍,推理成本降低12%,訓練成本持平。MTGR離在線均取得近2年迭代最大收益,且於2025年4月底在外賣推薦場景全量。本文系相關工作的實踐與經驗總結,希望能給從事相關方向研究

算法 , 架構設計 , 美團

美團技術團隊 - LongCat-Flash-Omni正式發佈並開源:開啓全模態實時交互時代

自9月1日,美團正式發佈 LongCat-Flash 系列模型,現已開源 LongCat-Flash-Chat 和 LongCat-Flash-Thinking 兩大版本,獲得了開發者的關注。今天 LongCat-Flash 系列再升級,正式發佈全新家族成員——LongCat-Flash-Omni。 LongCat-Flash-Omni 以 LongCat-Flash 系列的高效架構設計為基礎(

開源 , 大模型 , 美團

美團技術團隊 - 美團 LongCat 團隊發佈 VitaBench:基於複雜生活場景的交互式 Agent 評測基準

由美團 LongCat 團隊研發的 VitaBench(Versatile Interactive Tasks Benchmark)正式發佈,這是當前高度貼近真實生活場景所面臨複雜問題的大模型智能體評測基準。 VitaBench 以外賣點餐、餐廳就餐、旅遊出行三大高頻真實生活場景為典型載體,構建了包含 66 個工具的交互式評測環境,並進行了跨場景的綜合任務設計,例如要求 agent 在一個旅行規劃

大模型 , 美團

美團技術團隊 - 基本功 | 一文講清多線程和多線程同步

多線程編程是現代軟件開發中的一項關鍵技術,在多線程編程中,開發者可以將複雜的任務分解為多個獨立的線程,使其並行執行,從而充分利用多核處理器的優勢。然而,多線程編程也帶來了挑戰,例如線程同步、死鎖和競態條件等問題。本篇文章將深入探討多線程編程的基本概念(原子操作、CAS、Lock-free、內存屏障、偽共享、亂序執行等)、常見模式和最佳實踐。通過具體的代碼示例,希望能夠幫助大家掌握多線程編程的核心技

多線程 , 美團

美團技術團隊 - 端智能在大眾點評搜索重排序的應用實踐

端智能,是指在移動端設備運行人工智能(AI)應用的技術。本文主要講述大眾點評搜索場景下,在端側部署大規模深度學習模型進行搜索重排序任務的實踐方案,包括端上特徵工程、模型迭代思路,以及具體部署優化的過程,希望能對從事相關領域開發的同學有所幫助或者啓發。 1 引言 隨着大數據、人工智能等信息技術的快速發展,雲計算已經無法滿足特定場景對數據隱私、高實時性的要求。借鑑邊緣計算的思想,在終端部署 AI 能力

移動web開發 , 邊緣計算 , 美團

美團技術團隊 - LongCat-Video 視頻生成模型正式發佈,探索世界模型的第一步

要讓人工智能真正理解、預測甚至重構真實世界,“世界模型”(World Model)已成為通往下一代智能的核心引擎。作為能夠建模物理規律、時空演化與場景邏輯的智能系統,世界模型賦予AI“看見”世界運行本質的能力。而視頻生成模型有望成為構建世界模型的關鍵路徑——通過視頻生成任務壓縮幾何、語義、物理等多種形式的知識,AI得以在數字空間中模擬、推演乃至預演真實世界的運行。 基於這一關鍵目標,美團 Long

大模型 , 美團

美團技術團隊 - ICCV 2025 | 美團論文精選及多模態推理競賽冠軍方法分享

本文介紹了美團技術團隊在國際頂會ICCV 2025中發表的5篇論文。同時,在ICCV 2025 舉辦的多模態推理競賽中,美團基礎研發平台/計算和智能平台組建的ActiveAlphaAgent團隊,斬獲賽題1真實場景視覺定位(VG-RS)冠軍,賽題2空間感知視覺問答(VQA-SA)季軍和賽題3創意廣告視頻視覺推理(VR-Ads)季軍。本文也分享了這三道賽題的解題思路,希望相關研究能給同學們帶來一些幫

大模型 , 美團

美團技術團隊 - 從0到1建設美團數據庫容量評估系統

美團數據庫團隊推出了數據庫容量評估系統,旨在解決數據庫容量評估與變更風險防控等領域難題。本文介紹了系統架構和主要功能:系統使用線上流量在沙盒環境回放驗證變更安全,結合倍速回放技術探測集羣性能瓶頸,構建容量運營體系實現集羣容量觀測與治理閉環。系統具備數據操作安全、結果真實可靠、靈活高效賦能等特點,有效提升數據庫穩定性與資源利用率。 01 項目背景 數據庫作為業務系統的核心基石,其重要性不言而喻。隨着

數據庫 , 美團

美團技術團隊 - 可驗證過程獎勵在提升大模型推理效率中的探索與實踐

美團業務研發搜推平台部算法團隊創新提出可驗證過程獎勵機制(VSRM),針對大模型推理中的冗餘回覆與過度思考問題,精準獎勵有效推理步驟,顯著縮減輸出長度並提升推理效率。VSRM通過步驟級正確率增益評估,有效抑制無效步驟,兼容主流強化學習算法,助力高效、可靠的複雜推理任務。 1 背景 以 DeepSeek-R1 為代表的大規模推理模型,通過簡單有效的強化學習後訓練方法,培養了強大的推理能力,但卻導致模

大模型 , 美團

美團技術團隊 - 開源 | InfiniteTalk:無限長虛擬人視頻生成的新範式

為解決虛擬人長視頻生成的質量退化問題,基礎研發平台/計算和智能平台部/視覺智能團隊推出 InfiniteTalk 技術,實現無限時長視頻生成。該技術口型精準且動作流暢,支持“語音驅動圖像”和“語音驅動視頻”多種模式,已在 GitHub 開源並獲 1.6K Stars, Hugging Face 月下載量 64.8K,受到了很多好評,能夠應用到電商直播、教育、影視等領域。 項目開源信息 項目主頁

開源 , 大模型 , 美團

美團技術團隊 - LongCat-Flash-Thinking 正式發佈,更強、更專業,保持極速!

今天,美團 LongCat 團隊正式發佈全新高效推理模型 LongCat-Flash-Thinking。在保持了 LongCat-Flash-Chat 極致速度的同時,全新發布的 LongCat-Flash-Thinking 更強大、更專業。綜合評估顯示,LongCat-Flash-Thinking 在邏輯、數學、代碼、智能體等多個領域的推理任務中,達到了全球開源模型的最先進水平(SOTA)。 同

開源 , 大模型 , 美團

美團技術團隊 - LongCat-Flash:如何使用 SGLang 部署美團 Agentic 模型

9 月 1 日,美團正式發佈並開源 LongCat-Flash-Chat,它採用了創新性混合專家模型(Mixture-of-Experts, MoE)架構,實現了計算效率與性能的雙重優化。 SGLang 團隊是業界專注於大模型推理系統優化的技術團隊,提供並維護大模型推理的開源框架 SGLang。近期,美團 M17 團隊與 SGLang 團隊一起合作,共同實現了 LongCat-Flash 模型在

開源 , 大模型 , 美團

美團技術團隊 - 報名 | 清華美團數字生活研究院學術論壇——大模型:前沿理論與產業變革

2025 年清華大學-美團數字生活聯合研究院(簡稱清華美團數字生活研究院)學術論壇將於 9 月 22 日(週一)舉辦。本次論壇聚焦大模型的前沿理論與產業變革,將邀請鄭緯民院士、多位學者和美團技術專家,提供多維視角,共探大模型技術邊界拓展與落地實踐路徑。 | 論壇時間:2025 年 9 月 22 日(週一)13:30-17:30 | 主辦單位:清華大學-美團數字生活聯合研究院、智能無人系統產學研聯盟

清華大學 , 學術交流 , 美團

美團技術團隊 - 美團正式發佈並開源 LongCat-Flash-Chat,動態計算開啓高效 AI 時代

今天,我們正式發佈 LongCat-Flash-Chat,並同步開源。LongCat-Flash 採用創新性混合專家模型(Mixture-of-Experts, MoE)架構,總參數 560 B,激活參數 18.6B~31.3B(平均 27B),實現了計算效率與性能的雙重優化。 根據多項基準測試綜合評估,作為一款非思考型基礎模型,LongCat-Flash-Chat 在僅激活少量參數的前提下,性能

開源 , 大模型 , 美團

美團技術團隊 - 美團 M17 團隊開源 Meeseeks 評測集:揭秘大模型 的“聽話”能力

近期,以 OpenAI o 系列模型、Claude 3.5 Sonnet 和 DeepSeek-R1 等各類大模型為代表的 AI 技術快速發展,其知識與推理能力得到了廣泛認可。然而,許多用户在實際使用中也注意到一個普遍現象:模型有時未能嚴格遵循輸入指令的具體格式要求、字數限制或內容約束,導致輸出結果雖內容尚可,卻不完全符合輸入指令。 針對大模型知識推理能力與指令遵循能力存在表現差異的現象,為推進指

開源 , 大模型 , 美團

美團技術團隊 - 可信實驗白皮書系列08:開放式分析引擎 | 附PDF合集下載

本篇為《可信實驗白皮書》系列的最後一篇內容,主要分享了AB實驗分析方法庫在美團的實踐。同時,我們也為大家準備了一份系列全集的PDF文檔,希望能夠幫助到更多從事AB實驗工作的同學們。 獲取方式:關注美團技術團隊微信公眾號,在對話框回覆「可信實驗白皮書」即可獲取下載鏈接。 為了幫助任何用户輕鬆擺脱A/B測試中的各種挑戰,讓沒有複雜實驗背景和專家知識的人也能零門檻自主進行可信、高效的實驗。同時實

ab測試 , 美團

美團技術團隊 - 美團智能頭盔研發實踐系列01:硬件設計篇

本文系《美團智能頭盔研發實踐》系列的第一篇文章,聚焦硬件設計維度。針對外賣騎手傳統頭盔佩戴體驗不佳等痛點,從安全保障、體驗優化、效率提升三大方向切入,詳細解析安全防護、多傳感器預警、通風減重、長效續航、音頻降噪、工藝控制等關鍵技術,並提煉研發過程中行之有效的設計經驗。 0. 前言 在現代城市的喧囂中,外賣騎手穿梭於大街小巷,只為將餐食及時送達顧客手中。然而,這份看似簡單的工作背後,卻隱藏着諸多痛點

智能硬件 , 美團

美團技術團隊 - 美團智能頭盔研發實踐系列02:軟件功能篇

本文系《美團智能頭盔研發實踐系列》的第二篇文章,圍繞智能頭盔如何通過主動安全和被動安全相結合的方式有效保護騎手,主要包括智能頭盔騎行通話質量強化、智能語音助手、碰撞摔倒監控等三項軟件能力。 01. 引言 美團智能頭盔作為專為外賣騎手打造的智能安全裝備,具備藍牙通話、戴盔識別、智能語音助手、碰撞摔倒監控等功能,核心軟件功能圍繞如何通過主動安全和被動安全相結合的方式有效保護騎手。 本期分享主要介紹智能

智能硬件 , 美團

美團技術團隊 - 聯合營銷生態下的廣告機制設計與實踐

即時零售行業蓬勃發展,在此生態下美團零售廣告成為助力零售商家和品牌商擴大生意規模的重要驅動力。文章首先介紹了在全新業務模式“聯合營銷”場景下,首創的多協同方參競拍賣機制算法——“集資拍賣”,然後梳理了集資拍賣在美團的技術發展路徑和實踐,圍繞規則化集資拍賣、模型化集資拍賣、整體集資拍賣進行了展開,最後是一些總結,希望能對大家有所幫助或啓發。 1 背景介紹 1.1 聯合營銷介紹 即時零售行業蓬勃發展,

搜索 , 算法 , 美團