tag 大模型

標籤
貢獻55
114
01:37 PM · Oct 26 ,2025

@大模型 / 博客 RSS 訂閱

CloudWeGo - 提升流式開發效率與易用性:Kitex/Hertz 為大模型應用保駕護航

CloudWeGo 作為字節跳動開源的高性能微服務框架體系,核心組件 Kitex 與 Hertz 以其原生的流式處理能力,已成為大模型應用開發的核心技術支撐。兩者通過 SSE、gRPC 及自研 TTHeader Streaming 等多協議適配,完美契合大模型 "一問多答" 的交互需求,廣泛應用於 Chat、語音交互等各類大模型場景。 本文基於 Kitex / Hertz 項目 Maintaine

觀點 , 社區 , 框架 , 大模型

收藏 評論

阿里雲大數據AI - 阿里雲 AI 搜索開放平台新發布:增加 QwQ 模型

為了滿足用户對更高效、更智能搜索功能的需求,阿里雲 AI 搜索開放平台 新增加 QwQ 模型,這一全新模型的加入將為企業和開發者帶來更強大的搜索解決方案。 一、QwQ模型 開源版: 基於 Qwen2.5-32B 模型訓練的 QwQ 推理模型,於2025年3月6日發佈。通過強化學習大幅度提升了模型推理能力。模型數學代碼等核心指標(AIME 24/25、LiveCodeBench)以及部分通用指標(I

雲計算 , 搜索 , 阿里雲 , 人工智能 , 大模型

收藏 評論

觀復 - 在 Linux 系統上安裝 Miniconda、安裝 Xinference,並設置 Xinference 開機自啓動

一、安裝 Miniconda 1. 下載 Miniconda 安裝腳本 x86_64 架構: cd ~ wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh ARM 架構(如樹莓派或 Apple Silicon 的 Linux 虛擬機): wget https://repo.anaconda.com

llm , ai開發 , Linux , 人工智能 , 大模型

收藏 評論

wx6464351503832 - 智能體AI的六大核心設計模式

隨着大模型技術的成熟,智能體正在從概念走向實際應用。與傳統的單次問答系統不同,智能體能夠自主規劃、使用工具、反思決策,並通過多輪交互完成複雜任務。本文探討當前業界最主流的六種智能體設計模式,這些模式已經在各大AI產品中得到驗證和應用,為開發者提供了構建可靠智能體系統的技術參考。 ReAct Agent:推理與行動的循環框架

agent , 智能體 , 設計模式 , 人工智能 , Css , 大模型 , 前端開發 , HTML

收藏 評論

全棧技術開發者 - LLM 對時間序列推理的增強究竟指的是什麼?LLM 對齊(alignment regimes)與時序推理的可靠性之間是什麼關係?

時間序列數據廣泛出現於自然科學、社會科學以及工程技術等各類領域中,其核心特徵在於數據隨時間的演變規律。長期以來,如何從這些動態變化的數據中提取有價值的信息、實現精準預測、並基於歷史數據進行推理,一直是數據分析、統計學和機器學習研究的核心問題。傳統的時間序列分析方法,如自迴歸模型(AR)、移動平均模型(MA)、以及更復雜的狀態空間模型和卡爾曼濾波器,在一定程度上能夠描述和預測數據的

llm , 建模 , yyds乾貨盤點 , 人工智能 , 時間序列 , 深度學習 , 大模型

收藏 評論

DashVector - 如何通過Python SDK更新Collection中已存在的Doc

本文介紹如何通過Python SDK更新Collection中已存在的Doc。 説明 若更新Doc時指定id不存在,則本次更新Doc操作無效 如只更新部分屬性fields,其他未更新屬性fields默認被置為None Python SDK 1.0.11版本後,更新Doc時vector變為非必填項 前提條件 已創建Cluster 已獲得API-KEY 已安裝最新版SDK 接口定義

向量 , 數據庫 , 人工智能 , 大模型

收藏 評論

快手技術 - 從“攔路虎”到“修路工”:基於AhaEdit的廣告素材修復

零、引言 一條保健品廣告在系統裏亮起了紅燈。 視頻裏,一位精神矍鑠的老人正在分享體驗。畫面看似陽光健康,但我們的風險定位模型精準捕捉到了違規點——那句"喝了能夠清宿便,相當於給腸道做SPA"的文案,涉及到醫療保健功效問題。 按照傳統流程,這條廣告將被駁回,客户需要根據政策修改創意,然後重新提交。這個過程往往伴隨着不確定性:哪裏違規?怎麼改才能通過?多次往返溝通也會影響投放效率。 但這一

廣告 , 算法 , 人工智能 , 大模型

收藏 評論

迅易科技 - 深度剖析:企業如何將生成式AI能力融入傳統軟件開發,實現價值倍增?

在數字化轉型的浪潮中,人工智能正以前所未有的力量,驅動着業務模式與運營效率的深刻變革。企業應如何理解並駕馭這一顛覆性技術?傳統軟件開發模式將面臨怎樣的升級?我們又該如何選擇正確的技術路徑,讓AI真正為業務賦能? 我們特別邀請到迅易科技COO Jacky,近期正聚焦生成式AI的企業級落地研究,AI智能體在多行業場景的應用,力求讓AI技術真正紮根業務、創造實效。 帶着這些問題,我們一起深入解析生成式

軟件開發 , ai開發 , 企業服務 , 人工智能 , 大模型

收藏 評論

快手技術 - 快手&南大聯合發佈自適應推理框架HiPO,突破LLM“過度思考”困局

當用户向大語言模型提出一個簡單問題,比如“單詞HiPPO裏有幾個字母P?”,它卻正襟危坐,開始生成一段冗長的推理鏈:“首先,讓我們分析HiPPO這個詞,河馬的英文單詞為hippo,河馬是一種半水生哺乳動物,這裏用户用了大寫字母,可能有特殊的含義,對於單詞HiPPO,我們可以將其拆分為H-i-P-P-O,字母P出現在第3與第4個位置,因此有2個字母P...讓我們簡化問題,HiPO可以拆分為...”

算法 , 知識 , 程序員 , 大模型 , 後端

收藏 評論

DashVector - 如何通過Python SDK向Collection中插入或更新Doc

本文介紹如何通過Python SDK向Collection中插入或更新Doc。 説明 若調用本接口時Doc Id已存在,則等同於更新Doc; Doc Id不存在,則等同於插入Doc。 若調用本接口時不指定Doc Id,則等同於插入Doc,DashVector會自動生成Doc Id,並在返回結果中攜帶id信息。 前提條件 已創建Cluster 已獲得API-KEY 已安裝最

向量 , 數據庫 , 人工智能 , 大模型

收藏 評論

隱語SecretFlow - 如何在不可信的雲環境中,構建兼具極致性能與卓越安全的大語言模型(LLM)推理服務?

打開鏈接點亮社區Star,照亮技術的前進之路。每一個點贊,都是社區技術大佬前進的動力 Github 地址: https://github.com/secretflow/secretflow 關於作者:大家好!我是 2025隱語杯數據挑戰賽"密態大模型推理的隱私保護”賽道的參賽選手祁宏,來自香港科技大學(廣州),我在研究生階段的研究方向是大模型,指導老師是唐靖教授。 非常榮幸能夠在本次賽

開源 , 大模型

收藏 評論

得物技術 - 大模型如何革新搜索相關性?智能升級讓搜索更“懂你”|得物技術

一、背 景 你是否曾在社區搜索時遇到這樣的困擾:想找一雙“平價學生黨球鞋”,結果出現的多是限量聯名款?或者輸入“初冬輕薄通勤羽絨服”,卻看到厚重登山款?這類“搜不準”的情況,正是搜索相關性技術要解決的核心問題——讓搜索引擎更準確地理解用户意圖,返回真正匹配的結果。今天,我們就來揭秘得物如何用大模型技術讓搜索變得更“聰明”。 搜索相關性,即衡量搜索結果與用户查詢的匹配程度,通俗來説就是“搜得準不準”

社區 , 搜索引擎 , 算法 , 大模型

收藏 評論

美團技術團隊 - LongCat-Flash-Omni正式發佈並開源:開啓全模態實時交互時代

自9月1日,美團正式發佈 LongCat-Flash 系列模型,現已開源 LongCat-Flash-Chat 和 LongCat-Flash-Thinking 兩大版本,獲得了開發者的關注。今天 LongCat-Flash 系列再升級,正式發佈全新家族成員——LongCat-Flash-Omni。 LongCat-Flash-Omni 以 LongCat-Flash 系列的高效架構設計為基礎(

開源 , 大模型 , 美團

收藏 評論

得物技術 - RAG—Chunking策略實戰|得物技術

一、背 景 在 RAG 系統中,即便採用性能卓越的 LLM 並反覆打磨 Prompt,問答仍可能出現上下文缺失、事實性錯誤或拼接不連貫等問題。多數團隊會頻繁更換檢索算法與 Embedding模型,但收益常常有限。真正的瓶頸,往往潛伏在數據入庫之前的一個細節——文檔分塊(chunking)。不當的分塊會破壞語義邊界,拆散關鍵線索並與噪聲糾纏,使被檢索的片段呈現“順序錯亂、信息殘缺”的面貌。在這樣的

算法 , 數據庫 , 大模型 , 後端

收藏 評論

迅易科技 - 從“模糊經驗”到“精準決策”,國內項目型服務企業的AI預測實踐

“預測做不準,還不如不做。”這是我們在服務客户的時候聽過最多,也最令人無奈的現實。 在當今競爭激烈的商業環境中,精準的銷售收入預測對於企業制定戰略規劃、合理配置資源以及有效控制風險起着關鍵作用。然而,對於項目制服務企業而言,實現這一目標卻面臨着諸多挑戰。 以一家提供專業諮詢方案的項目制服務企業為例,銷售人員每天都會接觸到大量的銷售線索,但這些線索的質量參差不齊,如何從這些繁雜的線索中篩選出有價值的

bi , 算法 , 人工智能 , 大模型 , Python

收藏 評論

CloudImagine - 實戰揭秘|魔搭社區 + 阿里雲邊緣雲 ENS,快速部署大模型的落地實踐

一種高效、便捷的部署方式。 隨着大模型技術的快速發展,業界的關注點正逐步從模型訓練往模型推理轉變。這一轉變不僅反映了大模型在實際業務中的廣泛應用需求,也體現了技術優化和工程化落地的趨勢。 魔搭社區(ModelScope)作為開源大模型的聚集地,結合阿里雲邊緣雲 ENS ,提供了一種高效、便捷的部署方式。通過按需付費和彈性伸縮,開發者可以快速部署和使用大模型,享受雲計算的便利。本文介紹了魔搭社

雲計算 , 邊緣計算 , cdn , 安全 , 大模型

收藏 評論

向量檢索 - 通義深度搜索

簡介 通義深度研究產品,又稱深度搜索智能體Deep Search Agent,基於廣受歡迎的通義開源 WebSailor/DeepResearch開源項目增強而來,為用户打造的端到端智能深度搜索Agent API,可廣泛應用於本地+聯網知識庫、長文報告寫作、金融分析、法律諮詢、市場研究等應用場景 通義深度搜索Agent,通過多階段

大數據 , yyds乾貨盤點 , 搜索 , 深度搜索 , 數據倉庫 , AI , AI問答 , 大模型

收藏 評論

晨曦微露s - 【CANN訓練營第三季】2022年度第三季新手班之升騰AI入門課

在昇騰NPU上跑Llama大模型:從零開始的真實測試之旅 一、為什麼選擇昇騰NPU? 昇騰的幾個吸引點 二、環境準備:GitCode白嫖攻略 為什麼選雲上測試? 創建昇騰Notebook實例 環境配置説明 三、驗證環境:第一個小坑

code , GiteCode , 昇騰 , 後端開發 , llama , 大模型 , Python

收藏 評論

劉大貓 - Linux下版本控制器(SVN) -命令行客户端

@[toc] 進階知識-Linux下版本控制器(SVN) 5、命令行客户端 5.1 創建兩個工作區目錄模擬兩個開發人員 mkdir -p /root/workspace/harry mkdir -p /root/workspace/sally 5.2 檢出 作用:完整下載版本庫中的全部內容。 命令: svn checkout svn://192.168.70.140/pro

算法 , svn , 人工智能 , tortoisesvn , 大模型

收藏 評論

鏡舟科技 - StarRocks 向量索引如何讓大模型“記性更好”?

隨着 ChatGPT、DeepSeek 等大語言模型的普及,我們已經能夠與 AI 進行流暢的對話。然而,即使是最先進的大模型也面臨着“記憶困境”,具體表現模型只能記住訓練時接觸的知識,且這些知識在使用時很可能會過期。實際應用或在處理特定領域問題時,可能生成看似合理但實際錯誤的內容。 大模型的“知識固化”問題一定程度上限制了其在企業級應用中的價值。那麼,如何讓大模型擁有更好的“記性”,實現知識的動態

索引 , 查詢優化 , 數據庫 , starrocks , 大模型

收藏 評論

舒一笑不禿頭 - 我的開源項目-PandaCoder迎來史詩級大更新啦

📖 插件簡介 PandaCoder 是一款專為中文開發者設計的 IntelliJ IDEA 插件,集成了中文編程轉換、Jenkins Pipeline支持、SpringBoot配置文件圖標顯示等多項強大功能。通過智能翻譯引擎和專業的開發工具支持,大幅提升中文開發人員的編程效率和開發體驗。 項目地址 https://github.com/shuyixiao-better/PandaCoder 1

intellij-idea , JAVA , 翻譯 , 大模型 , 後端

收藏 評論

龍蜥社區 - 直播預告:Mooncake 如何破解成本、吞吐與長上下文困局? |《AI 進化論》第五期

在 AI 與本土化雙重浪潮之下,服務器操作系統正迎來歷史性變革。由龍蜥社區理事長單位阿里雲聯合 InfoQ 打造的直播 IP 欄目《AI 進化論:智算時代操作系統的破局之路》,以雲、AI、安全等技術與服務器操作系統如何融合演進為主線,聚焦服務器操作系統在智算時代的進化之路,特邀學術權威、行業專家、客户代表圍繞原生智能、原生安全、軟硬協同等熱點議題展開深度對話。截至目前,已直播四期,線上觀看人次達

操作系統 , 大模型

收藏 評論

阿里雲大數據AI - 雲棲實錄 | 通義實驗室基於MaxCompute進行大模型數據管理及處理

本文根據9月25日雲棲大會--《通義基於MaxCompute進行大模型數據管理及處理》演講整理而成,演講信息如下: 演講人:曾劍元通義實驗室系統研發總監 主要內容: _AI數據的特點,跟傳統大數據的區別_ _通義實驗室為什麼基MaxCompute來構建我們的數據平台_ _通義實驗室的大模型的數據平台架構_ AI數據區別於傳統數據的三個特點 第一個特點是數據組織的無標準。像傳統大數據基本上是一個大寬

通義千問 , 阿里雲 , 數據處理 , 大模型

收藏 評論

sight_ai - 你想輕鬆調用全球主流AI模型嗎?快來加入Sight AI

一、Sight AI是什麼? 我們是SightAI,一個基於去中心化推理網絡的AI模型即服務平台。 無論你是在測試前沿模型還是分享創意項目,你都能在這裏找到志同道合的人! 關於這個社區 在這裏你可以尋找到以下內容: 功能公告和更新 探索文檔 查看我們的文檔 https://sightai.gitbook.io/ 以瞭解更多信息 技巧和竅門 讓你的 Sight AI 體驗達到最佳 分

API , 人工智能 , 大模型

收藏 評論