tag 大模型

標籤
貢獻55
106
01:37 PM · Oct 26 ,2025

@大模型 / 博客 RSS 訂閱

DashVector - 如何使用DashVector的多向量檢索

本文介紹如何使用DashVector的多向量檢索功能。 在某些AI檢索的場景,會涉及一個實體對應多個向量,在檢索時希望通過多個向量檢索來找到最可能的實體,例如: 在自然語言處理中,標題和文檔分別抽取為不同的向量特徵,需要根據標題向量和文檔向量同時做檢索。 在商品檢索時,商品的圖片和文字分別抽取為不同的向量特徵,需要根據圖片向量和文字向量同時做檢索。 為了滿足這些需求,DashVector支

阿里巴巴 , 數據庫 , 人工智能 , 大模型

收藏 評論

美團技術團隊 - 美團 LongCat Interaction 團隊發佈大模型交互系統技術報告 WOWService

在本地生活服務領域,大模型技術落地正遭遇 “三重困境”:通用能力與領域需求難以適配,複雜場景下服務可靠性與個性化無法兼顧,高昂的數據成本與漫長的訓練週期進一步增加了開發難度。更關鍵的是,行業內缺乏可複用的業務適配框架與真實場景優化方案,導致技術落地效率較低。 如何打破僵局,實現 “體驗與效率” 的極致平衡?成為了行業共同面臨的難題。 基於此,結合美團自身在智能客服、多業務場景落地的實戰經驗,Lon

大模型 , 美團

收藏 評論

美團技術團隊 - LongCat-Video 視頻生成模型正式發佈,探索世界模型的第一步

要讓人工智能真正理解、預測甚至重構真實世界,“世界模型”(World Model)已成為通往下一代智能的核心引擎。作為能夠建模物理規律、時空演化與場景邏輯的智能系統,世界模型賦予AI“看見”世界運行本質的能力。而視頻生成模型有望成為構建世界模型的關鍵路徑——通過視頻生成任務壓縮幾何、語義、物理等多種形式的知識,AI得以在數字空間中模擬、推演乃至預演真實世界的運行。 基於這一關鍵目標,美團 Long

大模型 , 美團

收藏 評論

CloudWeGo - 提升流式開發效率與易用性:Kitex/Hertz 為大模型應用保駕護航

CloudWeGo 作為字節跳動開源的高性能微服務框架體系,核心組件 Kitex 與 Hertz 以其原生的流式處理能力,已成為大模型應用開發的核心技術支撐。兩者通過 SSE、gRPC 及自研 TTHeader Streaming 等多協議適配,完美契合大模型 "一問多答" 的交互需求,廣泛應用於 Chat、語音交互等各類大模型場景。 本文基於 Kitex / Hertz 項目 Maintaine

觀點 , 社區 , 框架 , 大模型

收藏 評論

阿里雲大數據AI - 阿里雲 AI 搜索開放平台新發布:增加 QwQ 模型

為了滿足用户對更高效、更智能搜索功能的需求,阿里雲 AI 搜索開放平台 新增加 QwQ 模型,這一全新模型的加入將為企業和開發者帶來更強大的搜索解決方案。 一、QwQ模型 開源版: 基於 Qwen2.5-32B 模型訓練的 QwQ 推理模型,於2025年3月6日發佈。通過強化學習大幅度提升了模型推理能力。模型數學代碼等核心指標(AIME 24/25、LiveCodeBench)以及部分通用指標(I

雲計算 , 搜索 , 阿里雲 , 人工智能 , 大模型

收藏 評論

數據挖掘者 - jQuery源碼分析_LQW

Qwen3 模型用於因果語言建模(Causal Language Modeling, CLM)的主類 Qwen3ForCausalLM,它是整個大模型在推理和訓練階段的核心接口。 🧱 1. 類定義 @auto_docstring class Qwen3ForCausalLM(Qwen3PreTrainedModel, Genera

初始化 , Qwen3 , 權重 , Css , 大模型 , 前端開發 , HTML , Git

收藏 評論

向量檢索 - 通義深度搜索

簡介 通義深度研究產品,又稱深度搜索智能體Deep Search Agent,基於廣受歡迎的通義開源 WebSailor/DeepResearch開源項目增強而來,為用户打造的端到端智能深度搜索Agent API,可廣泛應用於本地+聯網知識庫、長文報告寫作、金融分析、法律諮詢、市場研究等應用場景 通義深度搜索Agent,通過多階段

大數據 , yyds乾貨盤點 , 搜索 , 深度搜索 , 數據倉庫 , AI , AI問答 , 大模型

收藏 評論

晨曦微露s - 【CANN訓練營第三季】2022年度第三季新手班之升騰AI入門課

在昇騰NPU上跑Llama大模型:從零開始的真實測試之旅 一、為什麼選擇昇騰NPU? 昇騰的幾個吸引點 二、環境準備:GitCode白嫖攻略 為什麼選雲上測試? 創建昇騰Notebook實例 環境配置説明 三、驗證環境:第一個小坑

code , GiteCode , 昇騰 , 後端開發 , llama , 大模型 , Python

收藏 評論

劉大貓 - Linux下版本控制器(SVN) -命令行客户端

@[toc] 進階知識-Linux下版本控制器(SVN) 5、命令行客户端 5.1 創建兩個工作區目錄模擬兩個開發人員 mkdir -p /root/workspace/harry mkdir -p /root/workspace/sally 5.2 檢出 作用:完整下載版本庫中的全部內容。 命令: svn checkout svn://192.168.70.140/pro

算法 , svn , 人工智能 , tortoisesvn , 大模型

收藏 評論

鏡舟科技 - StarRocks 向量索引如何讓大模型“記性更好”?

隨着 ChatGPT、DeepSeek 等大語言模型的普及,我們已經能夠與 AI 進行流暢的對話。然而,即使是最先進的大模型也面臨着“記憶困境”,具體表現模型只能記住訓練時接觸的知識,且這些知識在使用時很可能會過期。實際應用或在處理特定領域問題時,可能生成看似合理但實際錯誤的內容。 大模型的“知識固化”問題一定程度上限制了其在企業級應用中的價值。那麼,如何讓大模型擁有更好的“記性”,實現知識的動態

索引 , 查詢優化 , 數據庫 , starrocks , 大模型

收藏 評論

舒一笑不禿頭 - 我的開源項目-PandaCoder迎來史詩級大更新啦

📖 插件簡介 PandaCoder 是一款專為中文開發者設計的 IntelliJ IDEA 插件,集成了中文編程轉換、Jenkins Pipeline支持、SpringBoot配置文件圖標顯示等多項強大功能。通過智能翻譯引擎和專業的開發工具支持,大幅提升中文開發人員的編程效率和開發體驗。 項目地址 https://github.com/shuyixiao-better/PandaCoder 1

intellij-idea , JAVA , 翻譯 , 大模型 , 後端

收藏 評論

CloudImagine - 實戰揭秘|魔搭社區 + 阿里雲邊緣雲 ENS,快速部署大模型的落地實踐

一種高效、便捷的部署方式。 隨着大模型技術的快速發展,業界的關注點正逐步從模型訓練往模型推理轉變。這一轉變不僅反映了大模型在實際業務中的廣泛應用需求,也體現了技術優化和工程化落地的趨勢。 魔搭社區(ModelScope)作為開源大模型的聚集地,結合阿里雲邊緣雲 ENS ,提供了一種高效、便捷的部署方式。通過按需付費和彈性伸縮,開發者可以快速部署和使用大模型,享受雲計算的便利。本文介紹了魔搭社

雲計算 , 邊緣計算 , cdn , 安全 , 大模型

收藏 評論

小白獅ww - 跨頁表格不用愁!OCRFlux-3B 一鍵提取乾淨文本

你有沒有試過從 PDF 裏複製一張跨頁表格?粘出來後表格被撕成兩半,排版亂成一團,本來幾分鐘的工作瞬間變成半小時的「拼圖」大戰。 針對這種煩惱,OCRFlux-3B 應運而生。它在 2025 年 6 月由 ChatDOC 團隊發佈,是一個基於多模態大模型的工具包,能把 PDF 和圖片轉成乾淨、可讀的 Markdown 文本。不僅支持頁面級轉換,還能自動合併跨頁表格和段落,讓複雜文檔結構瞬間清爽。

文本處理 , pdf , ocr , 大模型 , Markdown

收藏 評論

水冗水孚 - 圖文並茂:從Ubuntu服務器上安裝Ollama,到下載大模型,到寫前端頁實現大模型問答對話功能

本文圖文並茂,記錄安裝 Ollama過程,下載大模型,啓動ollama大模型服務,然後通過nginx代理外部請求訪問,實現一個前端問答效果 準備工作 一台服務器,操作系統 Ubuntu,版本大於等於 20.04,筆者的是 Ubuntu 22.04 64 bit 當然了 有域名最好 一個圖形可視化化鏈接服務器軟件,筆者推薦 winscp 一架梯子,筆者用的是,clash小貓 效果圖 效

react , ai開發 , Nginx , 大模型 , Ubuntu

收藏 評論

龍蜥社區 - 直播預告:Mooncake 如何破解成本、吞吐與長上下文困局? |《AI 進化論》第五期

在 AI 與本土化雙重浪潮之下,服務器操作系統正迎來歷史性變革。由龍蜥社區理事長單位阿里雲聯合 InfoQ 打造的直播 IP 欄目《AI 進化論:智算時代操作系統的破局之路》,以雲、AI、安全等技術與服務器操作系統如何融合演進為主線,聚焦服務器操作系統在智算時代的進化之路,特邀學術權威、行業專家、客户代表圍繞原生智能、原生安全、軟硬協同等熱點議題展開深度對話。截至目前,已直播四期,線上觀看人次達

操作系統 , 大模型

收藏 評論

sight_ai - 你想輕鬆調用全球主流AI模型嗎?快來加入Sight AI

一、Sight AI是什麼? 我們是SightAI,一個基於去中心化推理網絡的AI模型即服務平台。 無論你是在測試前沿模型還是分享創意項目,你都能在這裏找到志同道合的人! 關於這個社區 在這裏你可以尋找到以下內容: 功能公告和更新 探索文檔 查看我們的文檔 https://sightai.gitbook.io/ 以瞭解更多信息 技巧和竅門 讓你的 Sight AI 體驗達到最佳 分

API , 人工智能 , 大模型

收藏 評論

阿里雲大數據AI - 雲棲實錄 | 通義實驗室基於MaxCompute進行大模型數據管理及處理

本文根據9月25日雲棲大會--《通義基於MaxCompute進行大模型數據管理及處理》演講整理而成,演講信息如下: 演講人:曾劍元通義實驗室系統研發總監 主要內容: _AI數據的特點,跟傳統大數據的區別_ _通義實驗室為什麼基MaxCompute來構建我們的數據平台_ _通義實驗室的大模型的數據平台架構_ AI數據區別於傳統數據的三個特點 第一個特點是數據組織的無標準。像傳統大數據基本上是一個大寬

通義千問 , 阿里雲 , 數據處理 , 大模型

收藏 評論

觀復 - 在 Linux 系統上安裝 Miniconda、安裝 Xinference,並設置 Xinference 開機自啓動

一、安裝 Miniconda 1. 下載 Miniconda 安裝腳本 x86_64 架構: cd ~ wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh ARM 架構(如樹莓派或 Apple Silicon 的 Linux 虛擬機): wget https://repo.anaconda.com

llm , ai開發 , Linux , 人工智能 , 大模型

收藏 評論

迅易科技 - 從“模糊經驗”到“精準決策”,國內項目型服務企業的AI預測實踐

“預測做不準,還不如不做。”這是我們在服務客户的時候聽過最多,也最令人無奈的現實。 在當今競爭激烈的商業環境中,精準的銷售收入預測對於企業制定戰略規劃、合理配置資源以及有效控制風險起着關鍵作用。然而,對於項目制服務企業而言,實現這一目標卻面臨着諸多挑戰。 以一家提供專業諮詢方案的項目制服務企業為例,銷售人員每天都會接觸到大量的銷售線索,但這些線索的質量參差不齊,如何從這些繁雜的線索中篩選出有價值的

bi , 算法 , 人工智能 , 大模型 , Python

收藏 評論

得物技術 - RAG—Chunking策略實戰|得物技術

一、背 景 在 RAG 系統中,即便採用性能卓越的 LLM 並反覆打磨 Prompt,問答仍可能出現上下文缺失、事實性錯誤或拼接不連貫等問題。多數團隊會頻繁更換檢索算法與 Embedding模型,但收益常常有限。真正的瓶頸,往往潛伏在數據入庫之前的一個細節——文檔分塊(chunking)。不當的分塊會破壞語義邊界,拆散關鍵線索並與噪聲糾纏,使被檢索的片段呈現“順序錯亂、信息殘缺”的面貌。在這樣的

算法 , 數據庫 , 大模型 , 後端

收藏 評論

美團技術團隊 - LongCat-Flash-Omni正式發佈並開源:開啓全模態實時交互時代

自9月1日,美團正式發佈 LongCat-Flash 系列模型,現已開源 LongCat-Flash-Chat 和 LongCat-Flash-Thinking 兩大版本,獲得了開發者的關注。今天 LongCat-Flash 系列再升級,正式發佈全新家族成員——LongCat-Flash-Omni。 LongCat-Flash-Omni 以 LongCat-Flash 系列的高效架構設計為基礎(

開源 , 大模型 , 美團

收藏 評論

得物技術 - 大模型如何革新搜索相關性?智能升級讓搜索更“懂你”|得物技術

一、背 景 你是否曾在社區搜索時遇到這樣的困擾:想找一雙“平價學生黨球鞋”,結果出現的多是限量聯名款?或者輸入“初冬輕薄通勤羽絨服”,卻看到厚重登山款?這類“搜不準”的情況,正是搜索相關性技術要解決的核心問題——讓搜索引擎更準確地理解用户意圖,返回真正匹配的結果。今天,我們就來揭秘得物如何用大模型技術讓搜索變得更“聰明”。 搜索相關性,即衡量搜索結果與用户查詢的匹配程度,通俗來説就是“搜得準不準”

社區 , 搜索引擎 , 算法 , 大模型

收藏 評論

隱語SecretFlow - 如何在不可信的雲環境中,構建兼具極致性能與卓越安全的大語言模型(LLM)推理服務?

打開鏈接點亮社區Star,照亮技術的前進之路。每一個點贊,都是社區技術大佬前進的動力 Github 地址: https://github.com/secretflow/secretflow 關於作者:大家好!我是 2025隱語杯數據挑戰賽"密態大模型推理的隱私保護”賽道的參賽選手祁宏,來自香港科技大學(廣州),我在研究生階段的研究方向是大模型,指導老師是唐靖教授。 非常榮幸能夠在本次賽

開源 , 大模型

收藏 評論

DashVector - 如何通過Python SDK向Collection中插入或更新Doc

本文介紹如何通過Python SDK向Collection中插入或更新Doc。 説明 若調用本接口時Doc Id已存在,則等同於更新Doc; Doc Id不存在,則等同於插入Doc。 若調用本接口時不指定Doc Id,則等同於插入Doc,DashVector會自動生成Doc Id,並在返回結果中攜帶id信息。 前提條件 已創建Cluster 已獲得API-KEY 已安裝最

向量 , 數據庫 , 人工智能 , 大模型

收藏 評論