收藏 / 列表

架構師李哲 - 大模型微調「數據集構建」保姆級教程(超全)

經驗之談:實踐表明,近80%的大模型微調失敗案例,根源都可追溯至數據集問題。 2024年堪稱“行業大模型元年”,金融、醫療、教育等各行各業都在積極佈局專屬AI助手。然而,許多企業在投入重金進行模型微調後,卻常常面臨“模型表現不及預期”的困境。 實踐中常見的三大困境: ● 災難性遺忘:模型在學習了新的專業知識後,原有的通用對話與理解能力顯著衰退。 ● 泛化能

數據 , AI , 大模型微調 , aigc , 人工智能 , 深度學習

Baihai_IDP - 對 GPT 5 模型路由機制的深度解析

編者按: 我們今天為大家帶來的文章,作者的觀點是:GPT-5 通過引入“智能路由器”架構,實現了按需調用不同專家模型的動態協作機制,標誌着大模型正從“全能單體架構”邁向“專業化協同架構”的新範式。 文章深入剖析了 GPT-5 路由機制的四大決策支柱 —— 對話類型、任務複雜度、工具需求與用户顯性意圖,並對比了其相較於 GPT-4、Toolformer 及早期插件系統的突破性進步。作者還詳細拆

llm , 知識 , chatgpt , openai , 人工智能

MatrixOrigin - Git for Data:像Git一樣管理你的數據

作者 | 矩陣起源 策劃 | InfoQ李冬梅 當你的 AI Agent 突然清空核心數據庫,或是悄悄注入虛假數據時,傳統的數據恢復手段往往耗時費力。而 Git for Data 帶來的變革,能讓這一切像回滾代碼提交一樣簡單。 DATA-CTL RESET DATABASE `agent1_db` TO TIMESTAMP 2025-08-01 12:00:00.123456; 瞬間

數據庫 , 人工智能 , Git

萬界星空科技 - QMS選型的本質與AI質檢的終極賦能

行業適配是偽命題?QMS選型的本質與AI質檢的終極賦能​ 一、選擇QMS應該如何選擇呢? 1、功能 2、業務關聯和控制能力 3、集成能力 4、併發和大數據處理能力 5、諮詢能力,設計能力 6、其他製造業系統的熟悉程度,最好做MES,ERP。 二、AI質檢在萬界星空科技QMS中的具體應用場景 來料檢驗(IQC) 傳統方式: 抽樣檢

運維 , 工業智能化 , 人工智能 , 製造業 , 工業物聯網

龍蜥社區 - 共築智能時代安全防線!AI 創新與系統安全分論壇議程出爐 | 2025 龍蜥大會

2025 龍蜥操作系統大會將於 11 月 17 日在北京·星地藝術中心舉辦,由中國計算機學會開源發展技術委員會、泛在操作系統開放社區、中關村科技園區朝陽園管理委員會(北京市朝陽區科學技術和信息化局)、中國開源軟件推進聯盟指導,龍蜥社區主辦,中關村互聯網 3.0 產業園(星地中心)協辦,阿里雲、中興通訊、海光信息、Intel、浪潮信息、Arm 等 24 家理事單位共同承辦,主題為“生態共融·智驅未來

操作系統 , 開源

NocoBase - 11 個在 GitHub 上最受歡迎的開源無代碼 AI 工具

原文鏈接:11 個在 GitHub 上最受歡迎的開源無代碼 AI 工具 引言 過去一年,AI 與無代碼的融合速度遠超預期。它已經不只是“加一個 AI 功能”,而是在重塑我們構建應用的方式。 無代碼也正在經歷一場明顯的轉變:從過去的“搭界面、建數據結構、配置流程”,進一步走向“讓 AI 參與建模、生成邏輯,並協作完成系統構建”。這樣的變化已經開始出現在真實產品中,而不是停留在概念層面。 💡 延伸閲

無代碼開發平台 , 資訊 , github , 人工智能 , 開源

劉大貓 - TortoiseSVN使用-TortoiseSVN更換或重置登錄用户

@[toc] 3.4.9 TortoiseSVN更換或重置登錄用户 1,打開SVN的settings 2,找到Saved Data欄,右側Authentication data項點擊清除按鈕clear 3,再次打開SVN,會要求輸入username和password 本人其他相關文章鏈接 1.Windows下版本控制器(SVN) - 1、開發中的實際問題+2、版本控制簡介 2.

算法 , tortoisegit , svn , 人工智能 , tortoisesvn

慧星雲 - 魔多 AI 支持 Wan 系列在線訓練 :解鎖視頻生成新高度

Wan 阿里巴巴通義實驗室推出的 Wan 系列模型憑藉突破性的技術架構與卓越的生成能力,成為行業關注的焦點。為助力開發者與創作者深挖視頻生成技術潛力,魔多 AI 社區正式宣佈全面支持通義萬相 Wan2.1 與 Wan2.2 兩款重磅視頻模型的訓練服務,為不同場景的創作需求提供專業級技術支撐。 Wan2.1Wan2.2 Wan2.1 Wan2.1 採用自研高效變分自編碼器(VAE)與

雲平台 , 雲計算 , 雲服務 , aigc

codists - 翻譯:《實用的Python編程》01_05_Lists

目錄 | 上一節 (1.4 字符串) | 下一節 (1.6 文件) 1.5 列表 本節介紹 Python 原始數據類型列表(list)。 列表是一種有序的集合。 創建列表 使用方括號 [] 來定義列表字面量。 names = [ 'Elwood', 'Jake', 'Curtis' ] nums = [ 39, 38, 42, 65, 111] 有時候,列表也可以通過其它方法創建。例如:使用字符串

網頁爬蟲 , 人工智能 , 數據結構與算法 , 後端 , Python

思否編輯部 - 騰訊雲 Agent 應用創新大賽收官,智能體迎來加速時刻

近日,首屆騰訊雲黑客鬆 Agent 應用創新挑戰賽完成評審並正式收官。賽期內,超過 2000 個團隊提交了智能體解決方案,覆蓋政務、教育、法律、健康、網絡安全等十餘個領域。從營銷助手到政務客服,從教育夥伴到無障礙服務,參賽項目幾乎覆蓋了當前企業服務與用户交互的主要場景。這些作品不僅展現了智能體技術在實際業務中的應用潛力,更清晰地反映出該領域發展的四個確定性方向。 01應用場景持續豐富,智能體從單一

騰訊 , 人工智能 , 黑客馬拉松 , 開發者

JavaEdge - Embedding Atlas:Apple推出的開源Embedding可視化工具!

本文已收錄在Github,關注我,緊跟本系列專欄文章,咱們下篇再續! 🚀 魔都架構師 | 全網30W技術追隨者 🔧 大廠分佈式系統/數據中台實戰專家 🏆 主導交易系統百萬級流量調優 車聯網平台架構 🧠 AIGC應用開發先行者 | 區塊鏈落地實踐者 🌍 以技術驅動創新,我們的征途是改變世界! 👉 實戰乾貨:編程嚴

聚類 , yyds乾貨盤點 , 數據 , 人工智能 , 深度學習 , 開發者

合合信息解決方案 - 上市城商行:攻克複雜文本處理瓶頸,國際結算業務全場景智能化

隨着全球貿易的日益頻繁與金融數字化轉型的深入,國際結算業務作為銀行服務實體經濟跨境運作的關鍵環節,其處理效率與風控水平直接關係到銀行的競爭力與運營安全。 然而,信用證、提單、報關單等業務單據格式繁雜、版式多變、專業性強,傳統依賴於人工核對與半自動化處理的方式,已成為制約業務效能提升、潛藏操作風險的明顯短板。在此背景下,運用前沿AI技術實現複雜文檔的自動化處理,已成為商業銀行

機器學習 , 字段 , 數據 , 泛化 , 人工智能

疆鴻智能研發中心 - 智能焊接新突破:CC-Link IE轉EtherNet/IP網關如何重塑航空航天製造

智能焊接新突破:CC-Link IE轉EtherNet/IP網關如何重塑航空航天製造 在航空航天製造領域,攪拌摩擦焊接技術正成為鋁合金結構件焊接的首選工藝。然而,當三菱PLC控制的焊接機器人與採用EtherNet/IP協議的視覺系統相遇時,協議不兼容成為制約生產效率的關鍵瓶頸。 某航空航天部件製造商就曾面臨這樣的困境:他們的攪拌摩擦焊接

ETHERNET , CC LINK IE , ip , 協議轉換 , 人工智能 , 深度學習 , 網關 , 工業自動化

wx6464351503832 - 通義DeepResearch技術報告解讀

通義深度研究:開源AI研究助手的新里程碑 最近AI研究領域有個很有意思的現象,就是那些最厲害的AI研究助手,比如OpenAI的DeepResearch、谷歌的Gemini DeepResearch,全都是閉源的。這就像大家都在説"我做出了很棒的東西",但就是不告訴你怎麼做的。阿里巴巴通義實驗室最近開源的通義深度研究(Tongyi

強化學習 , agent , 智能體 , 數據 , Css , 大模型 , 前端開發 , HTML

Candy - 讓機器學習更簡單的 8 個 Python 庫

Machine Learning 再也不神秘了。 你已經熟悉 scikit-learn、PyTorch 和 XGBoost。很好——現在別再重複造輪子,來看看我在需要更快的實驗、更安全的 models,或在招聘經理眼裏像魔法一樣的 features 時真正會用的 8 個庫。它們不是人人都在列的“trendy”清單——而是優雅地解決了我在 production 和 research 中遇到的

機器人 , 人工智能

SelectDB技術團隊 - Apache Doris 數據導入原理與性能優化 | Deep Dive

概述 對於 Apache Doris 這樣的高性能分析型數據庫而言,高效、穩定的數據導入是保障實時分析能力的生命線。然而,在海量數據持續寫入的場景下,如何平衡導入延遲與吞吐、如何避免性能瓶頸,是開發者面臨的核心挑戰。Apache Doris 本文將深入剖析 Doris 數據導入的核心原理,涵蓋關鍵流程、組件、事務管理等,探討影響導入性能的因素,並提供實用的優化方法和最佳實踐,有助於用户選擇合適的導

教程 , 知識 , apache

煩惱的沙發 - Qwen Code v0.0.8 重磅發佈:深度集成 VS Code

上週,阿里通義千問團隊 Qwen Code 發佈了 v0.0.8 版本,這次更新的王牌特性,就是與我們日常用的 VS Code 實現了前所未有的深度集成。 如果能在編輯器裏直接獲得與代碼上下文完美匹配的建議和實時差異對比,是不是感覺編碼體驗即將迎來質變? 不過,強大的新功能也帶來了一個小小的門檻:Qwen Code v0.0.8 要求環境必須是 Node.js 20 或更高版本。本文將為你介紹一

通義千問 , 開發工具 , ai開發 , 教程 , 人工智能

傲視眾生的香蕉_bvX78Q - MCP 與傳統集成方案深度對決:REST API、GraphQL、gRPC 全方位技術解析

在系統集成領域,技術方案的選擇直接影響應用性能、開發效率和維護成本。隨着 AI 技術的快速發展,傳統集成方案在應對動態上下文管理、工具鏈調用等場景時逐漸顯露出侷限性,而 MCP(Model Context Protocol)作為 AI 時代的新選擇,正引發行業關注。本文將從技術特性、性能表現、安全機制等維度,對 MCP 與 REST API、GraphQL、gRPC 三種傳統方案進行深度對比。

rest-api , grpc , graphql , 人工智能

美狐美顏SDK開放平台 - 直播美顏SDK中的抖動特效實現難點:識別、渲染與延遲控制全攻略

在短視頻與直播行業快速演進的今天,用户對“視覺體驗”的要求不斷提高。美顏不再僅僅是磨皮、美白、瘦臉,而是追求更具互動感和趣味性的抖動特效(ShakeEffect)。從直播美顏SDK的角度來看,要實現一個自然、不卡頓、匹配主播動作的抖動特效,其實遠比看上去複雜。 如果你是技術負責人、產品經理,或者正關注直播美顏SDK集成方案、直播特效算法開發、實時渲染優化等問題,那麼這篇文章

視頻美顏sdk , 美顏api , 人工智能 , 直播美顏sdk , 計算機視覺 , 第三方美顏SDK , 在51CTO的第一篇博文 , 美顏SDK

mb691327edb400f - AI面試智能體

培訓預算削減的背後,是時候重新審視招聘的真正成本。 年底覆盤,不少HR對着培訓報表愁眉不展:預算花了近百萬,員工滿意度剛過及格線,業務部門還抱怨“培訓沒用”。降本增效的要求之下,培訓預算首當其衝被壓縮。問題真的出在培訓本身嗎?或許,根源在於招聘環節——選錯人,才是企業最大的成本浪費。 01 培訓無效的背後:選錯人是最昂貴的成本 當業務部門抱怨“培訓沒用”時,他們

沉浸式 , 一對一 , 人工智能 , 深度學習

天潤融通科技 - 天潤融通ZENAVA上崗3C家電售後,90%的報修無需人工處理

在競爭日趨激烈的家電行業,售後服務已成為影響消費者忠誠度和品牌口碑的關鍵戰場。 過去,面對一台壞掉的空調、洗衣機,消費者要撥打售後熱線,重複描述問題、等待人工響應、排隊建單、安排維修……流程複雜、響應慢、體驗差,品牌好感度就這樣一點點流失。 而現在,這一切正被AI徹底改寫。 在大量真實客户的服務場景中,天潤融通推出的對話式AI產品ZENAVA,已經將90%以上的

人工智能 , 深度學習

短短同學 - 正則表達式進階用法:從基礎到實戰的全場景指南

正則表達式(Regular Expression,簡稱 Regex)是文本處理的 “瑞士軍刀”,它通過簡潔的語法規則,實現對字符串的匹配、提取、替換與驗證。在前文哈希機制的學習中,我們瞭解到 “映射” 是核心邏輯;而正則表達式的核心,則是 “模式定義”—— 用特定語法描述目標文本的結構,再通過解釋器執行匹配操作。本文將從基礎語法拓展到進階技巧,結合 10 + 實戰場景,帶你掌握正

正則 , bc , 人工智能 , 深度學習 , 正則表達式

fangpin - 從 0 搭建 LLM 不再難!這個 PyTorch 項目幫你吃透大模型底層邏輯

如果你曾想深入理解大語言模型(LLM)的 “五臟六腑”,卻被框架封裝的黑盒接口、複雜的源碼結構勸退;如果你希望親手實現 Transformer 的每一個組件,而非單純調用transformers庫 —— 那麼今天推薦的這個開源項目,絕對能成為你的 LLM 學習 “腳手架”。 它就是 GitHub 上的 llm-from-scratch(項目地址),一個基於 PyTorch、專為教育設

AIGC二三事 , llm , BPE , 人工智能 , transformer , 深度學習 , 大模型

未聞花名AI - 構建AI智能體:十一、語義分析Gensim — 從文本處理到語義理解的奇妙之旅

一、Gensim是什麼? 想象一下你面對成千上萬篇中文文章,想要快速瞭解這些文章主要討論什麼話題,或者找到相似的文檔,甚至讓計算機理解詞語之間的語義關係,並發現文本中的相似模式和語義結構,這就是Gensim的主要用途。Gensim非常高效,即使處理百萬級的文檔也能遊刃有餘。 Gensim是一個專門用於自然語言處理的Python庫,它的核心功能是: 從大

預處理 , sed , pytorch , 人工智能 , 詞向量