博客 / 列表

PetterLiu - 自動化檢索增強生成(RAG)評估框架解析

一.RAG系統評估的必要性與挑戰 檢索增強生成(Retrieval-Augmented Generation, RAG)技術已成為增強大型語言模型(LLM)能力的關鍵範式。通過從外部知識庫中檢索相關信息,RAG能夠有效解決LLM固有的知識過時和內容幻覺等核心侷限性。無論是為客户支持系統提供最新的產品信息,還是在金融、醫療等專業領域確保答案的準確性與可追溯性,RAG都扮演着至關重要的角色。

AI

PetterLiu - 不止於代碼-如何用 Trae IDE與Agent重塑軟件需求工程

從“氛圍編程”到“智能評審”——利用上下文感知 Agent 實現 30%+ 的研發左移提效 在 AI 編程工具爆發的今天,大多數人的目光仍聚焦在 Copilot 的代碼補全上。但作為資深開發者,我們都清楚一個殘酷的現實:如果需求(PRD)本身就是垃圾,寫代碼的速度越快,產出“技術債務”的速度就越快。 最近,AI 輔助開發的概念已從簡單的“輔助編程”演進為 “氛圍編程 2.0 (Vibe C

AI

PetterLiu - 2024-2026年中國廣告媒體市場深度調研報告

1. 執行摘要:韌性復甦與存量博弈下的新常態 2024年至2026年是中國廣告與媒體市場經歷深刻結構性轉型的關鍵時期。在經歷了宏觀經濟的波動與復甦後,中國市場正從以人口紅利為驅動的高速增長階段,全面轉向以技術效能(AI)、內容生態(短視頻/直播)和存量博弈(內卷化競爭)為特徵的成熟發展期。儘管全球廣告市場預計將在2026年首次突破1萬億美元大關,中國作為全球第二大廣告市場,其增長邏輯正展現出獨

企業信息化

PetterLiu - 解鎖2026年商業未來:四大核心概念深度解析

迎接未來商業浪潮 歡迎踏入即將到來的商業新紀元。對於初涉商業與市場營銷領域的探索者而言,理解未來的核心驅動力至關重要。本文旨在為您提供 navigating the next wave of disruption 的基本心智模型,用最精煉的語言,深度解析將在2026年重塑商業格局的四大核心概念。掌握這些理念,是您洞察技術、消費者行為與商業戰略深刻變革,從而把握未來先機的關鍵第一步。 一.隱

AI

PetterLiu - ConTextTab一個語義感知的表格情境學習模型

概要 ConTextTab的核心設計哲學在於“兩全其美”——它旨在將大語言模型級別的深度語義理解和世界知識,無縫注入到一個高效、為表格數據原生設計的ICL框架中。其目標是創造一個既能理解數據“説什麼”(語義),又能高效處理數據“長什麼樣”(結構)的模型。另一個名字是SAP-RPT1-OSS ConTextTab(2506.10707)的核心目標,是將表格原生模型的高效性與大型語言模型(LLM)

AI

PetterLiu - RAG應用性能優化入門指南

從“能用”到“好用”的RAG之旅 檢索增強生成(Retrieval-Augmented Generation, RAG)技術正深刻地改變着我們與信息交互的方式,它為構建知識問答系統、智能對話代理、文檔處理和工作流自動化等應用提供了強大的動力。通過RAG,我們可以讓強大的語言模型(LLM)理解並運用那些它們在訓練時從未見過的私有數據。 RAG的核心工作流程可拆分為兩個階段: 1. 數據索

AI

PetterLiu - GPT-5.2安全報告討論

一場複雜的辯論 OpenAI於12月11日發佈的關於其最新模型GPT-5.2的系統安全報告,一經問世便在業內引發了廣泛而複雜的爭議。這份報告詳細地呈現了新模型在各項安全與能力指標上的表現,但其數據卻同時引出了兩種截然相反的解讀。 這使得我們不得不直面一個核心問題:“我們究竟是看到了一個在安全和能力上取得了實質性、可衡量進步的AI模型,還是説在那些看起來很漂亮的增長曲線背後,其實

AI

PetterLiu - AI大模型電商Ecom-Bench評測解讀

阿里巴巴通義實驗室推出的 EcomBench,這是一個專門為評估人工智能智能體在真實電商場景中表現而設計的基準測試。研究者認為現有的 AI 測試過於偏向學術理論,因此通過人工參與的方式,從亞馬遜等平台提取真實的用户需求,構建了涵蓋營銷策略、成本定價和法律諮詢等七大領域的實戰考題。測試結果顯示,儘管 GPT-4o 和 Gemini 1.5 Pro 等頂尖模型在簡單任務中表現優異,但在需要多步推理

AI

PetterLiu - 企業級AI智能體(Agent)市場分析

企業級AI智能體(Agent)市場分析報告:從應用場景到落地挑戰的深度洞察 AI智能體——從輔助工具到自主生產力的範式轉移 一場深刻的範式轉移正在重塑人工智能的版圖,其核心驅動力便是AI智能體(AI Agent)。它不再是亦步亦趨的輔助工具,而是正在崛起為一種能夠自主規劃與執行的全新生產力,徹底改寫着人機協作的遊戲規則。 我們可以用一個生動的比喻來理解AI智能體的核心構成——它是一個擁有“大腦

AI

PetterLiu - 阿里Z-Image圖像生成模型容器部署

背景 Z-Image是阿里巴巴通義實驗室開發的一款開源圖像生成模型, 詳細介結可以看這兒《Z-Image圖像生成模型發佈與競品》。Z-Image系列高性能生成模型,其中包括用於快速推理的Z-Image-Turbo和專業的圖像編輯模型Z-Image-Edit。這些模型基於可擴展單流擴散轉換器 (S3-DiT) 架構構建,強調通過優化設計實現極高的訓練效率和低計算成本。其核心方法論依賴於先進的數據基

AI

PetterLiu - LogParser-LLM 前綴樹算法實現

根據 LogParser-LLM 的架構設計,前綴樹(Prefix Tree / Prefix Parse Tree)的核心目標是作為高速緩存,攔截 99% 的重複日誌模式,僅在無法“嚴格匹配”時才調用 LLM。以下是基於論文描述的 Java 實現方案。該實現涵蓋了核心數據結構設計、日誌匹配邏輯(Strict Match)以及模版更新機制。 核心設計思路 1. 節點設計 (TreeNode):

後端

PetterLiu - 從日誌解析到通用工程LLM

導言 在當今的工程領域,我們普遍面臨一個核心挑戰:如何從海量的、非結構化的數據(如日誌、配置文件、告警信息)中高效提取價值。這些數據是診斷系統故障、洞察系統行為的“救命稻草”,但其雜亂無章的格式對機器而言形同“天書”。大語言模型(LLM)的出現,以其前所未有的語義理解能力,為破解這一難題帶來了希望。然而,希望的背後隱藏着一個致命的矛盾:若將每日億級的日誌逐條交由LLM處理,其巨大的成本與時間延遲

AI

PetterLiu - Table-RAG破解海量表格檢索難題

破解海量表格檢索難題 一.概述 在當今的商業與科研領域,結構化數據——尤其是那些動輒包含數十萬、數百萬單元格的大型表格——構成了我們決策與洞察的基石。然而,一個令人困惑的現實是,即便強大如GPT系列的大型語言模型(LLM),在面對這些海量、規整的數據時,也常常會“迷航”。它們就像一位才華橫溢的語言學家被要求在沒有地圖的情況下,穿越一片由數字和文本構成的汪洋大海。將深入剖析這一困境的根源,並拆解一

AI

PetterLiu - 解鎖高效學習基於腦科學的個性化學習策略指南

意大利神經科學家朱利奧·迪安傑裏所著的《天才的學習方法》一書中的核心學習理論,這些理論均基於神經科學和大腦的工作原理。文本解釋了學習和記憶的四個主要步驟,從感覺記憶到永久記憶的轉化過程,強調注意力是信息進入記憶流的關鍵,並指出工作記憶容量有限是學習的瓶頸。來源批判了重複閲讀和學習風格等傳統方法效率低下,並提出了兩種高效的學習策略:間隔效應(分散練習優於集中練習)和交錯效應(交替學習不同學科

程序人生

PetterLiu - Requirements Engineering with AI for Consistency and Testing解讀

REACT(Requirements Engineering with AI for Consistency and Testing) 的目標: 利用大型語言模型(LLMs)將模糊的自然語言需求轉化為結構化形式; 自動檢測需求之間的一致性、衝突和歧義; 自動生成形式化規範和基於需求的測試用例,提高早期驗證覆蓋率; 通過減少人工解釋和手工形式化步驟,提高傳統驗證流程的可擴展性和準確性。 RE

AI

PetterLiu - 以AI驗證AI安全工程突破

以AI驗證AI:務實的進化還是危險的豪賭? 前言 《Fighting AI with AI: Leveraging Foundation Models for Assuring AI-Enabled Safety-Critical Systems》探討了在航空航天和自動駕駛等安全關鍵系統中,使用深度神經網絡(DNNs)進行軟件保證所面臨的挑戰,並提出了一個名為“以AI治AI”的解決方案框架。該

AI

PetterLiu - UModel統一模型AIOps規模化難題

UModel統一模型AIOps規模化難題 一.AIOps規模化落地面臨的長期瓶頸 1.1 引言 儘管AIOps(智能運維)作為IT運維“自動駕駛”的願景已提出多年,其規模化落地卻始終步履維艱,受困於數據與認知層面的根本性瓶頸。當前,大模型技術的突破性進展正為解決這些長期挑戰帶來前所未有的歷史機遇。我們將深入分析Aliyun雲監控2.0如何精準把握此機遇,通過架構性創新破解行業難題,為公司未來的

AI

PetterLiu - AI手機之深入淺出ADAGRPO三大核心策略

AI手機之深入淺出ADAGRPO三大核心略 為何訓練“手機AI助手”如此困難? 隨着視覺語言模型的飛速發展,能夠自主操作手機圖形用户界面(GUI)的通用智能體——也就是我們常説的“手機AI助手”——的前景變得日益廣闊。想象一下,未來你只需用一句話,AI就能幫你完成打開App、預訂酒店、設置日曆提醒等一系列複雜操作。然而,要將這個願景變為現實,研究人員在使用強化學習(RL)訓練這類智能體時,必須

AI

PetterLiu - AI編程工具策略

AI編程工具的實用選型指南 展示了不同工具在開發流程中的分工和定位: 1. Claude Code(新項目首選) 覆蓋完整開發流程:規劃→設計→任務拆解→實現 寫UI:用 Gemini 3 Pro 寫邏輯:用 Claude Sonnet 4.5 解決Bug:用 GPT 5.1 解讀:即使是"首選工具",仍會根據任務類型選擇不同模型,追求最優效

AI

PetterLiu - 開啓你的領導力發展之旅成長路線圖

開啓你的領導力發展之旅成長路線圖 重新認識領導力 在我多年的教練生涯中,我發現一個最普遍、也最具限制性的誤解,就是將“領導力”與“職位”劃上等號。真正的領導力並非靜態的權力符號,而是一個涉及領導者、下屬和特定情境三者之間複雜互動的動態過程。它的本質,是發生在人與人之間、能夠持續產生積極影響的一種能力。 深入探討了領導力這一複雜主題,將其定義為一種動態的互動過程,而非單純的職位或頭銜,涉及

軟件工程

PetterLiu - HiAgent與BiSheng對比Dify選型

HiAgent 架構與戰略價值 1. 核心定義與證據 實質:HiAgent 不是一個單純的學術概念,而是火山引擎(Volcengine)推出的企業級 AI 應用開發框架(SDK)。 架構邏輯:它採用了“大一統(Unified)”的設計思路,試圖在底層將 LangChain 的靈活性、MCP(Model Context Protocol)的連接性、以及外部工具的異構性,統一抽象

AI

PetterLiu - AI原生自動化測試介紹

AI原生自動化測試(AI-Native Automated Testing) 是一種將人工智能作為核心引擎而非輔助工具的全新測試範式。 與傳統“打補丁”式地在現有工具中加入一點AI功能不同,AI原生意味着測試工具或平台從底層架構開始就是基於AI模型(如計算機視覺、大語言模型LLM、機器學習算法)構建的。它的目標是讓測試像人類一樣“看懂”界面、“理解”業務邏輯,從而實現測試全流程的自主化。

AI

PetterLiu - 如何編寫優秀的 CLAUDE.md

注意:這篇文章同樣適用於 AGENTS.md,這是 CLAUDE.md 的開源等價物,適用於 OpenCode、Zed、Cursor 和 Codex 等代理和工具。 原則:大語言模型(絕大部分)是無狀態的 大語言模型(LLM)是無狀態的函數。它們的權重在進行推理時是固定的,因此它們不會隨時間學習。模型對你代碼庫的唯一瞭解,來源於你輸入給它的 token。 同樣,像 Claude Cod

AI

PetterLiu - LLM驅動的多智能體心靈感應協作

一.概述:從“對話”到“心靈感應”的進化 在人工智能領域,多智能體系統(Multi-Agent Systems, MAS)正迅速成為一項具備戰略性意義的技術。它推動着AI從獨立的“個體思考者”向能夠協同解決複雜問題的“智能團隊”演進。然而,當前主流的多智能體協作方式嚴重依賴於文本——如同人類通過對話交流。這種模式不僅效率低下,還常常因信息的壓縮和轉譯而導致關鍵細節的丟失。為了突破這一瓶頸,一項

AI