文章目錄
- 一、大模型(Language Models)
- 二、智能體(Agent)
- 三、模型上下文協議, MCP (Model Context Protocol)
一、大模型(Language Models)
大模型(Language Models)是指具備了強大的語言理解、生成和推理能力的深度學習模型。 比如GPT-4、Claude、DeepSeek-V3.1-Terminus、Qwen-3-Maxd、Doubao-Seed-1.6等等
大部分模型基於Transformer架構,
大模型可以按照不同的標準分類,比如按照參數量、技術架構、功能特性分類等。
我們常説的多模態模型,是指同一個模型能同時處理文本、圖像、音頻、視頻等數據。(可能是以後發展的主流),
我們常説的通用大模型(General-Purpose Large Models),是指具備了強大的語言理解、生成和推理能力的模型,能夠處理各種語言任務,主要專注於文本模態的處理。
我們常説的LLM(Large Language Model),是指專門設計用於理解和生成人類語言。
大模型可以用來內容生成(文本創作 :文章、故事、詩歌)、代碼編寫(程序開發、調試、優化)、翻譯服務(多語言實時翻譯)、知識推理(問答系統、數據分析)
二、智能體(Agent)
智能體(Agent),代表了人工智能從"被動響應"到"主動行動"的重大進化。能夠自主決策,理解任務意圖,擁有長期記憶,存儲交互歷史和用户偏好,可獨立完成全流程任務,無需持續干預。
智能體很重要的特點是:隨用户使用時間增長,服務越精準貼合用户需求,更加智能。
智能體通常採用"大模型 + 插件" 架構。大模型負責理解、推理和規劃任務,記憶系統存儲對話歷史和上下文信息,工具集負責API接口和應用程序的調用能力,執行引擎來協調各模塊工作。
三、模型上下文協議, MCP (Model Context Protocol)
MCP是統一模型(LM)與外部數據源和工具之間的通信協議,定義了一套規範輸入,輸出參數。工具集在負責API接口和應用程序的調用時,就需要遵循MCP協議。
協議細節:MCP (Model Context Protocol) 模型上下文協議