@llm

動態 列表
@gqkmiss

Browser-use:基於 Python 的智能瀏覽器自動化 AI 工具調研與實戰

Browser-use:基於 Python 的智能瀏覽器自動化 AI 工具調研與實戰 一、概述 Browser-use 是一個旨在將 AI “智能體”(Agents)與真實瀏覽器進行交互的 Python 庫,可以輕鬆實現瀏覽器自動化。在配合 LLM(如 GPT 系列)使用時,瀏覽器-use 能夠讓你的智能體發起對網頁的訪問、操作頁面元素、收集信息、執行腳本等,從而擴展 AI 應用的落地場景。

gqkmiss 頭像

@gqkmiss

昵稱 月恆

@candy_68fb0dfb0afd0

Langflow:面向 AI Agent、API 與 LLM 的拖拽式流程構建工具

我最近一直在探索一個叫Langflow的工具。 如果你曾經試着把LLMs、APIs和各種工具連起來,你就會知道那種挫敗感——太亂了。 一大堆樣板代碼,好多問題像“為什麼這個不工作”,通常花太多時間在設置上。 Langflow試圖讓這一切變得更容易。 它基本上就是一個AI工作流的視覺構建器。 拖動東西,連接塊,突然你就有一個agent,能執行任務比如抓取URL或解決數學問題。 當你準備好了,

@deephub

LLM安全新威脅:為什麼幾百個毒樣本就能破壞整個模型

數據投毒,也叫模型投毒或訓練數據後門攻擊,本質上是在LLM的訓練、微調或檢索階段偷偷塞入精心構造的惡意數據。一旦模型遇到特定的觸發詞,就會表現出各種異常行為——輸出亂碼、泄露訓練數據、甚至直接繞過安全限制。 這跟提示注入完全是兩碼事。提示注入發生在推理階段,屬於臨時性攻擊;而投毒直接改寫了模型的權重,把惡意行為永久刻進了模型裏。 幾種主流的攻擊方式 預訓練投毒最隱蔽,攻擊者把惡意文檔混進海量的預訓

deephub 頭像

@deephub

昵稱 deephub

@actionopensource

2025 年 9 月《大模型 SQL 能力排行榜》發佈,新增 Kimi K2 測評

一、本月導覽與核心看點 2025 年 9 月,SCALE 評測基準持續聚焦 AI 在 SQL 領域的應用前沿。本月,榜單新增了 Moonshot AI(月之暗面) 發佈的最新模型 —— Kimi-K2-Instruct-0905,還在平台功能上進行了升級,旨在為開發者、研究者和企業決策者提供更精細、更具洞察力的技術參考。 本期核心看點: 新增模型評測:新增的 Kimi K2 模型在「SQL 理

actionopensource 頭像

@actionopensource

昵稱 愛可生開源社區