tag 自然語言處理

標籤
貢獻44
97
07:11 PM · Oct 26 ,2025

@自然語言處理 / 博客 RSS 訂閱

OpenBayes - OpenBayes 一週速覽丨李沐團隊開源語音大模型Higgs Audio V2,擴展多語言對話等功能

公共資源速遞This Weekly Snapshots ! 5 個公共數據集: B3DB 生物基準數據集 PolyMath 數學推理數據集 SongEval 音樂評估數據集 MegaScience 科學推理數據集 WebInstruct-verified 多領域推理數據集 4 個公共模型: gpt-oss-20b gpt-oss-120b Qwen3-30B-A3B-Inst

llm , 圖像識別 , 數學 , 自然語言處理 , chatgpt

收藏 評論

OpenBayes - 跨語言智能再升級!Multi-LMentry 打造多語理解新基準;Nemotron-Personas-USA重塑虛擬人畫像生成

公共資源速遞 5 個公共數據集: Life Style Data 生活方式數據集 Multi-LMentry 多語言基礎任務評測基準 Nemotron Personas USA 美國人物畫像數據集 The Diabetes Health Indicators 糖尿病健康指標數據集 Global Earthquake-Tsunami Risk 全球地震海嘯風險評估數據集 訪問官網立即使

機器學習 , 圖像識別 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

漫步雲端的豬 - 阿里內部架構解密:網絡+分佈式+RPC+消息中間件+微服務 - 小遷來了的個人空間 -

本文詳細解析阿里Qwen3大模型的架構與實現。首先介紹Qwen3在代碼、數學等領域的出色性能,然後深入解析其模型結構,包括輸入處理、Transformer塊、GQA注意力機制、前饋網絡和RMSNorm歸一化等。文章提供了完整的PyTorch代碼實現,從Qwen3Model到各個組件,幫助讀者理解大模型的工作原理和實現細節。 引言 2025年4月29號,阿里千問

神經網絡 , 開發語言 , 自然語言處理 , JAVA , Css , 前端開發 , HTML , Python

收藏 評論

archangle - 自然語言處理涉及的技術棧 自然語言處理最新技術

伴隨着近幾年的機器學習的熱潮,自然語言處理成為了目前炙手可熱的研究方向,同時也是 Google、Microsoft、Facebook、Baidu、Alibaba 等各大公司投入鉅額資金和高端人力努力爭奪的下一個互聯網流量入口(智能助手、智能音箱等)。 近日,雷鋒網研習社公開課邀請了孔曉泉來介紹自然語言處理技術的一些基本知識、行業的發展現狀和基於深度

中心詞 , 自然語言處理涉及的技術棧 , NLP , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

mob64ca12d52440 - stable diffusion什麼時間開始

關於“stable diffusion什麼時間開始”這一問題,很多人都在嘗試瞭解其歷史背景及技術發展的脈絡。Stable Diffusion 是一種生成模型,屬於深度學習領域的前沿技術,其發展歷程和演變是值得梳理的。在這篇文章中,我將以專業的視角探索 stable diffusion 的起點,回顧相關技術背景,並介紹其交互方式、性能優化和擴展閲讀的資料。 協議背景 在技術發展的過

抓包 , 生成模型 , 自然語言處理 , aigc

收藏 評論

OpenBayes - SAM3 重塑場景分割邊界;X-Dance 解鎖圖像驅動舞姿生成新難度

公共資源速遞 5 個公共數據集: 3EED 語言驅動三維理解數據集 X-Dance 圖像驅動舞蹈動作數據集 PhysToolBench 物理工具任務數據集 OST-Bench 時空場景理解基準數據集 Astrophysical Objects Image 天體物理物體圖像數據集 4 個公共教程: SAM3:視覺分割模型 FLUX.2-dev:圖像生成與編輯模型 Superto

機器學習 , 資訊 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

OpenBayes - Open-AutoGLM 實現手機端自主操作;PhysDrive 數據集採集真實駕駛生理信號

公共資源速遞 5 個公共數據集: FirstAidQA 急救知識問答數據集 PhysDrive 駕駛員生理測試數據集 PolypSense3D 息肉尺寸感知數據集 Envision 多階段事件視覺生成數據集 Care-PD 帕金森三維步態評估數據集 8 個公共模型: SAM 3 Z-Image-Turbo Ovis-Image-7B Ministral-3-14B Lon

機器學習 , pytorch , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

MIAOYUN - MIAOYUN | 每週AI新鮮事兒(11.14-11.21)

本週全球AI領域創新密集,各大廠商競相推出新一代大模型與智能工具。基礎模型性能顯著提升,Google的Gemini 3、OpenAI的GPT-5.1、xAI的Grok 4.1等模型在多模態、代碼及情感理解方面取得突破。AI智能體與工具生態持續繁榮,微軟的Copilot、Google的SIMA 2、AI編程IDE Antigravity及螞蟻集團「靈光」等應用正重塑工作與創作方式。與此同時,開源操作

機器學習 , 資訊 , 圖像識別 , 自然語言處理 , 人工智能

收藏 評論

中昊芯英 - DeepSeek-V3.2的DSA稀疏注意力技術:在TPU平台上的效能革命與適配實踐

9 月 29 日,DeepSeek 最新發布的DeepSeek-V3.2-Exp模型引入了自主研發的DeepSeek Sparse Attention(DSA)稀疏注意力機制,在幾乎不影響模型性能的前提下,實現了長文本訓練和推理效率的大幅提升。本文旨在深入解析 DSA 的技術原理,並重點探討中昊芯英「剎那®」TPU 平台如何憑藉其片上緩存與高度並行矩陣計算單元,在 Lightning Indexe

機器學習 , tensorflow , 神經網絡 , 自然語言處理 , 人工智能

收藏 評論

雲端創新夢想家 - 機器學習算法--python實現應用機器學習於情感分析-訓練文檔分類_糯米君

章節導語 “圖像是靜止的像素矩陣,而語言是流動的河流。你無法只看‘銀行’這兩個字就明白它的意思,因為在‘河邊的銀行’和‘存款的銀行’中,它的含義截然不同。” 歡迎來到人工智能最迷人也最困難的領域——自然語言處理(Natural Language Processing, NLP)。 在上一章,我們處理的是圖像,它們是固定大小的網格(比如 )。但文

數據 , 自然語言處理 , 人工智能 , 全連接 , Css , 前端開發 , HTML , Python

收藏 評論

上海拔俗網絡 - AI多智能體輿情繫統:數字世界的“千里眼”與“先知團”

打開手機是鋪天蓋地的信息,刷完社交平台又要翻新聞評論——傳統輿情分析就像在信息海洋裏“撈針”:要麼漏了關鍵聲音,要麼被海量無效信息淹沒,還總跟不上輿論發酵速度。而AI多智能體輿情分析系統,靠“分工協作”的技術邏輯,讓輿情分析變得精準、高效,還能提前預警風險。 其實“多智能體”一點不復雜,核心就是讓多個“AI小專家”各司其職、協同幹活,而非一個AI單打獨鬥。就像一支專業團隊,有采集員、

輿情分析 , ip , NLP , 自然語言處理 , 人工智能

收藏 評論

MIAOYUN - MIAOYUN | 每週AI新鮮事兒(12.12-12.19)

本週AI領域迎來密集更新,大模型方面,Runway、OpenAI、通義百聆、NVIDIA、阿里雲、字節跳動、小米、騰訊、Meta、Google等先後推出或開源視頻生成、世界模型、語音、音視頻創作等相關模型,涵蓋畫質提升、多模態支持、高效推理等優勢,部分模型引發爭議;Agent方面,Google、商湯科技等發佈研究、辦公、營銷等場景智能體;工具方面,騰訊元寶、OpenAI也更新工具功能,一起來回顧本

機器學習 , 資訊 , 數據挖掘 , 自然語言處理 , 人工智能

收藏 評論

haixiudeshanghen_cc1dwg - 首發嚐鮮!Gitee AI 上線階躍星辰 StepVideo-T2V 文生視頻模型在線體驗

2月18日,頭部大模型創業公司階躍星辰宣佈開源了文生視頻模型Step-Video-T2V,Gitee AI 第一時間上線了該模型的在線體驗。 Serverless API 頁面現也已新增視頻生成分類及Step-Video-T2V模型入口: 輸入 Prompt 後稍等片刻即可獲得生成的視頻,視頻支持下載至本地: 話不多説,直接看看效果: Prompt:幾隻巨大的長毛猛獁象穿過一

自然語言處理 , 人工智能 , gitee , serverless , 視頻處理

收藏 評論

HelpLook - 以騰訊為例,手把手教你搭建產品幫助中心

一個精心設計的產品幫助中心對於提高用户滿意度和體驗至關重要。騰訊,作為全球領先的互聯網企業,通過其多樣化的產品線(包括微信、QQ、騰訊遊戲、騰訊視頻等)吸引了億萬用户。下面將以騰訊為例,向您展示如何搭建一個高效的產品幫助中心。 首先我們來參考一下騰訊幫助中心是什麼樣的。騰訊的幫助中心巧妙地將其旗下眾多產品進行了分類管理,方便用户迅速找到所需幫助。 以騰訊的電腦遊戲“

騰訊 , 自然語言處理 , 搜索引擎優化 , 人工智能 , 知識庫

收藏 評論

小白獅ww - 中科院團隊發佈首個國產類腦脈衝大模型 SpikingBrain-1.0,推理效率達百倍提速

當全球 AI 競賽仍在為更大的算力和數據量內卷時,中國科學院自動化研究所突破性地提出了「內生複雜性」的解題思路。其最新發布的「瞬悉1.0(SpikingBrain-1.0)」類腦脈衝大模型,借鑑大腦神經元的工作機制,成功繞過了傳統 Transformer 架構的能效瓶頸,為長序列處理這一業界難題提供了全新的解決方案。 瞬悉1.0 推理時具備常數級複雜度,處理百萬級長度序列時比傳統模型快 26

圖像識別 , 自然語言處理 , 教程 , 人工智能 , 深度學習

收藏 評論

mob649e815f0f18 - ollama 使用GPu加速

在近年來,深度學習的進步促使了許多模型和服務的廣泛應用,其中 Ollama 作為一種高效的 NLP 工具,在各種業務場景中表現卓越。然而,如何使用 GPU 加速 Ollama 以提高其性能和響應速度,成為了技術團隊關注的熱點問題。 timeline title 業務增長里程碑 2000 : 初創階段 2005 : 第一個產品上線 2010 : 用户數量

架構設計 , 自然語言處理 , aigc , Json

收藏 評論

Lab4AI - 【Github熱門項目】DeepSeek-OCR項目上線即突破7k+星!突破10倍無損壓縮,重新定義文本-視覺信息處理

當“8000 行代碼手搓 ChatGPT”的熱度還未褪去,大模型領域又迎來新驚喜——DeepSeek 團隊於 10 月 20 日開源的DeepSeek-OCR,以“上下文光學壓縮”為核心突破,重新定義了 OCR(光學字符識別)的效率邊界。這款僅 30 億參數量的模型,不僅能以 100 個視覺 token 超越傳統模型 256 個 token 的性能,更在單張 A100-40G 顯卡上實現每日 20

機器學習 , 圖像識別 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

mob64ca13fba42b - 看MindSpore加持下,如何「煉出」首個千億參數中文預訓練語言模型? - 華為雲開發者社區的個人空間 -

AsyPPO: 輕量級mini-critics如何提升大語言模型推理能力 大型語言模型強化學習訓練面臨計算瓶頸,傳統對稱actor-critic架構導致critic模型參數量巨大,訓練成本高昂。本文介紹的Asymmetric Proximal Policy Optimization (AsyPPO)算法通過創新的非對稱架構設計,使用輕量級mini-

llm , 語言模型 , 自然語言處理 , 後端開發 , 人工智能 , Agentic , Python

收藏 評論

Aloudata大應科技 - 數據語義編織:企業級 Data Agent 的必備基建

2025 年,每家企業都想擁有自己的 Data Agent,但 90% 的項目可能不是死在 Demo 階段就是建成後無人問津。為什麼?因為我們試圖用概率性的 LLM 去直接挑戰確定性的數據分析,對結果期待太高,而對過程準備不足。在自然語言問數的背後,用户真正的訴求是讓大模型代替過去“提需求 - 開發 - 測試 - 交付 - 人工分析 - 撰寫報告”的全流程,讓任意取數和分析需求都能得到敏捷和精準的

nosql , 自然語言處理 , 數據庫 , chatgpt , 人工智能

收藏 評論

容智信息 - 容智信息加入大模型產業聯盟,Hyper Agent推動企業級智能體規模化落地

容智信息是一家專注於企業級智能體落地的智能自動化廠商,核心產品Hyper Agent超級智能體已在央國企、金融、製造等行業實現規模化應用。 近日,在360集團2025智能體生態論壇上,容智信息憑藉在企業級智能體平台建設與真實業務落地方面的持續投入,正式榮任大模型產業聯盟會員單位。這一認證不僅代表行業對容智信息技術實力的認可,也標誌着其在企業級智能體賽道的行業影響力進一步提升。

360 , 自然語言處理 , 人工智能 , 深度學習 , 大模型

收藏 評論

容智信息 - 容智Report Agent智能體驅動財務自動化,從核算邁向價值創造

在金融行業數字化轉型深化的背景下,財務數據的實時性與洞察力直接關乎企業決策質量與風險應對能力。然而,對於許多機構而言,由於歷史系統架構原因,核心財務數據往往分散在風險、交易、結算等多個獨立業務系統中,形成難以跨越的“數據孤島”。這使得財務部門大量精力耗費在基礎的數據收集與核對上,難以高效生成深度洞察,從而影響了其為管理層提供戰略支撐的效能。某中型期貨公司通過引入容智Report Agent

觀點 , 機器人 , 自然語言處理 , 知識 , 人工智能

收藏 評論

小白獅ww - 32B 參數還能本地跑?Flux.2-dev 這次是真的把「大模型」玩明白了

過去的開源圖像模型有點像一櫃子分科工具:這一個負責生成,那一個負責編輯,想讓角色不崩還得再上個微調模型,流程又長又碎。而Flux.2-dev的出現就像突然給你塞了一把真正能幹活的 AI 瑞士軍刀——一句話能畫圖,一張圖能修改,幾張參考圖還能自動融合成統一風格,整套流程一個模型就走通了,再也不用東拼西湊。 更讓人驚訝的是,它明明有 32B 參數,卻因為量化和推理優化做得非常激進,居然能在 RT

算法 , 自然語言處理 , 教程 , 人工智能 , 深度學習

收藏 評論

上海拔俗網絡 - AI考評系統:告別“憑感覺”,數據讓評價精準又高效

提到“考評”,不管是學生考試、職場考核,大家都怕“不公平”“不精準”——主觀題憑老師/考官心情打分,客觀題批改費時間,考完只給個分數卻不知道問題在哪。而AI考評系統,就是用技術打破這些“老毛病”,讓考評從“靠經驗”變成“靠數據”,既省時間又保公平,還能真正幫大家找對改進方向。 傳統考評的核心痛點就三個:慢、偏、淺。批改幾十份卷子要熬夜,這是“慢”;作文、面試打分有主觀偏差,這是“偏”

圖像識別 , 數據 , NLP , 自然語言處理 , 人工智能

收藏 評論

OpenBayes - OpenBayes 一週速覽丨MiniCPM-V4.0圖像理解能力突破;MathCaptcha10K助力訓練驗證碼識別模型

公共資源速遞 5 個公共數據集: HelpSteer3 人類偏好數據集 A-WetDri 惡劣天氣駕駛數據集 NonverbalTTS 非語言音頻生成數據集 STRIDE-QA-Mini 自動駕駛問答數據集 MathCaptcha10k 算數驗證碼圖像數據集 5 個公共教程: dots.ocr:多語言文檔解析模型 MiniCPM-V4.0:極致高效的端側大模型 llama.c

llm , 數學 , 自然語言處理 , 解碼 , 視頻處理

收藏 評論