博客 RSS 訂閱

HuggingFace - 用開源模型強化你的 OCR 工作流

我們在這篇文章中新增了 Chandra 和 OlmOCR-2,並附上了它們在 OlmOCR 基準上的得分 🫡 摘要: 強大的視覺語言模型 (Vision-Language Models, VLMs) 的崛起,正在徹底改變文檔智能 (Document AI) 的格局。每種模型都有其獨特的優勢,因此選擇合適的模型變得棘手。相比閉源模型,開源權重的模型在成本效率和隱私保護上更具優勢。為了幫助你快

ocr , 人工智能

收藏 評論

數據小香 - cdh平台hive的show locks表的mode類型都是什麼意思

參數查詢 #死鎖檢測 show variables like '%innodb_deadlock_detect%'; #鎖超時時間 show variables like '%innodb_lock_wait_timeout%'; #立即獲得表鎖請求的次數 SHOW STATUS LIKE 'Table_locks_immediate%

大數據 , MySQL , hive , 讀鎖 , 數據庫 , 訪問表

收藏 評論

mob649e81643021 - 關掉stable後顯存也一直被佔用

在日常使用深度學習框架如TensorFlow或PyTorch時,有時會遇到“關掉stable後顯存也一直被佔用”的問題。這種情況尤其在使用GPU訓練模型時,顯存的釋放總是牽動着我們的心神。本文將詳細記錄解決這一問題的過程,從協議背景到工具鏈集成,嘗試為讀者提供一整套系統的方法。 協議背景 在深度學習任務的執行過程中,顯存的管理至關重要。顯存不僅用於存儲模型參數,也用於中間計算結果

抓包 , 字段 , 整型 , aigc

收藏 評論

mob64ca12f09e0c - Stable duffusion是哪一年出來的

Stable Diffusion是一個在深度學習和圖像生成領域引起廣泛關注的模型,首次發佈於2022年。本文將詳細記錄如何系統地解決“Stable Diffusion是哪一年出來的”這一問題,將過程梳理為幾大關鍵模塊。 背景定位 在AI生成圖像的領域,存在一個明顯的技術痛點:生成高質量圖像的模型往往計算資源消耗巨大,普通用户難以接觸到。Stable Diffusion的出現正是為

User , API , 架構設計 , aigc

收藏 評論

mob64ca12ebb57f - ollama模型使用gpu生成

在進行實體模型的開發及訓練過程中,使用 GPU 生成 Ollama 模型成為了提升性能和加速迭代的關鍵技術。由於 GPU 具備強大的並行計算能力,可以顯著提高數據處理速度,因此越來越多的開發者和研究人員開始關注其實現方式和操作流程。 引用塊:根據 NVIDIA 的定義,“GPU 是一種用於高速數據並行處理的硬件,適用於計算密集型任務,例如深度學習和圖形渲染。” 時間

並行計算 , aigc , 深度學習 , 開發者

收藏 評論

蒙奇D索隆 - 【數據結構】考研408|數據結構高分堡壘:攻克紅黑樹五大性質與適度平衡思想

(紅黑樹的定義與性質) 導讀 大家好,很高興又和大家見面啦!!! 在前面的內容中我們已經學習了兩種樹形查找結構: BST:二叉排序樹,其可以是一棵空樹,也可以是滿足以下條件的樹: 若左子樹非空,則左子樹上所有節點的值均小於根節點 若右子樹非空,則右子樹上所有節點的值均大於根節點 其左右子樹也分別是一棵二叉排序樹

yyds乾貨盤點 , 數據結構 , c++ , 後端開發 , 考研 , c , 408

收藏 評論

小童童 - Mac Airmail 5 v5.7.0.dmg 郵件客户端安裝教程 附詳細步驟圖解

​ Airmail 5 是一款在 Mac 上好用的郵件客户端,界面清爽、操作順手,支持多賬號管理,收發郵件效率很高 下載文件​ 安裝包下載:https://pan.quark.cn/s/3239bbb439c9,先把Airmail_5_for_Mac_v5.7.0.dmg這個文件下到你電腦上,存桌面或者隨便一個方便找的地方。 打開鏡像文件​ 找到剛下載的.dmg文件,雙擊它,Mac 會自動掛載成一

macos

收藏 評論

SelectDB技術團隊 - 雲上數據安全新範式:Apache Doris IAM Assume Role 解鎖無密鑰訪問 AWS S3 數據

一、傳統 AK/SK 方式訪問 AWS 資源存在的問題 密鑰管理困境: 長期暴露風險:靜態 AK/SK 需硬編碼於配置文件中,一旦因代碼泄露、誤提交或惡意竊取導致密鑰擴散,攻擊者可永久獲得等同於密鑰所有者的完整權限,引發持續性的數據泄露、資源篡改及資金損失風險; 審計盲區: 多用户/多服務共享同一組密鑰時,雲操作日誌僅記錄密鑰身份而無法關聯具體使用者,無法追溯真實責任人或業務模塊; 運維成

數據庫 , 數據安全 , dorisdb , apache

收藏 評論

mob64ca12eb7baf - Linux 部署 ollama fastgpt

在本篇博文中,我們將詳細記錄如何在 Linux 系統上部署 Ollama FastGPT,包括環境準備、分步指南、配置詳解、驗證測試、優化技巧,以及擴展應用等多個方面的內容,以確保充分的邏輯順序和內容完整性。 在開始之前,Ollama FastGPT 是一款強大的工具,專為構建自然語言處理應用而設計,適合用於快速生成和測試 GPT 模型。以下是完整的指南。 環境準備 首先,我

bash , aigc , 應用場景 , Python

收藏 評論

沉着的牙膏 - 2025年國內多層級、全景式、全鏈路的數據安全建設平台推薦

隨着《數據安全法》《個人信息保護法》《網絡數據安全管理條例》的不斷深化,數據安全已從“合規要求”正式走向“生產能力”,成為數字經濟時代的企業基礎設施。2025 年的市場呈現出明顯的結構性變化:平台化整合替代工具化割裂、AI 成為智能運營標配、全生命週期治理能力決定平台競爭力。基於行業實踐、權威報告(IDC、Gartner)及一線項目經驗,本文圍繞技術演進、廠商推薦、選型策略等維度展開系統分析。

深度學習

收藏 評論

OpenTiny社區 - 從理論到實踐:TinyEngine低代碼運行時渲染全攻略

本文由TinyEngine運行時渲染解決方案貢獻者龔昱帆同學原創。 前言 運行時渲染器用於在瀏覽器中直接渲染低代碼 Schema,提供與“出碼”並行的即時運行路徑,可在設計階段獲得接近真實的交互與數據效果。 1.啓動流程與案例講解 下面用一個非常簡單的示例頁面,串聯起從 Schema 到運行時渲染的完整流程。這個頁面包含: 一段提示文案; 一個顯示計數的按鈕; 點擊按鈕時,計數加一。 1

vue.js , 低代碼 , 前端

收藏 評論

沉着的牙膏 - 從包過濾到深度檢測:防火牆的演進之路

一、防火牆的概念防火牆(Firewall)是一種部署在內部網絡與外部網絡之間的安全防護系統,由 Check Point 創始人 Gil Shwed 於 1993 年正式提出並專利化(US5606668(A))。其核心機制是通過預設的規則對數據流進行允許或阻斷,實現訪問控制。防火牆主要在網絡通信中過濾承載內容的數據包,從而隔離內部網絡與公共網絡,確保未經授權的數據與用户無法進入企業環境,同時保障合法

深度學習

收藏 評論

雨大王 - 製造業的智能化轉型,AI工藝優化能帶來什麼改變?

在製造業的數字化轉型浪潮中,工藝環節的智能化升級成為企業突破瓶頸的關鍵路徑。傳統研發模式中,工程師往往被淹沒在繁瑣的圖紙校核、工時測算和作業指導書編制中,而真正需要創新的時間卻被大量消耗。如今,AI技術的深度整合正在重塑這一局面,尤其在一些工業互聯網企業的實踐中,AI工藝優化不再只是概念,而是實實在在的生產力提升工具。 一、工藝優化的現實挑戰 許多製造企業在新品研發過程中,面臨着市場需

人工智能

收藏 評論

無邪的課本 - RedisStudio-en-0.1.5.exe 安裝步驟 詳細教程(附安裝包)

​ RedisStudio 是一個輕量級的 Redis 可視化管理工具,主要面向 Windows 用户。 1、下載安裝包 安裝包下載:https://pan.quark.cn/s/430b00dc07e6,先把RedisStudio-en-0.1.5.exe下載到本地,建議放在桌面或 Downloads 文件夾,方便查找。 2、運行安裝程序 找到下載好的.exe文件,雙擊運行。 如果系統提示“是否

redis

收藏 評論

tonychen - TypeScript 裏 infer 常見用法

1 什麼是「infer」 1.1 概念 infer 只能在 條件類型(conditional types) 中使用,用來 在類型推斷時聲明一個待推斷的類型變量。 語法為: T extends SomeTypeinfer U ? U : never 可以這麼理解: 如果 T 能匹配 SomeType某個類型 的結構 那麼把內部類型推斷為 U 然後返回 U 1.2 特點 1.2.1 只能在

typescript , 前端

收藏 評論

tonychen - 【React源碼閲讀】React 渲染流程 —— 前置知識

系列文章: 【React 源碼閲讀】為什麼 React Hooks 不能用條件語句來執行? 【React 源碼閲讀】useCallback 【React 源碼閲讀】Scheduler 1 寫在前面 React 源碼裏的概念實在是太多了,以至於如果真的要能完全理解源碼的話,我們就不得不提前瞭解一部分知識,不然看源碼的時候完全就是抓瞎。 2 Fiber 2.1 為什麼要有 Fiber 想象一

react , 源碼分析 , 前端

收藏 評論

tonychen - LeetCode 偶爾一題 —— 301. 刪除無效的括號

原題:https://leetcode.cn/problems/remove-invalid-parentheses/descr... 1 題目 給你一個由若干括號和字母組成的字符串s,刪除最小數量的無效括號,使得輸入的字符串有效。 返回所有可能的結果。答案可以按任意順序返回。 示例 1: 輸入: s = "()())()" 輸出: ["(())()","()()()"] 示例 2: 輸入: s

leetcode , 算法 , 前端

收藏 評論

SelectDB技術團隊 - 字節跳動:Apache Doris + AI 一站式融合數據引擎的探索與實踐

隨着人工智能技術在業務中的滲透,我們逐漸意識到:AI 不僅是提升效率的工具,更是重構數據處理與消費方式的核心驅動力。在這一背景下,我們思考:能否構建一款「AI + Data」一站式融合的數據引擎? 它不僅能夠統一處理文本、音視頻等非結構化數據與傳統結構化數據,還能為算法工程師提供流暢的數據開發體驗,實現數據處理與 AI 模型無縫銜接,並能確保數據處理負載與在線服務負載完全隔離。這是 2024 年末

字節跳動 , 數據庫 , apache

收藏 評論

mob64ca12e6f33c - langchain 通義千問embedding model

在搭建和使用“langchain 通義千問embedding model”時,備份策略是確保數據安全和模型持續運行的關鍵。以下是有關如何管理備份和恢復的詳細過程記錄。 備份策略 備份是確保“langchain 通義千問embedding model”正常運行的第一步。我們需要制定適合的備份方案,結合流程圖和代碼示例,確保操作的直觀性和可操作性。 flowchart TD

雲存儲 , 數據庫 , aigc , ci

收藏 評論

harusamei - 用copilot 生成一個貪吃蛇

在VSCODE裏接入copilot 已經快一年了。 寫代碼有了這個小助手確實如有神助。 不過我用它一直都是解決程序錯誤信息,寫明確功能的小函數,或者查某個語句怎麼寫 並沒有嘗試用它生成一個完整的項目 這幾天大家都LLM的代碼生成越來越信任,紛紛寫複雜的PROMPT生成完成的項目,簡直做到了立等可用。代碼agent是真香 我也試試讓copilot給我輸出一個完整的python

人工智能

收藏 評論

Baihai_IDP - 為什麼語言模型偏愛使用破折號?反駁多種主流解釋,並提出猜想

編者按: 難道語言模型對破折號的偏愛,真的只是因為它們“喜歡”嗎? 我們今天為大家帶來的文章,作者的核心觀點是:當前主流大語言模型對破折號的偏愛,很可能源於其訓練數據中大量引入了 19 世紀末至 20 世紀初的紙質書籍 —— 這些文本本身就比當代英語更頻繁地使用破折號。 文章系統梳理並逐一反駁了多種主流解釋,然後通過分析標點使用的歷史趨勢、尼日利亞英語語料庫統計數據,以及 GPT-3.5

generative-ai , 觀點 , llm , 知識 , 人工智能

收藏 評論

KAI智習 - "靈光"上線兩週創建330萬個"閃應用", 阿里開源圖像處理新王,亞馬遜Trainium3芯片登場,AI也會"壓力崩潰"

🌟 30 秒生成 AI 應用?"靈光"引爆全民創作熱潮 螞蟻集團通用 AI 助手"靈光"上線兩週,用户已創建 330 萬個"閃應用"! 無需編程基礎,僅用自然語言對話即可打造個性化工具——"靈光"以"30 秒生應用"功能掀起全民 AI 創作風暴。數據顯示,6 天下載量突破 200 萬,遠超 ChatGPT 首周表現。 這 330 萬個閃應用並非空洞玩具,而是深深嵌入日常生活的真實場景。根據

llm , 資訊 , 人工智能

收藏 評論

mob64ca12f58d71 - langchain python token統計

在本文中,我們將深入探討如何進行“langchain python token統計”。本文的結構將包括協議背景、抓包方法、報文結構、交互過程、字段解析和工具鏈集成。整體流程將幫助你理解如何高效處理token統計,掌握對於語言鏈的操作與可視化。 langchain python token統計是在文本處理與語言模型訓練中的一個重要環節,特別是在自然語言處理(NLP)的應用場景中。

抓包 , 字段 , 工具鏈 , aigc

收藏 評論

多情的青蛙 - DeepSeek V3.2發佈:AI進入“效率革命”新時代

一邊是達到GPT-5水平的性能,一邊是大幅降低的計算開銷,DeepSeek V3.2正式版正在重新定義AI模型的性價比標準。 2025年12月1日,深度求索公司宣佈推出DeepSeek-V3.2和DeepSeek-V3.2-Speciale兩個正式版模型。與以往單純追求性能突破不同,此次發佈凸顯了AI產業的重要轉向:從“唯參數論”到“效率至上”的戰略轉型。 標準版V3.2在公開推理測試中達到GPT

觀點 , 資訊 , 人工智能

收藏 評論