tag 文檔

標籤
貢獻17
101
07:48 AM · Nov 04 ,2025

@文檔 / 博客 RSS 訂閱

合合技術團隊 - 合合信息線下技術交流日報名啓動!超多福利等你來領!

快到年終啦,合合信息打算和上海的新老朋友進行一場零距離聚會!我們在上海1927魯迅與內山紀念書局精心策劃了一場技術交流見面會,活動現場可以體驗好玩的黑科技,在思想的交流與碰撞中結交新朋友,探索技術產品熱門議題。參會還可帶走敲多豐富的伴手禮~ 詳細活動安排請戳下圖,點擊合合信息KOL線下活動報名 即可報名,報名成功後我們會有專人聯繫。歡迎對合合信息感興趣的開發者朋友們報名積極參與,期待在現場與您相見

圖像識別 , 科技 , 技術分享 , 活動 , 文檔

收藏 評論

合合技術團隊 - 所見即所得,賦能RAG:PDF解析裏的段落識別與閲讀順序還原

前幾天,有一位用户使用OCR產品識別多欄論文後向我們詢問:要怎麼解決不合適的斷句、分段以及錯誤閲讀順序的問題? 我們用一個相似案例為大家直觀展示這位用户遇到的情況。 如圖中的多欄期刊,如果用OCR識別,或直接在一些辦公軟件對文字進行復制黏貼,我們就會得到右側的效果——按PDF排版而不是語義進行換行分段,對多欄文字直接從左向右排布,得到完全不通順的文字段落。 顯然這樣的效果是無法接受的。 於

ocr , 人工智能 , 文檔

收藏 評論

英勇無比的羽毛球 - 智能文檔自動化: Zoho Projects和Zoho Writer的集成指南

大家好,自定義函數是一種可用於自動化流程的軟件代碼,它允許您自動發送通知、調用Webhook或在觸發工作流規則後立即執行邏輯。因此自定義函數操作可以實現自動化複雜任務和計算。 在本文中,我將介紹一個具體的用例,演示Zoho Projects與Zoho Writer之間的集成。 產品演示 用例: 將Zoho Projects中的數據合併到Zoho Writer中的預定義模板中。 自動生成可填寫

函數 , 集成 , 文檔

收藏 評論

沈唁 - 初夏上新!Docsify 迎來 v5.0.0-rc.1 重磅發佈

在中國傳統曆法中,五月初一象徵着初夏的啓程,也寓意着新的成長與蜕變。今天,我們很高興地宣佈 —— Docsify v5.0.0-rc.1 版本發佈! 在延續零構建、即寫即部署理念的同時,Docsify 迎來了全新的樣式設計、更友好的可訪問性以及更穩健的插件機制。 可以通過訪問 http://preview.docsifyjs.org/ 進行體驗。 那麼,這個版本有哪些值得關注的亮點?我們為你準備了

docsify , Css , 文檔 , Javascript , Markdown

收藏 評論

大丸子 - 使用Python在Word文檔中添加、替換和刪除圖片

通過Python編程實現Word文檔中圖片的動態管理,可精準實現圖片的插入定位、條件化替換及冗餘元素刪除,尤其適用於需要定期生成標準化Word文檔。這種自動化方案不僅顯著降低人工操作導致的格式錯位、版本混亂等風險,還能通過API接口與數據庫、圖像處理系統無縫集成,為構建端到端的智能文檔生成體系奠定基礎。本文將介紹如何使用Python在Word文檔中添加、替換和刪除圖片。 用Python插入圖片

word , 圖片 , 圖片處理 , 文檔 , Python

收藏 評論

墨鬆 - VitePress、Hexo、Docusaurus,哪個最適合你的靜態網站?

在選擇合適的靜態網站工具時,Hexo、VitePress、Docusaurus 是三個備受關注的選項,那麼到底哪一個框架更適合你呢? 本文從使用場景、社區生態、功能、性能、擴展性這五個方面,幫你全方位分析各個框架的優缺點,以便為你的技術選型提供參考。 1、應用場景 Hexo, 官方定位自己是 "快速、簡潔且高效的博客框架" , 但是它同樣適合構建簡單的文檔網站,它具有簡單易用的特點,適合那些

vite , 網站 , 文檔 , vitepress , 前端

收藏 評論

商湯萬象開發者 - 技術拆解 | 表格解析(上):企業數字化與AI應用流程中的重要基礎支撐

上一期我們向大家介紹了商湯自研的智能文檔解析 UniParse,歡迎大家試用!本期開始,我們將對 UniParse 中涉及的技術點進行逐一拆解,希望能幫助大家更好地理解和使用我們的產品~ 本期和下期的分享主題都將圍繞“表格解析”展開,技術細節,一探究竟! 什麼是表格解析 表格解析是將非結構化的表格圖像(如掃描文檔、照片或PDF中的表格)轉為機器可讀、可理解的結構化數據的過程。具體而言,它旨在將圖像

表格 , 人工智能 , 檢索系統 , 文檔

收藏 評論

合合技術團隊 - TextIn文檔解析表格處理模型優化,顯著提升表格解析性能

近期,TextIn通用文檔解析最新推出表格處理優化版本。 此前版本中,表格解析處理針對有線表格與無線表格預先分類,並基於框線進行模型預測。在運行過程中,我們發現,分類錯誤問題對錶格解析準確率有負面影響。 本次優化主要改善了表格識別效果,以統一方案替代有線表格與無線表格分類處理方法,減少了級聯損失,大幅度提升表格全對率。 通用文檔解析鏈接:https://www.textin.com/market/

表格 , 人工智能 , 文檔 , 圖像

收藏 評論

程序員小鋒 - 基於oracle linux的 DBI/DBD 標準化安裝文檔(二)

一、安裝DBI DBI(Database Interface)是perl連接數據庫的接口。其是perl連接數據庫的最優 方法,他支持包括Orcale,Sybase,mysql,db2等絕大多數的數據庫,下面將簡要 介紹其安裝方法。 1.1解壓 tar -zxvf DBI-1.616_901.tar.gz 1.2安裝依賴 yum install perl-ExtUtil

文檔

收藏 評論

商湯萬象開發者 - 技術拆解 | 表格解析(下):從數據準備到模型訓練的全流程實戰詳解

在當今數據驅動的時代,表格數據作為信息承載的重要形式,廣泛存在於各類商業場景中。從財務報表到保險理賠單,從銷售記錄到客户信息,表格無處不在。表格不僅僅是文本的堆砌,它包含着複雜的空間邏輯關係。如何讓機器真正理解表格數據?這是金融、財務、保險等領域智能化轉型的關鍵挑戰。 本文將深入探討表格解析的數據準備和模型訓練全流程,為讀者呈現一套完整可行的解決方案。 數據準備:質量決定上限 數據準備是整個表格解

llm , 文檔

收藏 評論

合合技術團隊 - 用户的聲音 | 文檔結構化信息提取方案測評:LLM、開源模型部署與雲端API,誰是合適選擇?

文檔預處理之文本化 近日,我們收到來自專業用户的使用心得,通過測試淺析結構化信息提取技術,輔助完成技術選型。結構化信息提取的重要性數據作為大模型時代的核心生產資料,其結構化處理能力直接影響AI系統的實用價值。 結構化信息提取的重要性 數據作為大模型時代的核心生產資料,其結構化處理能力直接影響AI系統的實用價值。儘管知識圖譜、RAG等技術依賴海量文本資源,但現實中的歷史檔案、法律文書等重要數據多以掃

llm , 大數據 , 人工智能 , 文檔

收藏 評論

程序員小鋒 - 基於oracle linux的 DBI/DBD 標準化安裝文檔(二)

一、安裝DBI DBI(Database Interface)是perl連接數據庫的接口。其是perl連接數據庫的最優 方法,他支持包括Orcale,Sybase,mysql,db2等絕大多數的數據庫,下面將簡要 介紹其安裝方法。 1.1解壓 tar -zxvf DBI-1.616_901.tar.gz 1.2安裝依賴 yum install perl-ExtUtil

文檔

收藏 評論

大丸子 - 用Python添加、讀取和刪除Word文檔屬性

在Python中處理Word文檔時,對文檔屬性進行操作是一項重要的任務。文檔屬性主要分為內置屬性(如標題、作者等)和自定義屬性(用户根據自身需求定義的屬性)。合理地管理這些屬性,能夠提升文檔管理效率、優化信息檢索功能,並確保文檔數據的準確性與安全性。本文將介紹如何使用Python實現對Word文檔屬性的添加、讀取和刪除操作,包括內置文檔屬性和自定義文檔屬性。 用Python添加文檔屬性到Wor

word , 文檔管理工具 , 屬性 , 文檔 , Python

收藏 評論

Eolink - Eolink Apikit 快速發起 API 測試,一鍵生成測試數據

我們在測試接口時,通常需要先創建 API 文檔,再根據 API 文檔生成測試用例。未創建該接口文檔,僅臨時調試接口,Eolink Apikit 支持創建 API 快速測試頁面,輸入接口相關的信息即可進行快速測試。 Eolink Apikit 支持操作數據庫,API 測試時,可以一鍵生成測試請求數據。這可以減少數據輸入步驟,提高調試接口效率。 發起快速測試 功能入口:API 管理應用 - 選

mock , 數據 , API , 測試 , 文檔

收藏 評論

蛋先生DX - RAG 切片利器 LumberChunker 是如何智能地把文檔切割成 LLM 愛吃的塊

丹尼爾:蛋兄,問個問題唄。RAG 裏的文檔應該怎麼切割比較好呢?按固定的字符數或詞數?按句?按段落?加個重疊窗口?感覺這些都太簡單粗暴,容易把相關的內容給拆散了 蛋先生:恩,你説得對。這些方法一刀切,確實沒辦法考慮上下文的語義關係。現在大模型越來越強大,完全可以藉助它們的能力,比如 LumberChunker 丹尼爾:LumberChunker? 蛋先生:這個名字起得非常有意思。"Lumber"

llm , ai開發 , 語義化 , 人工智能 , 文檔

收藏 評論

謙虛好學的山寨機_bS4sGd - linux的 DBI/DBD 標準化安裝文檔A

一、安裝DBI DBI(Database Interface)是perl連接數據庫的接口。其是perl連接數據庫的最優 方法,他支持包括Orcale,Sybase,mysql,db2等絕大多數的數據庫,下面將簡要 介紹其安裝方法。 1.1解壓 tar -zxvf DBI-1.616_901.tar.gz 1.2安裝依賴 yum install perl-ExtUtil

文檔

收藏 評論

合合技術團隊 - 文檔數字化採集與智能處理:圖像彎曲矯正技術概述

由於電子文檔更容易存檔、編輯、簽名和共享的特點,文檔電子化的趨勢逐年顯著,而隨着高質量攝像頭在手機等移動設備上的普及,利用移動設備對文檔進行數字化採集已經非常普遍。 移動設備讓每一位使用者能夠便捷採集文檔圖像,不過,這也使原始文檔圖像的情況變得複雜多變:頁面彎曲、陰影遮擋、摩爾紋、圖片模糊、字跡不清晰等問題都是文本圖像處理中常見的干擾狀況,阻礙了文檔的智能化處理,導致OCR識別、信息提取、版

圖像識別 , 圖像處理 , 算法 , 文檔

收藏 評論

落花流水人家 - docx格式的文件直接修改為doc格式 使用java解析失敗

在以前的項目裏為了寫作方便,總是以word文檔的方式提供架構和設計文檔,帶來的好處僅僅是自己寫作起來較為方便,但帶來的麻煩卻有很多,比如: 更新文檔較為麻煩。 他人瀏覽較為麻煩,特別當需要從docx轉換到doc的時候。 很難形成與其他文檔的聯繫。 難以協同合作 以上的缺點導致很不好的後果:設計有了更新

語言 , 測試 , 後端開發 , 開發人員 , JAVA , 文檔 , 寫文檔

收藏 評論

sanri1993 - 自託管的高效團隊協作平台:zyplayer-doc

一、zyplayer-doc是什麼 zyplayer-doc是一款適合企業和個人使用的WIKI知識庫管理工具,專為私有化部署而設計,最大程度上保證企業或個人的數據安全,支持以內網的方式來部署使用。 支持將編寫的文檔一鍵發佈為企業產品的幫助文檔,支持以單文檔、目錄、空間、文集的方式開放至互聯網,可用於獨立的幫助中心站點,嵌入自有產品、APP、小程序或微信公眾號菜單中用作幫助文檔,或者用於展廳、大屏中

文檔

收藏 評論

陌上 - Salesforce原生PDF編輯的重要性:效率、合規性與用户體驗

PDF文件在企業運營中扮演着核心角色,尤其是在需要正式文檔、合同和報告的場景中。對於依賴Salesforce作為其核心客户關係管理(CRM)平台的企業來説,處理PDF文檔是日常工作的重要組成部分。然而,Salesforce原生的PDF編輯能力缺失,給企業帶來了效率低下、合規風險和用户體驗不佳等一系列挑戰。 本文將探討Salesforce中原生PDF編輯為何至關重要,並重點闡述它在效率提升、確保合規

pdf , salesforce , 文檔 , salesforce-lightning

收藏 評論

謙虛好學的山寨機_bS4sGd - 基於oracle linux的 DBI/DBD 標準化安裝文檔.

一、安裝DBI DBI(Database Interface)是perl連接數據庫的接口。其是perl連接數據庫的最優 方法,他支持包括Orcale,Sybase,mysql,db2等絕大多數的數據庫,下面將簡要 介紹其安裝方法。 1.1解壓 tar -zxvf DBI-1.616_901.tar.gz 1.2安裝依賴 yum install perl-ExtUtil

文檔

收藏 評論

xinxingli - 樹莓派中文文檔網站上線了

樹莓派作為一個單片機電腦,從第一款發佈到現在的樹莓派4,已經走過了8年的時間。8年裏,樹莓派不斷更新升級,逐漸得到了全世界的認可。現在可以在互聯網上搜到很多的樹莓派文章,但都比較散,沒有系統。官方的文檔又是英文,並且訪問速度比較慢。 為了方便學習樹莓派,更加快捷的上手樹莓派,查找樹莓派的資料,科技愛好者博客基於 Vuepress 開發了樹莓派中文文檔,系統的對樹莓派進行介紹。 名稱:樹莓派中文文檔

raspberry-pi , 開源硬件 , vuepress , 文檔

收藏 評論

合合技術團隊 - 用AI“讀懂”專業文檔資料,合合信息助力出海企業規避侵權“陷阱”

近年來,在“走出去”政策支持下,企業出海持續升温。根據中國上市公司協會數據,2024上半年我國上市公司實現海外業務收入3.83萬億元,同比增長12.84%。隨着出海規模不斷擴大,企業跨國間的交流也變得日益頻繁。為了應對提交出口產品註冊資料、製作海外項目競標標書等場景,合合信息智能文檔處理技術助力企業解析、翻譯電子文檔,推進出海項目進程。 中企出海,應對合規審查是第一關。企業需要處理的文檔不僅

ai開發 , 人工智能 , 文檔

收藏 評論

海的盡頭 - APICloud 實現文檔下載和預覽功能

文檔下載是很多app,尤其是企業應用中常用的功能。使用APICloud開發app時,可以使用api.download方法實現下載;預覽文檔可以使用superFile 模塊。superFile 模塊封裝了基於騰訊瀏覽服務TBS,使用X5Webkit內核,實現文件的展示功能,支持多種文件格式(PDF、Word、Execl、TXT、PPT)。 在項目中添加superFile模塊: 然後編譯自定義loa

下載 , app開發 , 文檔 , apicloud

收藏 評論