博客 / 列表

合合技術團隊 - 啓信寶短劇行業洞察:AI賦能、國企入局,短劇開啓“精品化”之路

2025年,短劇行業迎來多項突破。以《盛夏芬德拉》《十八歲太奶奶駕到》為首的8部短劇,播放量衝破30億大關,比肩頭部視頻平台“S+”級長劇的播放水平;“大製作”短劇也不斷涌現,主演團隊多為一線明星演員,投資金額突破千萬甚至上億。短劇行業,正邁入高質量發展新階段。 近日,合合信息旗下啓信寶發佈《2025短劇行業觀察報告》,圍繞企業佈局、“AI+短劇”領域的資本動向、地域協同等維度,揭示短劇“精品化之

行業

合合技術團隊 - 合合信息旗下啓信寶獲首批授權,公開展示上海市數據產品知識產權登記信息

值上海數據產品知識產權登記試點一週年之際,上海市知識產權局加大數據產品知識產權信息的公開力度,推動數據產品知識產權保護與社會化應用。近日,合合信息旗下啓信寶正式接入由上海市知識產權局官方授權的“數據產品知識產權”數據,成為首批獲權對外公開展示數據產品知識產權信息的企業平台。此舉獲央視新聞等權威媒體關注報道。 圖説:央視新聞報道“啓信寶首批接入上海市數據產品知識產權信息”

產品

合合技術團隊 - 論文解讀 - 潛在思維鏈推理的全面綜述

一、簡要介紹 大語言模型(LLMs)在複雜推理任務中,通過思路鏈(CoT)提示取得了顯著的性能。然而,傳統的CoT依賴於用自然語言明確表達的推理步驟,這不僅降低了效率,還限制了其在抽象推理中的應用。為了解決這一問題,研究者們對潛在CoT推理產生了濃厚的興趣,這種推理方式在潛在空間中進行。通過將推理與語言分離,潛在推理不僅提供了更豐富的認知表示,還實現了更靈活、更快的推理過程。研究者們在這一

大數據 , 人工智能 , 深度學習

合合技術團隊 - 複雜公式與表格識別率突破99%!TextIn xParse如何助力數傳集團實現教育數字化飛躍?

武漢理工數字傳播工程有限公司(以下簡稱“數傳集團”)是國內教育出版數字化領域的重要服務商,為K12、高等教育及職業培訓提供智能題庫、數字教材、在線測評等教學解決方案,業務覆蓋全國數百所學校與教育機構。 在教育出版行業加速向AI化、智能化轉型的今天,傳統紙質教材、習題的數字化已成為許多企業佈局在線教育的關鍵一環。然而,複雜的公式、表格、手寫內容識別一直是OCR技術難以跨越的“高牆”,制約着題庫質量與

大數據 , 算法 , 人工智能

合合技術團隊 - 啓信寶發佈《全國產業集羣大全》哈爾濱篇:2300家企業織就冰雪產業網

寒潮襲來,國內冰雪旅遊市場正悄然升温,“北上追雪”成為消費新熱點。隨着第27屆哈爾濱冰雪大世界啓動冰建工作,這座北方“冰城”正式進入冰雪時間。 作為我國萬億冰雪產業的關鍵一環,哈爾濱的冰雪經濟發展備受關注。近期,啓信寶發佈《全國產業集羣大全》哈爾濱篇,系統梳理當地冰雪產業的發展現狀與集羣特徵。報告提到,哈爾濱已構建起較為完整的冰雪產業鏈,尤其在裝備製造領域形成龍頭引領效應,並依託全域資源協同,展現

大數據 , 算法 , 人工智能

合合技術團隊 - 論文解讀-對話中的多模態情感識別綜述

一、簡要介紹 儘管基於文本的情感識別方法已經取得了顯著的成就,但現實世界中的對話系統往往需要比單一模態所能提供的更加細膩的情感理解。因此,多模態情感識別(MERC)成為了提升人機交互自然性和情感理解的關鍵方向。其目標是通過整合文本、語音和視覺信號等不同模態的信息,準確地識別情感。本綜述系統地概述了MERC,包括其動機、核心任務、代表性方法和評估策略。論文進一步探討了最近的趨勢,指出了關鍵挑戰,並

大數據 , 算法 , 人工智能

合合技術團隊 - 啓信寶《2025 全國採購地圖》:藏在縣城的“隱形冠軍”,撐起你的購物車

第17個“雙十一”剛剛收官,越來越多消費者留意到,平台上“產地直髮”“工廠優選”類商品明顯增多。隨手買的辣條、高性價比的培育鑽石、風靡全球的漢服......這些商品的源頭並非熟悉的北上廣深,而是一個個“低調”的中國縣城。這些縣域產業憑藉高效供應鏈與成本優勢,正悄然成為大眾日常消費的重要支撐。 近日,啓信寶發佈《2025全國採購地圖》(下稱“採購地圖”),系統梳理了多個熱門消費品的產業佈局與發展趨勢

大數據 , 算法 , 人工智能

合合技術團隊 - 論文解讀 - 大型多模態模型中現實世界個性化基準測試

​一、簡要介紹 快速發展的大型多模態模型(LMMs)領域催生了多種具有顯著能力的模型。然而,現有的評估標準未能全面、客觀且準確地評估這些模型是否能滿足現實世界中人類的多樣化需求。為了解決這一問題,論文提出了多維度洞察(MDI)基準,該基準包含超過500張圖像,涵蓋了人類生活的六個常見場景。值得注意的是,MDI基準相比現有評估方法具有兩大優勢:(1)每張圖像都附有兩類問題:簡單問題用於評估模型對圖

大數據 , 算法 , 人工智能

合合技術團隊 - 讓大模型一鍵“讀懂”全球文檔,合合信息攜手火山引擎打造AI智能體新範式

當前,大模型的發展正加速進入“強應用”階段。中國信通院7月數據顯示,國內已發佈大模型超過1500個。如何打通諸多大模型落地的“最後一公里”,讓技術從“實驗室”走向“生產線”,成為全行業共同探索的課題。 近日,由合合信息TextIn打造,火山引擎提供平台支撐的“大模型加速器”升級版正式發佈。 雙方將共同打造文本智能領域的AI創新應用,為企業與開發者提供一站式AI工程化能力,通過補全“從模型到應用”的

大數據 , 算法 , 人工智能

合合技術團隊 - 啓信寶獲得法博會“行業洞見獎”,相關服務即將登陸“深律通”

為構建多元聯動、創新開放的法律服務體系,近日,以“以法律創新護航科技與產業創新”為主題的2025深圳法律服務博覽會(下稱“法博會”)順利舉辦,吸引國內外權威機構和行業專家參與。合合信息旗下啓信寶憑藉其在法律科技領域的創新應用,於法律科技產品大賽中斬獲“行業洞見獎”。該獎項由深圳市律師協會組織評選,體現了法律行業對啓信寶產品創新性、實用性與可推廣性的權威認可。後續啓信寶相關功能將正式接入深圳市律師協

大數據 , 算法 , 人工智能

合合技術團隊 - 【論文解讀】用於代碼處理的語言模型綜述

1.簡要介紹 在這項工作中,論文系統地回顧了在代碼處理方面的最新進展,包括50個+模型,30個+評估任務和500個相關工作。論文將代碼處理模型分解為由GPT家族表示的通用語言模型和專門預訓練的代碼模型,通常具有定製的目標。論文討論了這些模型之間的關係和差異,並強調了代碼建模從統計模型和rnn到預訓練的transformer和LLM的歷史轉變,這與NLP所採取的過程完全相同。還討論了特定於代碼的特

code , llm , 人工智能 , 模型

合合技術團隊 - 啓信寶電影行業洞察:廣東蟬聯“雙冠王”,票房與企業數量全國第一

國家電影局數據顯示,2024年全國觀影總人次為10.1億,同比下滑23.1%。與此同時,啓信寶統計數據顯示,電影相關企業數量在五年內翻了三番,年均增速超25%。電影行業呈現“冰火兩重天”的態勢。 “消費端收縮、供給端活躍”的現象,勾勒出中國電影產業在深度調整期的真實圖景。近日,啓信寶發佈的《2025電影行業觀察報告》指出,行業的增長動力已從市場擴容轉向結構升級,資源向頭部企業、核心地域與AI技術高

大數據 , 算法 , 人工智能

合合技術團隊 - 多模態文本智能大模型前沿技術與應用論壇在上海召開,合合信息推出多模態文本智能技術方案

隨着人工智能深入各行各業,多模態大模型正在成為AI發展的重要方向之一。近期,由中國圖象圖形學學會、中國人工智能學會、中國計算機學會和中國自動化學會聯合主辦,上海交通大學承辦的第八屆中國模式識別與計算機視覺學術會議(PRCV 2025)順利舉行。大會期間,“多模態文本智能大模型前沿技術與應用”論壇(簡稱“論壇”)獲得了廣泛關注。論壇彙集了來自華南理工大學、哈爾濱工業大學、南開大學、華中科技大學、小紅

大數據 , 算法 , 人工智能

合合技術團隊 - 合合信息與上海交通大學開展課題合作研究,共探智能文檔圖像處理前沿技術

計算機視覺技術作為AI的“眼睛”,是當前人工智能領域的重要研究方向。近期,計算機視覺領域三大頂級學術會議之一的國際計算機視覺大會(ICCV 2025)順利舉行。會議期間,合合信息聯合上海交通大學等機構主辦了首屆VQualA視覺質量評估研討會,同時,為了推動建立智能文檔圖像處理技術的標準化評估體系,研討會設置了文檔圖像質量評估競賽,競賽吸引了來自全球知名高校和研究機構的上百名選手參與。 文檔圖像質量

大數據 , 算法 , 人工智能

合合技術團隊 - 解析穩定率達99.99%!合合信息“大模型加速器2.0”助力AI打破“幻覺”

隨着大模型在社會應用中逐漸普及,人們在享受便利的同時,也面臨着“AI 幻覺”產生的風險。訓練數據是影響大模型“認知能力”的關鍵要素,近期,上海合合信息科技股份有限公司(簡稱“合合信息”)TextIn“大模型加速器 2.0”版本正式上線,基於領先的智能文檔處理技術,對複雜文檔的版式、佈局和元素進行精準解析及結構化處理,從數據源頭降低大模型“幻覺”風險,讓大模型在與人類的溝通中“更靠譜”。

表格 , 大數據 , 算法 , 人工智能 , 圖表

合合技術團隊 - 用户的聲音 | 文檔結構化信息提取方案測評:LLM、開源模型部署與雲端API,誰是合適選擇?

文檔預處理之文本化 近日,我們收到來自專業用户的使用心得,通過測試淺析結構化信息提取技術,輔助完成技術選型。結構化信息提取的重要性數據作為大模型時代的核心生產資料,其結構化處理能力直接影響AI系統的實用價值。 結構化信息提取的重要性 數據作為大模型時代的核心生產資料,其結構化處理能力直接影響AI系統的實用價值。儘管知識圖譜、RAG等技術依賴海量文本資源,但現實中的歷史檔案、法律文書等重要數據多以掃

llm , 大數據 , 人工智能 , 文檔

合合技術團隊 - 文檔圖像矯正任務的前沿進展:引入Transformer框架、極座標的思路

在《文檔數字化採集與智能處理:圖像彎曲矯正技術概述》一文中,我們介紹了文檔圖像矯正技術的發展沿革與代表性方案。隨着文檔智能處理的需求逐步升級,文檔圖像去畸變技術也在不斷探索新的可能性。 今天,我們將討論近年來文檔圖像矯正任務的前沿進展,分享一些我們正在關注的方向,歡迎與我們共同探討、交流進步。 Transformer 架構下的文檔矯正探索 代表性工作 DocTr: Document Image T

圖像識別 , 圖像處理 , 人工智能 , transformer

合合技術團隊 - 文檔解析技術發展回顧與路徑思考

隨着全球數字化進程的加速,非結構化數據量呈現爆炸式增長,從紙質文檔到電子文件的轉變不僅意味着信息存儲方式的革新,更標誌着舊數據被賦予了新的生命力。文檔智能技術的發展使得大量以傳統形式保存的信息資源能夠“活化”再利用,這些技術將圖像、手寫筆記等非結構化數據轉化為計算機可處理和理解的結構化格式,從而極大地拓展了數據的應用場景。得益於深度學習算法的進步,文檔解析技術在文檔數字化、票據自動化處理、筆跡錄入

ocr , aigc , 人工智能 , 文檔

合合技術團隊 - 合合信息智能圖像處理技術,讓你的設備更智能

最近和一位朋友聊天,聽到一些關於打印機的吐槽。 從20年開始,部分或者全部遠程辦公的企業漸漸多起來,wfh的打工人也在家添置了簡易的必要辦公設備,比如打印機。 在家用,自然沒有買辦公室和打印店那種有掃描台的“大傢伙”。 但問題來了,手機拍攝的照片沒有打印機掃描那麼精準,出來的效果也是“原拍原打”,看着既不舒服,也顯得不正式。 比如,像下面這樣一張照片,拍的時候有輕微搖晃,焦

圖像識別 , 圖像處理 , 人工智能

合合技術團隊 - 用AI“讀懂”專業文檔資料,合合信息助力出海企業規避侵權“陷阱”

近年來,在“走出去”政策支持下,企業出海持續升温。根據中國上市公司協會數據,2024上半年我國上市公司實現海外業務收入3.83萬億元,同比增長12.84%。隨着出海規模不斷擴大,企業跨國間的交流也變得日益頻繁。為了應對提交出口產品註冊資料、製作海外項目競標標書等場景,合合信息智能文檔處理技術助力企業解析、翻譯電子文檔,推進出海項目進程。 中企出海,應對合規審查是第一關。企業需要處理的文檔不僅

ai開發 , 人工智能 , 文檔

合合技術團隊 - TextIn文檔解析表格處理模型優化,顯著提升表格解析性能

近期,TextIn通用文檔解析最新推出表格處理優化版本。 此前版本中,表格解析處理針對有線表格與無線表格預先分類,並基於框線進行模型預測。在運行過程中,我們發現,分類錯誤問題對錶格解析準確率有負面影響。 本次優化主要改善了表格識別效果,以統一方案替代有線表格與無線表格分類處理方法,減少了級聯損失,大幅度提升表格全對率。 通用文檔解析鏈接:https://www.textin.com/market/

表格 , 人工智能 , 文檔 , 圖像

合合技術團隊 - 一鍵擦除手寫筆跡,試試這款省時省力的學習利器

凡是給小朋友輔導過功課,或是自己有過考證經驗的朋友,想必都對成沓成堆的書本、習題冊、試卷、資料不太陌生。 儘管電子化辦公已逐漸走向成熟,“筆頭”和“案卷”仍然是大家成長過程中必經的一環。與之相伴的,是塗改得花花綠綠、覆滿字跡的紙頁。 當作業和試卷批改完,需要整理錯題、二次利用試卷的時候,問題來了:充滿塗改痕跡的紙張應如何處理?手抄或手打錯題?那未免太過“費人”。 如今,科技相關的

手寫識別 , 圖像處理 , 文字處理 , 人工智能

合合技術團隊 - 合合信息線下技術交流日報名啓動!超多福利等你來領!

快到年終啦,合合信息打算和上海的新老朋友進行一場零距離聚會!我們在上海1927魯迅與內山紀念書局精心策劃了一場技術交流見面會,活動現場可以體驗好玩的黑科技,在思想的交流與碰撞中結交新朋友,探索技術產品熱門議題。參會還可帶走敲多豐富的伴手禮~ 詳細活動安排請戳下圖,點擊合合信息KOL線下活動報名 即可報名,報名成功後我們會有專人聯繫。歡迎對合合信息感興趣的開發者朋友們報名積極參與,期待在現場與您相見

圖像識別 , 科技 , 技術分享 , 活動 , 文檔

合合技術團隊 - 文檔數字化採集與智能處理:圖像彎曲矯正技術概述

由於電子文檔更容易存檔、編輯、簽名和共享的特點,文檔電子化的趨勢逐年顯著,而隨着高質量攝像頭在手機等移動設備上的普及,利用移動設備對文檔進行數字化採集已經非常普遍。 移動設備讓每一位使用者能夠便捷採集文檔圖像,不過,這也使原始文檔圖像的情況變得複雜多變:頁面彎曲、陰影遮擋、摩爾紋、圖片模糊、字跡不清晰等問題都是文本圖像處理中常見的干擾狀況,阻礙了文檔的智能化處理,導致OCR識別、信息提取、版

圖像識別 , 圖像處理 , 算法 , 文檔