合合技術團隊博客

Oct 30 2024

合合技術團隊 - 開源Embedding模型，有效提升中文語義理解與召回

此前，我們已經簡單介紹了TextIn團隊開發的開源acge_text_embedding模型及其下載和使用方法。本篇將展開討論Embedding模型中使用的技術框架。 Huggingface地址：https://huggingface.co/aspire/acge_text_embedding 模型API調用：https://www.textin.com/market/detail/ac

開源 , 文檔 , 大模型

Oct 18 2024

合合技術團隊 - 做好個人信息保護“守門員”，合合信息入選首批PIA典型案例集

信息風險是數字時代出現的新型風險之一，人工智能等技術在便利人們生活的同時，也潛藏着個人信息泄露、濫用的隱患。為了保障個人信息安全，維護公民在網絡空間的合法權益，近期，中國網絡安全產業聯盟數據安全工作委員會（簡稱“CCIA數安委”）組織編制了《個人信息保護影響評估（PIA）典型案例集》（簡稱“《PIA典型案例集》”），合合信息旗下掃描全能王APP成功入選第一批PIA典型案例集。為推進個人信息保護影響

信息安全 , 信息

Jul 25 2024

合合技術團隊 - 所見即所得，賦能RAG：PDF解析裏的段落識別與閲讀順序還原

前幾天，有一位用户使用OCR產品識別多欄論文後向我們詢問：要怎麼解決不合適的斷句、分段以及錯誤閲讀順序的問題？我們用一個相似案例為大家直觀展示這位用户遇到的情況。如圖中的多欄期刊，如果用OCR識別，或直接在一些辦公軟件對文字進行復制黏貼，我們就會得到右側的效果——按PDF排版而不是語義進行換行分段，對多欄文字直接從左向右排布，得到完全不通順的文字段落。顯然這樣的效果是無法接受的。於

ocr , 人工智能 , 文檔

Apr 16 2024

合合技術團隊 - 科技助力上億用户隱私安全保護，合合信息兩款產品再獲CCIA PIA星級標識

隨着互聯網技術的飛速發展，個人信息的收集、存儲、使用和傳輸變得日益頻繁，其泄露和濫用的風險也隨之增加，個人信息保護已成為社會共同關注的熱點議題。近期，“中國網絡安全產業聯盟（CCIA）數據安全工作委員會”“數據安全共同體計劃（DSC）”等組織共同發起了第二批評估工作——“個人信息保護影響評估專題工作（簡稱‘PIA專題工作’）”，合合信息旗下的名片全能王、啓信寶等產品獲得了“PIA二星級標識”。 2

信息安全 , 隱私 , 科技

Feb 21 2024

合合技術團隊 - 【論文解讀】transformer小目標檢測綜述

一、簡要介紹 Transformer在計算機視覺領域迅速普及，特別是在目標識別和檢測領域。在檢查最先進的目標檢測方法的結果時，我們注意到，在幾乎每個視頻或圖像數據集中，transformer始終優於完善的基於cnn的檢測器。雖然基於transformer的方法仍然處於小目標檢測（SOD）技術的前沿，但本文旨在探索如此廣泛的網絡所提供的性能效益，並確定其SOD優勢的潛在原因。小目標由於其低可見性，

人工智能 , transform , 深度學習

Nov 10 2023

合合技術團隊 - CCIA數安委等組織發佈PIA星級標識名單，合合信息再次通過數據安全領域權威評估

近期，“中國網絡安全產業聯盟（CCIA）數據安全工作委員會”、“數據安全共同體計劃（DSC）”等組織共同發起“個人信息保護影響評估專題工作（簡稱“PIA專題工作”）”，併為入圍企業頒發了對應的等級標識。合合信息、快手、小天才、螞蟻集團等11家企業首批獲得“PIA二星級標識”。 2021年，《中華人民共和國個人信息保護法》（簡稱《個人信息保護法》）正式實施，其中第55條、第56條構建了我國個人信息保

信息安全 , 人工智能

Sep 06 2023

合合技術團隊 - 2023年中國信通院鑄基計劃“文本圖像篡改檢測系統技術規範”研討會成功召開

2023年中國信通院鑄基計劃“文本圖像篡改檢測系統技術規範”（簡稱“規範”）研討會於2023年8月16日在中國信息通信研究院成功召開，來自中國信息通信研究院、上海合合信息科技股份有限公司（簡稱“合合信息”）、華南理工大學、中國科學技術大學、深圳大學、中國圖象圖形學會等企業、高校及研究機構的代表線下線上共同參與了本次會議。中國信通院泰爾終端實驗室王景堯博士到會致詞王景堯表示，建立標準和評

文本處理 , 規範化 , 人工智能 , 技術 , 圖像

Aug 10 2023

合合技術團隊 - 以商業大數據技術助力數據合規流通體系建立，合合信息參編《數據經紀從業人員評價規範》團標

經國務院批准，由北京市人民政府、國家發展和改革委員會、工業和信息化部、商務部、國家互聯網信息辦公室、中國科學技術協會共同主辦的2023全球數字經濟大會於近期隆重召開。由數交數據經紀（深圳）有限公司為主要發起單位，合合信息等企業參編的《數據經紀從業人員評價規範》團體標準在聯合國科學和技術促進發展委員會、北京市通信管理局、世界銀行(The World Bank)等機構領導以及國內外數據要素領域知名專家

大數據 , 規範化 , 人工智能

Aug 04 2023

合合技術團隊 - 合合信息通過ISO/IEC國際標準雙認證，為全球用户提供高合規標準AI服務

互聯網、AI等技術的全球普及為人們提供便捷服務的同時，也帶來了信息安全領域的諸多挑戰。保護用户隱私及數據安全，是科技企業規範、健康發展的重心。近期，上海合合信息科技股份有限公司（簡稱“合合信息”）順利通過國際權威認證機構DNV審核，獲得ISO/IEC 27001信息安全管理體系及ISO/IEC 27701隱私信息管理體系國際認證證書。 DNV是全球知名的獨立的第三方認證機構，擁有150多年風險管理

信息安全 , 數據安全 , 人工智能

Aug 25 2022

合合技術團隊 - 【技術白皮書】第五章：信息抽取技術的未來發展趨勢和麪臨的挑戰

5.信息抽取技術的未來發展趨勢和麪臨的挑戰 5.1 NER技術的未來發展趨勢和麪臨的挑戰論文《 Survey on Deep Learning for Named Entity Recognition》總結了NER技術面臨的挑戰和未來發展方向。隨着建模語言的進步和實際應用的需求，NER會得到研究人員更多的關注。另一方面，NER通常被視為下游應用程序的預處理組件。這意味着特定的NER任務

事件 , 自然語言處理 , 人工智能 , 深度學習