博客 / 列表

合合技術團隊 - 開源Embedding模型,有效提升中文語義理解與召回

此前,我們已經簡單介紹了TextIn團隊開發的開源acge_text_embedding模型及其下載和使用方法。本篇將展開討論Embedding模型中使用的技術框架。 Huggingface地址:https://huggingface.co/aspire/acge_text_embedding 模型API調用:https://www.textin.com/market/detail/ac

開源 , 文檔 , 大模型

合合技術團隊 - 做好個人信息保護“守門員”,合合信息入選首批PIA典型案例集

信息風險是數字時代出現的新型風險之一,人工智能等技術在便利人們生活的同時,也潛藏着個人信息泄露、濫用的隱患。為了保障個人信息安全,維護公民在網絡空間的合法權益,近期,中國網絡安全產業聯盟數據安全工作委員會(簡稱“CCIA數安委”)組織編制了《個人信息保護影響評估(PIA)典型案例集》(簡稱“《PIA典型案例集》”),合合信息旗下掃描全能王APP成功入選第一批PIA典型案例集。為推進個人信息保護影響

信息安全 , 信息

合合技術團隊 - 所見即所得,賦能RAG:PDF解析裏的段落識別與閲讀順序還原

前幾天,有一位用户使用OCR產品識別多欄論文後向我們詢問:要怎麼解決不合適的斷句、分段以及錯誤閲讀順序的問題? 我們用一個相似案例為大家直觀展示這位用户遇到的情況。 如圖中的多欄期刊,如果用OCR識別,或直接在一些辦公軟件對文字進行復制黏貼,我們就會得到右側的效果——按PDF排版而不是語義進行換行分段,對多欄文字直接從左向右排布,得到完全不通順的文字段落。 顯然這樣的效果是無法接受的。 於

ocr , 人工智能 , 文檔

合合技術團隊 - 科技助力上億用户隱私安全保護,合合信息兩款產品再獲CCIA PIA星級標識

隨着互聯網技術的飛速發展,個人信息的收集、存儲、使用和傳輸變得日益頻繁,其泄露和濫用的風險也隨之增加,個人信息保護已成為社會共同關注的熱點議題。近期,“中國網絡安全產業聯盟(CCIA)數據安全工作委員會”“數據安全共同體計劃(DSC)”等組織共同發起了第二批評估工作——“個人信息保護影響評估專題工作(簡稱‘PIA專題工作’)”,合合信息旗下的名片全能王、啓信寶等產品獲得了“PIA二星級標識”。 2

信息安全 , 隱私 , 科技

合合技術團隊 - 【論文解讀】transformer小目標檢測綜述

一、簡要介紹 Transformer在計算機視覺領域迅速普及,特別是在目標識別和檢測領域。在檢查最先進的目標檢測方法的結果時,我們注意到,在幾乎每個視頻或圖像數據集中,transformer始終優於完善的基於cnn的檢測器。雖然基於transformer的方法仍然處於小目標檢測(SOD)技術的前沿,但本文旨在探索如此廣泛的網絡所提供的性能效益,並確定其SOD優勢的潛在原因。小目標由於其低可見性,

人工智能 , transform , 深度學習

合合技術團隊 - CCIA數安委等組織發佈PIA星級標識名單,合合信息再次通過數據安全領域權威評估

近期,“中國網絡安全產業聯盟(CCIA)數據安全工作委員會”、“數據安全共同體計劃(DSC)”等組織共同發起“個人信息保護影響評估專題工作(簡稱“PIA專題工作”)”,併為入圍企業頒發了對應的等級標識。合合信息、快手、小天才、螞蟻集團等11家企業首批獲得“PIA二星級標識”。 2021年,《中華人民共和國個人信息保護法》(簡稱《個人信息保護法》)正式實施,其中第55條、第56條構建了我國個人信息保

信息安全 , 人工智能

合合技術團隊 - 2023年中國信通院鑄基計劃“文本圖像篡改檢測系統技術規範”研討會成功召開

2023年中國信通院鑄基計劃“文本圖像篡改檢測系統技術規範”(簡稱“規範”)研討會於2023年8月16日在中國信息通信研究院成功召開,來自中國信息通信研究院、上海合合信息科技股份有限公司(簡稱“合合信息”)、華南理工大學、中國科學技術大學、深圳大學、中國圖象圖形學會等企業、高校及研究機構的代表線下線上共同參與了本次會議。 中國信通院泰爾終端實驗室王景堯博士到會致詞 王景堯表示,建立標準和評

文本處理 , 規範化 , 人工智能 , 技術 , 圖像

合合技術團隊 - 以商業大數據技術助力數據合規流通體系建立,合合信息參編《數據經紀從業人員評價規範》團標

經國務院批准,由北京市人民政府、國家發展和改革委員會、工業和信息化部、商務部、國家互聯網信息辦公室、中國科學技術協會共同主辦的2023全球數字經濟大會於近期隆重召開。由數交數據經紀(深圳)有限公司為主要發起單位,合合信息等企業參編的《數據經紀從業人員評價規範》團體標準在聯合國科學和技術促進發展委員會、北京市通信管理局、世界銀行(The World Bank)等機構領導以及國內外數據要素領域知名專家

大數據 , 規範化 , 人工智能

合合技術團隊 - 合合信息通過ISO/IEC國際標準雙認證,為全球用户提供高合規標準AI服務

互聯網、AI等技術的全球普及為人們提供便捷服務的同時,也帶來了信息安全領域的諸多挑戰。保護用户隱私及數據安全,是科技企業規範、健康發展的重心。近期,上海合合信息科技股份有限公司(簡稱“合合信息”)順利通過國際權威認證機構DNV審核,獲得ISO/IEC 27001信息安全管理體系及ISO/IEC 27701隱私信息管理體系國際認證證書。 DNV是全球知名的獨立的第三方認證機構,擁有150多年風險管理

信息安全 , 數據安全 , 人工智能

合合技術團隊 - 【技術白皮書】第五章:信息抽取技術的未來發展趨勢和麪臨的挑戰

5.信息抽取技術的未來發展趨勢和麪臨的挑戰 5.1 NER技術的未來發展趨勢和麪臨的挑戰 論文《 Survey on Deep Learning for Named Entity Recognition》總結了NER技術面臨的挑戰和未來發展方向。隨着建模語言的進步和實際應用的需求,NER會得到研究人員更多的關注。另一方面,NER通常被視為下游應用程序的預處理組件。這意味着特定的NER任務

事件 , 自然語言處理 , 人工智能 , 深度學習