tag 結構化

標籤
貢獻45
99
04:46 PM · Nov 15 ,2025

@結構化 / 博客 RSS 訂閱

雲端小夢 - 數據倉庫(02)數倉、大數據與傳統數據庫的區別 -

隨着信息技術的飛速發展,企業對數據的依賴日益加深。為了高效地存儲、管理和分析海量數據,數據倉庫(Data Warehouse)應運而生。然而,隨着數據量呈指數級增長以及業務需求的多樣化,傳統的數據倉庫架構逐漸暴露出其侷限性,從而催生了基於大數據技術的新一代數據倉庫——“大數據數倉”。本文將從多個維度對比傳統數倉與大數據數倉的主要區別,幫助讀者更好地理解兩

大數據 , 數據 , 數據倉庫 , 結構化

收藏 評論

咚咚王哲 - 人工智能之數據分析 numpy:第十二章 數據持久化

人工智能之數據分析 numpy 第十二章 數據持久化 前言 NumPy 提供了多種數據持久化(Persistence) 方式,用於高效地保存和加載數組數據。根據數據規模、結構複雜度、跨平台需求等不同場景,可選擇不同的方法。 本文系統講解: 基礎二進制/文本保存(.npy, .npz, .txt) 結構化數組(Structured Arrays) 與

數組 , yyds乾貨盤點 , 後端開發 , 結構化 , Python

收藏 評論

DeepSeaAI - 智能體開發框架選型決策樹V2

四大框架的技術架構和典型應用案例,通過結構化拆解讓選型邏輯更貼合實際開發場景,同時優化決策樹的實用性和參考價值。 智能體開發框架選型決策樹 各框架核心信息補充説明 LlamaIndex 架構亮點:核心優勢在索引優化,提供Llama Parse組件支持複雜文檔解析,Workflows引擎可編排多步驟異步流程,索引層支持增量更新和量化壓縮,兼顧精

應用層 , 技術架構 , pytorch , 人工智能 , 結構化

收藏 評論

老常GEO優化實戰 - GEO 優化核心密碼:GeneralSearch"邊想邊搜" 智能交互原理全拆解

本文聚焦 GEO(生成式引擎優化)與 GeneralSearch “邊想邊搜” 智能交互的核心邏輯,拆解二者協同的優化密碼。GeneralSearch 基於 RAG 架構,通過意圖理解、智能搜索、信息融合、答案生成四層模型,構建 “思考 - 搜索 - 再推理” 的閉環交互。GEO 優化區別於傳統 SEO,核心是通過人性化內容、交叉驗證、語義結構化、權威信號建設等策略,讓內容成為

seo , 搜索 , NLP , GEO優化 , 人工智能 , 結構化

收藏 評論

u_13778063 - 為什麼 RAG 落地難?解析數據處理 “三重困境”,事件驅動架構如何破局?

作者:稚柳 前言 當企業想用大模型和內部非公開信息打造智能問答系統時,RAG(Retrieval-Augmented Generation,檢索增強生成)已成為必備技術。然而,在實際落地中,構建 RAG 應用的數據準備過程繁瑣複雜且充滿挑戰,讓很多企業和開發者望而卻步。本文將介紹構建 RAG 的最佳實踐:通過阿里雲事件總線 EventBridge 提供的多源 RAG

EventBridge , 數據 , 雲計算 , 阿里雲 , 雲服務 , 數據處理 , 結構化

收藏 評論

代碼天地 - 別隻盯着模型!AI Agent的成功,是架構、協議、模型、應用的四位一體

如果把過去幾年的大語言模型(LLM)浪潮比作“電力被髮明”的階段,那麼 AI Agent 更像是“電氣化工廠”的開始:電不再只是點燈,而是接入生產線、帶動機器、形成一整套自動化體系。 從 AGI 分級的角度看,AI Agent 通常被視為 L3 級智能體: 不再只是“回答問題的工具”,而是具備明確目標、可持續運行、能主動決策和執行任務的智能實體。 技

服務器 , 數據 , 分佈式 , 模態 , 結構化

收藏 評論

代碼天地 - 如何用Dify搭建企業級私有知識庫?

今天用Dify來搭建一個企業級的知識庫 目錄 為避免浪費時間。提供文章導讀,為讀者看清楚今天聊的話題能解決哪些問題。 知識庫 什麼是知識庫? 很多人以為知識庫就是一個放文檔的地方,類似Wiki。其實不只這麼簡單。 知識庫在AI工程化語境下,是一個結構化、可檢索、可推理的數據系統,主要功能: 存儲企業內部的文檔、代碼、對話

服務器 , 數據 , 上傳 , 分佈式 , 結構化

收藏 評論

mb61c46a7ab1eee - 【論文閲讀】Sparks of Science - 指南

目錄 Abstract Introduction Related Work Methodology and the Bit-Flip-Spark+Chain-of-Reasoning Format Preprocessing and Dataset Construction Fine-tuning and Inference Pipeline

數據集 , redis , 語言模型 , 數據庫 , 結構化

收藏 評論

mob64ca14154457 - 乾貨分享 | 深度學習零基礎進階第二彈 -

Abstract 隱式神經表示 (INR) 已成為使用神經網絡將離散信號編碼為連續、可微函數的強大工具。然而,不幸的是,這些模型通常依賴單體架構來表示高維信息,隨着維度的增長,導致計算成本過高。我們提出了 F-INR,這是一個框架,它依據函數張量分解重新制定 INR 學習,將高維任務分解為輕量級的、特定於軸的子網絡。每個子網絡學習一個低維資料組件(例如,空間或時間)。然後,

數據 , 神經網絡 , 後端開發 , 結構化 , Python

收藏 評論

陳老老老闆 - 2026年10大網絡爬蟲工具對比評測:從開源到企業級,選型指南全解析

導語 在數據驅動決策的商業環境中,網絡爬蟲作為數據採集的核心工具,其選型直接影響數據獲取的效率、質量與成本。當前市場上的爬蟲工具涵蓋開源框架、輕量級組合、瀏覽器自動化工具、雲端SaaS平台及企業級API服務等多種類型,技術特性與適用場景差異顯著。本文選取10款2026年主流網絡爬蟲工具,從部署難度、技術靈活性、反爬能力、數據質量、成本模型等八大核心維度進行深度對比,為技術團

yyds乾貨盤點 , ip , API , aigc , Copilot , 結構化

收藏 評論

mb6923acc0735dc - 鴻蒙AI實戰之模型優化:端側模型壓縮、量化與加速技術詳解

引言:讓大模型在端側設備"輕裝上陣" 隨着AI大模型參數規模從億級邁向萬億級,如何在資源受限的端側設備上高效部署這些"龐然大物"成為行業核心挑戰。HarmonyOS通過創新的輕量化技術棧,實現了大模型從"龐大笨重"到"小巧精悍"的蜕變。本文將深入解析端側模型壓縮的三大核心技術:剪枝、量化和知識蒸餾,以及它們在HarmonyOS生態中的實戰應用,幫助開發者打造真正"小而強大"

移動開發 , 壓縮率 , 權重 , Android , 結構化

收藏 評論

合合信息解決方案 - 如何減少大模型基於文檔回答時的幻覺問題?

12 月 10 日,智譜 AI 正式開源最新多模態大模型 GLM-4.6V,其在圖像理解、圖表解析、細粒度視覺描述等領域的表現全面超越 GPT-4V、Qwen-VL 等主流模型,為基於文檔的智能問答、分析生成提供了更強大的技術支撐。 多模態大模型在處理含複雜表格、手寫批註、多元素融合的文檔時,長期存在因信息提取不精準、語義理解不充分而產生 “幻覺”—— 輸出與文

機器學習 , 數據 , 人工智能 , 文檔解析 , 結構化

收藏 評論

冰淇淋紅茶Q - 文檔解析與問答實戰——三步搭建基於TextIn與Coze的智能文檔Agent方案

一、引言 1.1 複雜文檔的感知瓶頸 當前,以大語言模型(LLM)為核心的智能體(Agent)技術,正快速融入法律文書問答、合同條款比對、技術標準解讀等企業核心業務流程中。基於自主任務理解、步驟規劃與工具調用能力,智能體能夠可靠執行教育科研輔助、法律信息提取、合同自動比對、標準結構化解析等一系列複雜業務操作,有效提升效率與準確性。 然而,當Agent真正

人工智能 , 深度學習 , 文檔解析 , 結構化 , Markdown

收藏 評論

沃觀態勢感知 - 技術選型指南:評估海外輿情監測工具 API 與集成能力的關鍵

在企業數字化與全球化並行的時代,海外輿情監測工具不再是單一的“信息抓取工具”,而是企業數據中台、品牌管理系統、客服系統、市場營銷平台之間的重要樞紐。因此,評估海外輿情監測工具的 API 能力、數據集成架構與可擴展性,已成為技術選型中最關鍵的指標之一。 很多企業在使用海外輿情監測工具時遇到的痛點並非數據不足,而是“數據無法進系統”“監測結果無法自動流

數據 , API , 人工智能 , 數據分析 , 結構化

收藏 評論

合合信息解決方案 - 合合信息亮相澳門HKBN JOS Solution Day,分享企業知識庫建設新路徑

近日,由香港寬頻集團成員HKBN JOS主辦的“HKBN JOS Solution Day 2025”在澳門隆重舉行。本次大會以“智創先行、成果共創”為主題,匯聚了全球科技領域的領軍企業、行業專家及資深從業者,共同探討人工智能技術在企業數字化轉型中的創新應用與實踐成果。 大會上,合合信息智能解決方案事業部總經理李明發表了《如何利用AI為企業建立內部知識庫》主題演講,

機器學習 , 數據 , 人工智能 , 解決方案 , 結構化

收藏 評論

Python數據分析 - 智源研究院發佈我國首個兒童人工智能發展原則《面向兒童的人工智能北京共識》

AI元人文構想:邁向人類與AI的意義共治——從“價值對齊”到“文明共築”的範式革命深度解析 筆者:岐金蘭 摘要:本文系統解析了岐金蘭“AI元人文構想”如何推動一場從“價值對齊”到“文明共築”的範式革命。傳統價值對齊範式因靜態、一元的價值預設陷入哲學謬誤,而“意義行為原生論”通過將價值錨定於具體行為實踐,實現了從“價值對齊”到“價值共生”的根本轉向。論文深入闡述了“星圖

遞歸 , 後端開發 , harmonyos , 原語 , 結構化

收藏 評論

上海拔俗網絡 - AI 病史採集系統:讓看病 “第一步” 更省心

去醫院看病,不少人都有過這樣的尷尬:面對醫生 “以前有沒有慢性病?”“吃沒吃過特殊藥物?” 的提問,要麼緊張得記不清細節,要麼絮絮叨叨説不到重點。這不僅讓醫生花大量時間梳理信息,還可能因為漏説關鍵病史影響診斷。而 AI 病史採集系統,就像給醫患雙方配了個 “貼心幫手”,靠三項實用技術,把病史採集變得又快又準。 首先是智能語音問答技術,幫患者 “順暢説病史”。以前填病史要對着複雜表格逐

NLP , 智能語音 , 人工智能 , 結構化 , 語音識別

收藏 評論

雲端小悟空 - 從langchain到langgraph

以下觀點是個人在學習中的思考,如果有不對的地方歡迎指正。 我會盡量從「設計框架」的視角來講:每一層解決什麼問題。 從 LangChain 到 LangGraph 0. “智能體”的最終形態 單個智能體的理想形態:像人一樣,能在環境裏自動獲取信息;主動規劃怎麼解決任務;會用工具做事;做完能反思要不要調整;需要調整就記住,方便下次更好地做

黑盒 , 顯式 , Css , 前端開發 , 結構化 , HTML

收藏 評論

Ambition的後花園 - 對於不斷變化的開發需求,該如何應對

應對不斷變化的開發需求,是現代軟件開發中的核心挑戰。有效應對的關鍵在於從根本上轉變管理思維,從抗拒變化轉向主動擁抱和靈活管理變化。為此,我整理了一個綜合性的策略表格,希望能為你提供清晰的行動指南。 應對維度

scrum , 後端開發 , JAVA , 迭代 , 結構化

收藏 評論

高粱seo工作室 - 大模型GEO收錄媒體成企業媒體發稿的精準破局關鍵

一、核心概念分解:讀懂大模型GEO收錄媒體的本質 要把握大模型GEO收錄媒體的價值,需先拆解其核心構成,明確其與傳統媒體發稿的核心差異。所謂GEO,即Generative Engine Optimization(生成式AI優化),是面向大語言模型(如豆包、DeepSeek、文心一言等)及多模態生成系統的內容適配策略,核心目標是讓品牌內容被AI算法視為“可信來源”,從而在用户

軟件研發 , seo , 搜索 , 結構化

收藏 評論

數據探索先鋒 - 搜索引擎seo優化 - 林間有風

【第一部分:核心指標定義】 在AI-SEO的搜索結果優化方向,我們定義以下5個關鍵成功指標: 1.前3位引用比例:內容在ChatGPT等AI回答中出現在前3個引用位置的頻率比例 2.千次查詢引用次數:每1000次相關用户查詢中,內容被AI引用的平均次數 3.查詢意圖覆蓋度:內容能夠覆蓋的目標用户查詢意圖的百分

seo , 數據 , Css , 前端開發 , 結構化 , HTML

收藏 評論

mb68b85ccf7a016 - AI 提示詞工程全指南:從“咒語”到“編程”

這是一篇為您定製的 AI 提示詞工程 (Prompt Engineering) 深度指南。 隨着大模型(LLM)能力的爆發,寫提示詞(Prompting)已經不再僅僅是“提問”,而變成了一種使用自然語言進行編程的新範式。對於開發者而言,理解 LLM 的“思維方式”,通過結構化的輸入獲取確定的輸出,是構建 AI 應用(如 RAG、Agent)的核心基本功。 AI

物聯網 , 結構化 , Json , Python

收藏 評論

沃觀態勢感知 - 核心技術解析:出海輿情監控網站如何實現全球多平台數據抓取?

出海輿情監控網站的本質是“以儘可能低的成本、儘可能高的速度、儘可能高的準確度,抓取全平台、跨語言、跨區域的輿論數據”。要做到這一點,技術難點極其複雜:全球各平台結構不同、數據權限政策差異巨大、多語言內容格式多樣、商家發佈頻率極高、用户表達碎片化嚴重,而出海輿情監控網站必須在最短時間內把這些信號轉化為統一結構的數據,為品牌提供可靠洞察。因此,理解出海輿情監控網站的數據抓取核心技術,

數據 , 人工智能 , 數據分析 , 數據抓取 , 結構化

收藏 評論

這是嚕嚕 - 用Python讀取和寫入Excel多工作表:openpyxl vs pandas對比

在日常辦公與數據分析中,Excel 文件(尤其是 .xlsx 格式)是信息交換的常見載體。Python 提供了多種處理 Excel 的工具,其中 openpyxl 和 pandas 是最主流的選擇。它們各有側重:openpyxl 專注於原生操作 Excel 文件結構(如樣式、公式、多工作表),而 pandas 則擅長以數據框形式高效處理表格內容。本文將通過多工作表讀寫場景,對比兩

數據 , 加載 , 後端開發 , 結構化 , Python

收藏 評論