tag 數據庫

標籤
貢獻655
618
05:15 PM · Oct 25 ,2025

@數據庫 / 博客 RSS 訂閱

DashVector - 如何通過Python SDK向Collection中插入或更新Doc

本文介紹如何通過Python SDK向Collection中插入或更新Doc。 説明 若調用本接口時Doc Id已存在,則等同於更新Doc; Doc Id不存在,則等同於插入Doc。 若調用本接口時不指定Doc Id,則等同於插入Doc,DashVector會自動生成Doc Id,並在返回結果中攜帶id信息。 前提條件 已創建Cluster 已獲得API-KEY 已安裝最

向量 , 數據庫 , 人工智能 , 大模型

收藏 評論

數據庫分享小北 - 基於 DMS Dify+Notebook+Airflow 實現 Agent 的一站式開發

本文作者:阿里雲數據庫開發專家 陳樞華 背景與挑戰 Dify 作為一款低代碼 AI 應用開發平台,憑藉其直觀的可視化工作流編排能力,極大降低了大模型應用的開發門檻。然而,在實際企業級落地過程中,我們發現其原生能力仍存在兩個關鍵瓶頸: 代碼執行能力受限:Dify 內置的 Sandbox 節點雖支持基礎 Python 代碼執行,但無法安裝自定義 Python 包,難以支撐複雜的業務邏輯、數據處理或

資訊 , 知識 , 數據庫 , dify

收藏 評論

海豚調度 - 真實遷移案例:從 Azkaban 到 DolphinScheduler 的選型與實踐

一、為什麼我們放棄了Azkaban? 我們最早選擇用 LinkedIn 開源的 Azkaban 做調度,主要是看中它兩個特點:一是界面清爽,操作簡單;二是它用“項目”來管理任務,非常直觀。那時候團隊剛開始搭建數據平台,這種輕量又清晰的工具,正好符合我們的需要。其他還有其他原因: 社區活躍(當時) 部署簡單,依賴少(僅需 MySQL + Web Server + Executor) 支持 j

dolphinscheduler , 大數據 , 數據庫 , 任務調度 , 開源

收藏 評論

IvorySQL - 使用 PostgreSQL 時間點恢復(Point-In-Time Recovery)的多種數據恢復技術

引言 本文面向那些已經具備一定數據庫經驗、但希望進一步學習 PostgreSQL 基礎知識的初學者。假設已在 Ubuntu 環境中正確安裝 PostgreSQL,本文的全部操作基於 PostgreSQL 16(開發版本)與 Ubuntu 22.10 系統完成。文章將介紹三種常用的數據恢復方法: 恢復至最新狀態。 基於日誌序列號(LSN, Log Sequence Number)的恢復。 基

數據庫 , postgresql

收藏 評論

access開發 - Access自定義導出HTML報表

Hi,大家好! 在日常工作中,我們經常需要將 Access 中的數據分享給沒有安裝 Access 的同事,或者發佈到公司內網上。截圖、發 Excel 文件都或多或少有些不便。今天,我將帶你解鎖一個非常實用的技能——將 Access 數據導出為 HTML 文件。這不僅能生成任何設備都能完美打開的報表,還能通過自定義,讓你的數據報表看起來像一個專業的網頁。 為什麼要導出為 HTML?

數據庫 , excel , vba , access ,

收藏 評論

數據庫分享小北 - DMS Airflow:企業級數據工作流編排平台的專業實踐

本文作者:阿里雲數據庫技術專家 賈志威 DMS Airflow 是基於 Apache Airflow 構建的企業級數據工作流編排平台,通過深度集成阿里雲 DMS(Data Management Service)系統的各項能力,為數據團隊提供了強大的工作流調度、監控和管理能力。本文將從 Airflow 的高級編排能力、DMS 集成的特殊能力,以及 DMS Airflow 的使用示例三個方面,全面介紹

觀點 , MySQL , 知識 , 數據庫 , SQL

收藏 評論

IvorySQL - 你真的知道你正在運行哪個 PostgreSQL嗎?

本文整理自 IvorySQL 2025 生態大會暨 PostgreSQL 高峯論壇的演講分享,演講嘉賓:Alvaro Hernandez。 個人簡介: OnGres 創始人CEO 20年以上Postgres用户及數據庫管理員經驗 主要從事研發工作,基於Postgr0 es創建創新軟件 累計開展140餘場技術講座,多數以Postgres為主題 非營利組織PostgreSQL基金會創始人及

數據庫 , postgresql

收藏 評論

趙渝強老師 - 【趙渝強老師】Redis數據的遷移

通過使用Redis的鍵遷移功能,可以把數據從一個Redis數據庫中遷移到另一個數據庫中,例如從生產環境遷移到測試環境。Redis提供了move、dump+restore和migrate三種不同的方式來實現鍵的遷移。視頻講解如下: https://www.bilibili.com/video/BV1j32wB2Es6/?aid=115503012058... 一、 使用move命令實現數據的內

redis , nosql , 數據庫

收藏 評論

酷克數據HashData - Greenplum 替代項目 Apache Cloudberry 孵化週年總結

Apache Cloudberry™ (Incubating) 是 Apache 軟件基金會孵化項目,由 Greenplum 和 PostgreSQL 衍生而來,作為領先的開源 MPP 數據庫,可用於建設企業級數據倉庫,並適用於大規模分析和 AI/ML 工作負載。 GitHub: https://github.com/apache/cloudberry 作者:王殿進,Apache Cl

數據庫 , apache

收藏 評論

追風的苦咖啡 - 共築網絡安全,守護綠色家園

共築網絡安全,守護綠色家園 ——JoySSL 專業版證書為數據傳輸築牢安全屏障 在數字時代,網絡已成為連接世界的核心紐帶,數據則是驅動各類線上活動的核心要素。然而,網絡空間的開放性也帶來了數據竊取、信息篡改等安全風險,不僅威脅用户的合法權益,也讓企業品牌面臨信任危機。構建安全、純淨的網絡 “綠色家園”,已然成為行業共識與迫切需求,而 SSL 證書正是守護這一家園的關鍵基石。 SSL證書申請⬇

觀點 , 教程 , 數據庫 , postgresql , memcached

收藏 評論

老紀的技術嘮嗑局 - 應對 “讀放大” 問題的新方法 —— OceanBase 中的 Merge-On-Write 表

背景 OceanBase 從 4.3.0 版本開始,推出了加速 AP 查詢的列存引擎,具體包含: 新的列式編碼 列預聚合信息 列存執行引擎 向量化內存格式 新的查詢優化器,能根據規則和代價動態選擇行存和列存引擎。 OceanBase 列存引擎發佈之後,AP 分析能力得到了大幅提升,在與一系列競品的對比測試中都有比較好的表現,正式踏入了 HTAP 領域。 為了節省存儲成本和簡化用户的運

數據庫

收藏 評論

clougence - 百草味數據架構升級實踐:打造 Always Ready 的企業級數據平台

朱齊天,百草味數據部負責人 前言 百草味是國內知名的休閒零食品牌,業務覆蓋線上電商平台與線下零售渠道,服務用户超過 2 億。隨着商品 SKU 數量劇增和渠道多元化發展,百草味在供應鏈、運營、銷售等環節積累了海量數據,對數據的依賴也日益增強。 在這一背景下,百草味選擇與 CloudCanal 合作,構建統一的數據集成平台,支撐數據驅動的業務運營與決策。 業務背景 百草味的業務涵蓋從原料採購、生

大數據 , MySQL , 數據庫 , starrocks , 數據分析

收藏 評論

databend - Databend 十月月報:存儲過程正式可用,數據流程全面自動化

Hi,Databend 的朋友們!🚀 十月,我們專注於生產自動化的落地。存儲過程正式可用並移除了實驗性標記,SQL 腳本引擎支持 dynamic schema introspection,能夠處理複雜的 ETL 流程。同時,我們發佈了 JSON 全文檢索的 inverted index、智能內存溢出控制,並全面升級了運維工具——本月共發佈了十一個版本。 月度數據 22 個新功能,19 個 bug

數據庫

收藏 評論

KaiwuDB - 10 月熱搜精選

1、第三屆開放原子大賽 - KWDB 核心貢獻挑戰賽決賽晉級名單正式公佈! 本屆大賽由開放原子開源基金會主辦,作為國內開源領域的頂尖賽事,是廣大開發者展示才華、交流創新、共建影響力的重要平台。 本次 KWDB 核心貢獻挑戰賽設立 30 萬 元獎金,聚焦物聯網場景下數據寫入與導入的核心課題,自啓動以來備受關注。初賽階段已圓滿結束,共吸引 36 支團隊報名,收到 21 份有效作品。經專家評審團嚴格評定

數據庫

收藏 評論

StarRocks - StarRocks 4.0:FlatJSON,讓 JSON 查詢像列存一樣高效

導讀: StarRocks 4.0 已正式發佈!這一版本帶來了多項關鍵升級。本篇聚焦 JSON 查詢性能的系統性提升——通過全新的 FlatJSON 列式存儲與執行優化機制,StarRocks 4.0 讓 JSON 在實時分析場景中具備接近原生列存的性能。 無論是日誌、埋點還是 IoT 數據,用户都無需額外 ETL,即可直接對 JSON 進行高性能查詢分析,真正讓“靈活的數據結構”與“高效

數據庫 , starrocks , 數據查詢 , Json

收藏 評論

數據集成與治理 - 終於有人把數據庫搭建講清楚了

在信息時代,數據已成為最寶貴的資產。 如何科學地管理這些數據,讓它們從雜亂的信息碎片成為有序的知識寶藏? 我們可以藉助數據庫來實現,數據庫能讓數據管理變得高效可靠。 你看,從網站用户信息到購物記錄,從業務報表到日誌數據,幾乎所有現代應用都離不開數據庫的支撐。 今天我就來給大家聊聊數據庫怎麼搭建,有哪些困難和挑戰,在今後發展中,它有着什麼樣的發展趨勢。 一、數據庫的定義 數據庫,就是一個高度結構化的

觀點 , 大數據 , 教程 , 數據庫

收藏 評論

數據集成與治理 - 一文帶你全面解讀數據治理

先問大家一個問題:公司的數據現在處於一種什麼狀態? 兩年前我幹數據工作時,團隊總是會出現:開會的時候不同部門因為“客户數量”根本對不上而爭吵; 新來的同事想查找信息,卻發現同一個產品叫法有好幾個; 公司想搞個精準營銷,卻發現客户手機號一堆是空的,結果根本就執行不了。 聽着是不是很熟? 其實就是因為沒有進行數據治理。説白了,數據治理可是一項必須要做的基礎性工作。 但是要怎麼做?怎樣做好?有

數據管理 , 教程 , 知識 , 數據庫

收藏 評論

數據集成與治理 - 元數據管理是什麼?怎麼管?

做數據最怕什麼? 需要分析業務時找不到數據在哪;各部門對"活躍用户"等指標定義不一,數據對不上;報表出錯時,還得花大量時間排查問題根源…… 這些情況其實就是缺乏對元數據的有效管理。 找數據難、數據口徑不一致、問題追溯效率低等問題,其實把元數據管理做好了,就能解決這些問題。 下面我就來給大家好好講講元數據管理的概念、作用、管理步驟和重要性,幫你找到切實可行的解決方案。 一、什麼是元數據管理? 咱們先

數據 , 教程 , 知識 , 數據庫

收藏 評論

普郎特 - # Python多進程深度解析:Windows下的進程創建與數據傳遞機制

前言 在使用 Python 的 multiprocessing 模塊時,你是否遇到過這些困惑: 為什麼子進程能訪問 self.url 和 self.headers 這些實例屬性? 子進程是如何獲取類方法、類屬性和模塊函數的? 為什麼數據庫連接不能放在 __init__ 中? if __name__ == '__main__': 到底保護了什麼? 本文將深入剖析 Windows 平台下

教程 , 知識 , 數據庫 , 爬蟲 , Python

收藏 評論

墨天輪 - 2025年10月國產數據庫大事記:達夢前三季度淨利潤大幅增長達3.3億元,移動雲獲CCF科技成果獎……

本文為墨天輪社區整理的2025年10月國產數據庫大事件和重要產品發佈消息。 達夢數據財報顯示,前三季度淨利潤達3.3億元,同比增長89.11%,同時達夢數據屢獲殊榮,包括入選中國軟件百強等。南大通用 GBase 8a 獲評軟博會“2024-2025年度優秀創新軟件產品”;移動云云原生數據庫項目獲CCF科技成果獎;KWDB開發站上線,為開發者提供資源支持;崖山數據庫華東區域總部落地南京;此外,Dol

騰訊雲 , oceanbase , 阿里雲 , 數據庫 , 達夢數據庫

收藏 評論

冷冷的炒麪 - 網站為什麼要HTTPS訪問?

在瀏覽網站時,您可能注意到有些網址以“http://”開頭,而有些則以“https://”開頭。這個額外的“s”代表着安全(Secure),意味着您的連接受到SSL證書的保護。本文將解釋為什麼HTTPS如此重要。 什麼是HTTPS? HTTPS是HTTP的安全版本。它通過SSL(安全套接層)或TLS(傳輸層安全)協議對數據進行加密。當網站使用HTTPS時,瀏覽器和服務器之間的所有通信都會被加密,防

觀點 , HTTP , 知識 , 數據庫 , 前端

收藏 評論

碼雲筆記 - MySQL執行計劃出現 Using filesort 是什麼原因?如何進行優化?

在對以一個SQL的執行計劃進行分析時,我們會關注Extra這個屬性,當這個屬性的值是Using filesort時,就需要看下SQL是否需要優化一下了。 1.Using filesort 比如下面的這個SQL,排序字段上沒有索引,執行計劃Extra就顯示Using filesort: EXPLAINSELECT*FROMtest4ORDERBYtime_stamp; 也可以通過FORMAT=JSO

MySQL , 教程 , 數據庫

收藏 評論

SelectDB技術團隊 - 貨拉拉用户畫像基於 Apache Doris 的數據模型設計與實踐

貨拉拉是國內領先的同城貨運數字化平台,成立於 2013 年。截⾄2025 年 4⽉ ,貨拉拉業務覆蓋全球 14 個市場 ,400+ 城市 ,其中中國內地總共覆蓋 363 座城市 ,⽉活司機達 120 萬 ,⽉活⽤户達 1400 萬, 並在全球設有 6 個數據中⼼。作為共享經濟模式的代表企業 ,貨拉拉通過移動互聯⽹技術整合社會運⼒資源 ,為⽤户提供即時貨運、企業物流、搬家服務等多元化解決⽅案。 在龐

數據庫 , apache

收藏 評論

SelectDB技術團隊 - 從 OpenSearch 到 Apache Doris:領創集團日誌系統升級實踐,降本 45%

隨着業務全球化擴展與數字化運營的深入推進,日誌系統的規模和複雜度不斷攀升,原有基於 OpenSearch 的日誌平台逐漸難以滿足成本控制、性能保障和可維護性等多維需求。為應對持續增長的數據壓力和更靈活的分析場景,領創集團技術團隊啓動了日誌系統的架構升級實踐,並最終選擇 Apache Doris 作為新一代日誌系統的核心。實現了綜合成本下降超 45%、查詢性能提升 5 倍、日誌寫入達到準實時以及靈活

資訊 , 數據庫

收藏 評論