收藏 / 列表

DashVector - 如何通過Python SDK更新Collection中已存在的Doc

本文介紹如何通過Python SDK更新Collection中已存在的Doc。 説明 若更新Doc時指定id不存在,則本次更新Doc操作無效 如只更新部分屬性fields,其他未更新屬性fields默認被置為None Python SDK 1.0.11版本後,更新Doc時vector變為非必填項 前提條件 已創建Cluster 已獲得API-KEY 已安裝最新版SDK 接口定義

向量 , 數據庫 , 人工智能 , 大模型

MatrixOrigin - Git for Data:像Git一樣管理你的數據

作者 | 矩陣起源 策劃 | InfoQ李冬梅 當你的 AI Agent 突然清空核心數據庫,或是悄悄注入虛假數據時,傳統的數據恢復手段往往耗時費力。而 Git for Data 帶來的變革,能讓這一切像回滾代碼提交一樣簡單。 DATA-CTL RESET DATABASE `agent1_db` TO TIMESTAMP 2025-08-01 12:00:00.123456; 瞬間

數據庫 , 人工智能 , Git

SeaTunnel - 結項報告完整版:Apache SeaTunnel 支持 Flink 引擎 Schema Evolution 功能

過去兩週,我們對開源之夏活動中表現優異的開發者們進行了簡單的採訪,初步粗略地瞭解了一下他們的開發過程和心得體會。今天,我們將通過同學們的完整結項報告,深入瞭解項目的開發技術細節,希望能夠幫助大家更好地瞭解 Apache SeaTunnel 項目的最新進展。 接下來是關於在 Flink 引擎上對 Schema Evolution 功能的支持這一項目的完整報告: 一. 已完成工作 根據原定方案(htt

數據同步 , 大數據 , 開源 , seatunnel , flink

ZeroNews內網穿透 - ZeroNews 場景案例 | 結合小皮面板實現公網web服務發佈

在企業或家庭內網環境中,服務器通常無法直接通過公網訪問,導致遠程管理、網站部署等操作受限。而小皮面板是一款功能強大、操作簡單的服務器管理面板,支持多種網站類型,包括靜態網站、動態網站、SSL網站等,集成了一鍵安裝、一鍵配置、一鍵部署等多種功能。 結合 ZeroNews (零訊)內網穿透,無需固定公網IP,充分發揮小皮面板的部署優勢,快速實現公網發佈小皮面板中的Web站點及對小皮面板進行遠程管

教程 , 知識

數據科技訊 - 帶貨女王蛋蛋又添女性創業者新身份 央視探訪蛋蛋“雙11”直播間

2025年“雙11”落下帷幕,快手主播蛋蛋交出了自己獨立創業後的首份成績單:“雙11”大促直播總成交額55億元。11月13日19時30分,CCTV2《消費主張》特別報道《“雙11”十七年 創造中國消費新場景:流量密碼》播出,央視記者走進蛋蛋“雙11”直播間,探尋55億元背後的故事。 今年28歲的蛋蛋(本名楊潤心)是快手頭部主播,也是全網首個粉絲破億的女主播。從201

MySQL , 數據庫 , 解決方案 , 職業生涯

瀟湘隱者 - MySQL統計分析binlog的數量與大小

腳本介紹 腳本mysql_binlog_gen_sum的功能與用途如下所示: 按天統計MySQL的binlog的生成數量(個數)與大小(Size)信息.用於數據分析. 按小時統計MySQL的binlog的生成數量(個數)與大小(Size)信息.用於數據分析. 寫這個腳本的初衷是想實現類似Oracle數據庫中統計分析歸檔日誌生成的大小與數量的功能,奈何MySQL數據庫中沒有這些系統視圖和系統

數據庫

mb43f60adeco02a - 讀書筆記:數據搬運工:Oracle數據庫的導入導出技巧

本文為個人學習《Expert Oracle Database Architecture Techniques and Solutions for High Performance and Productivity(第四版本》一書過程中的筆記與理解分享,僅用於學習與交流,部分內容參考原書觀點並結合實際經驗進行整理。若涉及版權問題,請聯繫刪除

外部表 , 數據 , MySQL , 數據庫

collen7788 - 【趙渝強老師】達夢數據庫的事務隔離級別

達夢數據庫允許多個客户端同時訪問。當這些客户端併發訪問數據庫中同一部分的數據時,如果沒有采取必要的隔離措施就容易造成併發一致性問題,從而破壞數據的完整性。考慮下圖中的場景: 在時間點1上,var的數值是100。客户端A在時間點2的時候更新了它的值為200,但沒有提交事務。在時間點3的時候,客户端B讀取到了客户端A還未提交的數值200。但在時間點4,客户端A執行了回滾操作。那麼,對

oracle , yyds乾貨盤點 , 達夢 , 數據庫 , 國產數據庫 , 達夢數據庫

ApacheIoTDB - 【10.29 直播】IoTDB 圖形化工具與編程框架集成實操

🔍你是否曾為時序數據庫 IoTDB 的命令行操作而煩惱? 🚀是否希望像使用 MySQL 一樣,通過熟悉的 GUI 工具輕鬆管理和查詢時序數據? 📌到底如何將 IoTDB 無縫整合進你的 SpringBoot 或 MyBatis 項目? 📆10 月 29 日(週三)19:00,我們將通過一場全鏈路實戰演示,帶你深入 IoTDB 強大的編程與可視化生態,一次性解決上述所有難題。 🌟 直播亮點

數據庫

access開發 - Access自定義導出HTML報表

Hi,大家好! 在日常工作中,我們經常需要將 Access 中的數據分享給沒有安裝 Access 的同事,或者發佈到公司內網上。截圖、發 Excel 文件都或多或少有些不便。今天,我將帶你解鎖一個非常實用的技能——將 Access 數據導出為 HTML 文件。這不僅能生成任何設備都能完美打開的報表,還能通過自定義,讓你的數據報表看起來像一個專業的網頁。 為什麼要導出為 HTML?

數據庫 , excel , vba , access ,

老紀的技術嘮嗑局 - 應對 “讀放大” 問題的新方法 —— OceanBase 中的 Merge-On-Write 表

背景 OceanBase 從 4.3.0 版本開始,推出了加速 AP 查詢的列存引擎,具體包含: 新的列式編碼 列預聚合信息 列存執行引擎 向量化內存格式 新的查詢優化器,能根據規則和代價動態選擇行存和列存引擎。 OceanBase 列存引擎發佈之後,AP 分析能力得到了大幅提升,在與一系列競品的對比測試中都有比較好的表現,正式踏入了 HTAP 領域。 為了節省存儲成本和簡化用户的運

數據庫

煩惱的沙發 - macOS是開發的終極進化版嗎?

在程序員的圈子裏,Linux代表着一種信仰:開源、自由、極致的可定製性。但不少當年抱着 生命不息,折騰不止”信念的 Linux 高手,折騰了十幾年 Arch、Gentoo,把命令行玩得爐火純青,最後卻不約而同地換上了 MacBook。 連GNOME的創始人Miguel de Icaza,這位Linux桌面環境的元老級人物,也曾公開表示自己最終愛上了macOS。這不禁讓人思考:為什麼macOS成為了

開發工具 , macos , 編程語言 , 開發環境

小亦智能運維 - Linux應急手冊第四期

小亦平台會持續給大家科普一些運維過程中可能會用到的的應急手冊內容,運維朋友們可以在往期方案中查看更多案例 OP019 rhel6進入救援模式 操作步驟: Linux進入rescue mode,需要用系統重啓用ISO引導 ,ISO版本和系統版本應保持一致。系統成功從ISO映像啓動後: 選擇Rescue installed system 選擇鍵盤和語言

運維 , linux運維 , 數據庫 , Linux , 程序員

風流倜儻的傷痕 - 為什麼你的單元測試需要Mock數據庫才能飛起來?

url: /posts/6e69c0eedd8b1e5a74a148d36c85d7ce/ title: 為什麼你的單元測試需要Mock數據庫才能飛起來? date: 2025-09-05T05:57:12+08:00 lastmod: 2025-09-05T05:57:12+08:00 author: cmdragon summary: FastAPI 的依賴注入

flask , django , fastapi , 後端 , Python

京東雲開發者 - Dubbo架構設計與源碼解析(二) 服務註冊

作者:黃金 一、Dubbo簡介 Dubbo是一款典型的高擴展、高性能、高可用的RPC微服務框架,用於解決微服務架構下的服務治理與通信問題。其核心模塊包含 【RPC通信】 和 【服務治理】 ,其中服務治理又分為服務註冊與發現、服務容錯、負載均衡、流量調度等。今天將重點介紹Dubbo的服務註冊與發現。 二、SPI機制 在介紹服務註冊發現之前,先簡單介紹一下貫穿整個Dubbo源碼,也是Dubbo實現自適

源碼學習 , 服務註冊 , dubbo , 微服務 , 架構設計

wx690f565d7bc78 - java文檔註釋

Java 文檔註釋(JavaDoc)是一種特殊的註釋格式,用於生成標準化的 API 文檔。它以 /** 開頭,以 / 結尾,通常用於類、方法、字段、接口等元素上方,描述其功能、參數、返回值、異常等信息。 基本格式 文檔註釋通常包含以下部分: java 運行 /* 類/方法/字段的簡要描述(單行) 詳細描述(可選,多行)

文檔註釋 , 字段 , MySQL , 數據庫 , JAVA

AIIData數據中台 - 離線開發平台-HdfsFile同步Doris

離線開發平台基於開源項目DolphinScheduler建設。 DolphinScheduler 是一個功能強大的分佈式任務調度平台,支持複雜工作流編排、任務監控與告警,適用於離線數據處理場景。 1. 環境準備 HDFS Doris seatunnel 1.1 SeatunneI

項目管理 , 開發平台 , MySQL , 離線 , 數據庫 , 開源

wx6875a567c49bb - MySQL存儲過程

MySQL 存儲過程(Stored Procedure)是預編譯並存儲在數據庫中的一組 SQL 語句集合,可通過單次調用執行復雜邏輯(如多表查詢、事務處理、批量操作),核心優勢是複用性強、減少網絡傳輸、提升性能,適合封裝複雜業務邏輯。 與自定義函數(UDF)相比,存儲過程支持事務、寫操作(INSERT/UPDATE/DELETE)、返回多個結果集(通過參數、結果集、臨時表)

MySQL , 存儲過程 , 數據庫

程序員一諾python - 【深度學習】嘿馬深度學習目標檢測教程第5篇:數據集處理,2.2 目標數據集標記【附代碼文檔】

🏆🏆🏆教程全知識點簡介:涵蓋圖像識別背景、目標檢測定義和應用場景。核心算法原理包括R-CNN系列算法(R-CNN、SPPNet、Faster R-CNN、RPN原理)、YOLO算法(單次檢測、候選框機制、單元格概念)以及SSD算法(單次多框檢測器、多個Detector classifier、訓練與測試流程)。數據處理模塊包含目標數據集標記、數據集格式轉換(TFRecords文件、VOC2

算法 , 人工智能 , 深度學習 , Python

KaiwuDB - 深度剖析:KWDB SQL 編譯與優化策略

1. 概述 KWDB 作為一款面向 AIoT 場景的分佈式多模數據庫產品,支持在同一實例同時建立時序庫和關係庫並融合處理多模數據,具備千萬級設備接入、百萬級數據秒級寫入、億級數據秒級讀取等時序數據高效處理能力,具有穩定安全、高可用、易運維等特點。 KWDB 的 SQL 引擎由解析器、優化器和執行器組成,編譯優化部分主要介紹解析器和優化器。 解析器:核心作用是將用户輸入的 SQL 語句轉換為 KWD

數據庫 , SQL

極限實驗室 - IK 字段級別詞典的升級之路

背景知識:詞庫的作用 IK 分詞器是一款基於詞典匹配的中文分詞器,其準確性和召回率與 IK 使用的詞庫也有不小的關係。 這裏我們先了解一下詞典匹配法的作用流程: 預先準備一個大規模的詞典,用算法在文本中尋找詞典裏的最長匹配項。這種方法實現簡單且速度快。 但面臨歧義切分和未登錄詞挑戰:同一序列可能有不同切分方式(例如“北京大學生”可以切成“北京大學/生”或“北京/大學生”),需要規則或算法消除

elasticsearch , 數據庫

長腿大壯 - H2 數據庫中的批量操作與數據校驗關鍵字

H2 數據庫中的批量操作與數據校驗關鍵字 在 H2 數據庫的高效使用場景中,批量操作關鍵字能大幅提升數據處理速度,數據校驗關鍵字則為數據準確性保駕護航。這兩類關鍵字適配了批量導入、批量更新等高頻場景,同時避免無效數據流入數據庫,讓數據操作既高效又可靠。 一、批量操作關鍵字 批量操作關鍵字能減少數據庫交互次數,降低開銷,尤其適合大數據量處理場景,INSERT ... SELEC

oracle , 字段 , 數據校驗 , 數據庫 , 批量更新