博客 RSS 訂閱

阿里雲大數據AI技術 - Hologres Dynamic Table:高效增量刷新,構建實時統一數倉的核心利器

在企業數據架構逐步走向實時化與一體化的過程中,如何高效處理“大量歷史+少量新增”的業務數據,已成為建設統一數倉與實時數倉時繞不開的關鍵挑戰。 傳統全量刷新方式在面對億級歷史數據時,往往面臨刷新延遲高、計算成本大、鏈路複雜等問題。為了解決這些痛點,業界逐漸形成了一種新的數據處理範式——DynamicTable(動態表),它通過聲明式語法自動維護物化結果,並支持高效的增量刷新能

大數據 , 阿里雲 , 人工智能 , 數據分析 , 實時數倉 , Hologres

收藏 評論

技術博客達人 - kafka集羣安裝

Kafka_4.1.0(Kraft模式)集羣安裝 環境準備 系統:Ubuntu 22.04 JDK:21 Kafka: 4.1.0 CPU:4核+ 內存:8GB+(生產環境建議16GB+)

服務器 , 主機名 , ip , 集羣 , kafka

收藏 評論

TwilightLemon - WPF 使用 RenderTransform 實現高性能平滑滾動的 ScrollViewer

在之前的兩篇文章中,我們探討了 WPF 中實現平滑滾動的不同方案: WPF 如何流暢地滾動ScrollViewer 簡單實現下:基於DoubleAnimation的動畫方案。 WPF 使用CompositionTarget.Rendering實現平滑流暢滾動的ScrollViewer:基於CompositionTarget.Rendering的每幀佈局更新方案。 雖然第二版方案解決了觸控板

.net , 後端

收藏 評論

Java烘焙師 - 架構師必備:後端程序員需要了解的數倉知識

大家好,我是Java烘焙師。後端程序員平時除了接觸業務代碼、中間件、存儲等,也難免會跟數倉有交集。下面結合筆者的經驗和思考,從後端程序員的視角看數倉、做個總結,後續再跟數倉/BI argue的時候就不虛了😃 分成兩部分介紹:離線數倉、實時數倉。 離線數倉 離線數倉是最典型的數倉應用場景。後端服務產生了業務數據、監控埋點、日誌等,如果要做統計分析,就要先離線採集到數倉,再通過SQL做聚合查詢。

數據倉庫 , 架構

收藏 評論

Coding茶水間 - 基於深度學習的水下海洋生物檢測系統演示與介紹(YOLOv12/v11/v8/v5模型+Pyqt5界面+訓練代碼+數據集)

視頻演示 基於深度學習的水下海洋生物檢測系統演示 1. 前言​ 大家好,歡迎來到 Coding 茶水間。今天要分享的是一個基於 YOLO 算法的水下海洋生物識別系統,它能幫我們快速判斷畫面中出現的海洋生物種類。 這套系統界面清晰、功能齊全,分為左側功能區、中央展示區與右側數據區三大板塊。左側可選取圖片、視頻、批量圖片或攝像頭進行檢測,還能切換不同訓練好的模型;中央區域不僅能實時預覽檢測畫面,還提供

AI

收藏 評論

HuggingFace - Codex 正在推動開源 AI 模型的訓練與發佈

繼我們使用 Claude Code 訓練開源模型的項目之後,現在我們更進一步,將 Codex 引入這一流程。這裏的重點不是“Codex 自己開源模型”,而是讓 Codex 作為編碼代理,參與並自動化開源模型的訓練、評估與發佈全流程。為此,我們為 Codex 接入了 Hugging Face Skills 倉庫,該倉庫包含了許多與機器學習和 AI 相關的“技能”,比如模型訓練與評估等任務。通過 H

AI

收藏 評論

HuggingFace - 經同意的語音克隆

在這篇博客文章中,我們介紹了“語音同意驗證機制 (voice consent gate)”的概念,支持通過明確同意來進行語音克隆。我們還提供了一個 示例 Space 應用 和 相關代碼,幫助大家快速上手這一想法。 近年來,逼真的語音生成技術已經達到了令人驚訝的水平。在某些情況下,生成出來的合成語音幾乎能以假亂真,和真人的聲音非常相似。如今,曾經只存在於科幻小説中的“語音克隆”已經成為現實。只需要

AI

收藏 評論

iVictor - MySQL 在哪些場景下不會寫 binlog

背景 在 MySQL 中,慢日誌不僅可以記錄在文件中,還可以記錄在表中。具體是記錄在文件還是表中是由log_output參數決定的。 該參數默認為FILE,即慢日誌默認會記錄在文件中。如果參數中包含TABLE,則慢日誌還會記錄在mysql.slow_log中,而mysql.slow_log使用的是 CSV 存儲引擎。 最初研究這一問題,是為了確認在主從複製以及組複製(MGR)環境下,mysql.s

數據庫

收藏 評論

良許 - 什麼樣的程序員在35歲以後依然被公司搶着要?

大家好,我是良許。 35歲這道坎,是每個程序員都繞不開的話題。我今年剛過36,這幾年做公司招人,也接觸了不少35歲以上的程序員。有的人簡歷一投過來,我恨不得立馬打電話約面試;有的人,説實話,簡歷看完就石沉大海了。 這個差距到底在哪?今天我就從一個創業者和技術管理者的角度,跟你聊聊什麼樣的程序員在35歲以後依然搶手。 我見過的兩種35歲程序員 先説兩個真實的例子,都是我這兩年接觸過的。 第一個,老張

後端

收藏 評論

良許 - 程序員的偽年薪百萬還能持續多久?

大家好,我是良許。 前兩天刷脈脈,看到一個帖子炸了——某大廠程序員曬出自己的年薪package,標題寫着"年薪120萬",評論區一片羨慕。 但仔細一看,base只有40萬,剩下的80萬是股票、期權、年終獎的"理論值"。更狠的是,股票要分四年才能拿到,期權還沒到行權期,年終獎能不能拿到還得看公司業績。 這種偽年薪百萬的遊戲,還能玩多久?作為一個從大廠出來創業的過來人,我今天必須把這個話題説透了。 1

後端

收藏 評論

逐夢AI - 專用蚊子蒼蠅檢測數據集(含背景樣本):適用於目標檢測任務

專用蚊子蒼蠅檢測數據集(含背景樣本):適用於目標檢測任務 一、背景 隨着城市化進程的加快和氣候環境的變化,蚊子、蒼蠅等害蟲在居民生活、公共衞生以及工業場景中造成的問題日益突出。它們不僅影響生活環境質量,還可能傳播多種疾病,對公共健康構成威脅。 傳統的蚊蟲監測方式大多依賴人工觀察或簡單的誘捕統計方法,存在 效率低、實時性差、誤判率高 等問題。隨着計算機視覺和深度學習技術的發展,基於目標檢測的蚊子、蒼

深度學習

收藏 評論

HuggingFace - 流式數據集:效率提升 100 倍!

快速瞭解(TLDR) 現在只需一行代碼,就能通過 load_dataset('dataset', streaming=True) 以流式方式加載數據集,無需下載! 無需複雜配置、不佔磁盤空間、不再擔心 “磁盤已滿” 或 429 請求過多錯誤,立即開始訓練 TB 級數據集! 性能非常強勁:在 64×H100、256 個併發 worker 環境下,流式加載速度甚至超過本地 SSD!

AI

收藏 評論

程序員阿偉 - 《高質量遊戲攻略與視頻的優先級展示機制構建指南》

深夜的遊戲社區裏,不同需求的玩家都在經歷着相似的困境—剛入坑開放世界遊戲的新手,想找隱藏副本的觸發路徑,刷到的卻是重複剪輯的戰鬥混剪,連關鍵NPC的位置都沒有標註;深耕競技遊戲的核心玩家,渴望學習新版本的戰術拆解,置頂內容卻還是三個月前的基礎操作教學,毫無參考價值;專注單機劇情的玩家,想解鎖隱藏結局的關鍵選擇,搜索結果裏滿是標題黨視頻,點進去全是無關的劇情吐槽。這種優質內容被海量低質信息淹沒的現象

遊戲 , 人工智能

收藏 評論

五嶽 - Web層接口通用鑑權註解實踐(基於JDK8)

背景 目前我負責的一個公司內部Java應用,其Web層幾乎沒有進行水平鑑權,存在着一定的風險,比如A可以看到不屬於他的B公司的數據。最近公司進行滲透測試,將這個風險暴露出來,並將修復提上了議程。 由於Web層的接口很多,我希望能用一種較為通用易於接入的方式來完成這個工作。很容易就想到了通過註解方式進行水平鑑權。説來慚愧,我工作了十年多還沒有從0到1寫一個稍微複雜點的註解,正好利用這個機會進行學習和

後端

收藏 評論

deephub - 別再浪費內存了:Python __slots__ 機制深入解析

Python 對象的靈活性大家都知道,可以隨時給對象添加屬性: class User: pass u = User() u.name = "Alice" u.age = 30 但這種靈活性的代價也很大,每個普通 Python 對象都有個 __dict__ 字典來存儲屬性,對象一多內存開銷就上來了,這時候 __slots__ 就派上用場。 slots 到底在幹什麼 __sl

機器學習 , 知識 , Python

收藏 評論

易軟項目平台分享 - 項目管理軟件top10|項目管理軟件排名前十名,高效團隊都選它

1. 禪道(Zentao) 核心定位:國產化研發項目全流程管理平台,聚焦敏捷與瀑布開發模式的一體化管控。 核心功能: 需求管理:支持用户故事梳理、需求分層與優先級排序,實現需求全生命週期追蹤 任務與迭代管理:衝刺規劃、任務拆分與分配,配套燃盡圖等敏捷可視化工具 測試管理:缺陷提交、跟蹤與驗證,支持測試用例設計與測試計劃

軟件工程

收藏 評論

資源999it點top - kubernetes實戰與源碼剖析-專享

Kubernetes 實戰與源碼剖析:核心組件運行機制與企業級部署全解析 Kubernetes(K8s)作為現代雲原生架構中的核心技術之一,已經成為企業級應用部署與管理的標準。自2014年由Google開源以來,Kubernetes以其強大的容器編排能力、靈活的擴展性和高可用性,逐漸形成了一套成熟的生態體系。本文將從教育、科技、人文發展和經濟等多個角度深入探討Kubernetes的核心組件及

實戰 , kubernetes

收藏 評論

圖形學愛好者Wu - 每日一個C++知識點|對象資源傳遞機制

C++是一門對內存資源配置要求較高的語言,其中對象資源傳遞在C++開發中無處不在,下面我將在淺拷貝、深拷貝、左值右值、移動語義、完美轉發這5個方面層層遞進地講解C++對象資源傳遞機制,爭取做到知識串聯,深入淺出~ 淺拷貝 我們從一個實際場景入手:寫一個Image類,存儲圖片的像素數據,代碼如下: #include iostream using namespace std; // 圖片類:管理堆內

觀點 , 資訊 , 教程 , 知識 , c++

收藏 評論

躺柒 - 讀人機溝通法則:理解數字世界的設計與形成03機器是有生命的

1.有沒有生命 1.1.看到一個物體在運動是判斷其有生命的第一條線索 1.2.智能手機和自動駕駛汽車出現之前就存在的技術:自動客服代表 1.3.過去,人們很容易認為計算機很笨,因為它做任何事情都要花很長時間 1.3.1.過去的交互技術很簡單,缺少許多必要的組成部分,只能緩慢地響應我們的輸入 1.4.現在,我們認為計算機可能比我們更聰明 1.4.1.因為它對我們給它的刺激做出的反應是如此

AI

收藏 評論

無邪的課本 - Linux 麒麟系統安裝 gcc-7.3.0 rpm 包步驟

​ 找到 rpm 文件 安裝包下載:https://pan.quark.cn/s/9aac910b9f81,下載完一般在下載​ 目錄,文件名: gcc-7.3.0-20190804.35.p06.ky10.x86_64.rpm 先確認一下: ls ~/下載/gcc-7.3.0* 如果是英文環境: ls ~/Downloads/gcc-7.3.0* * 2.

Linux

收藏 評論

星星上的柳樹 - Verilog端口類型解析

“理解端口類型,是Verilog模塊設計的關鍵。” 在Verilog設計中,端口是模塊與外界交互的橋樑。不同類型的端口——輸入、輸出與雙向——在數據流向與信號驅動方式上有着嚴格的規則。若定義不當,不僅會引發編譯錯誤,還可能導致仿真行為與硬件實現不一致。掌握Verilog端口類型的使用原則,能幫助設計者構建結構清晰、邏輯可靠的電路系統。 1、端口類型與信號流向Verilog模塊的端口可分為三類

資訊 , 教程 , 知識 , 人工智能 , 深度學習

收藏 評論

daoshanghundezhuantou - 硬件+軟件協同交付怎麼落地?2025 軟硬件項目管理工具對比

本文深度測評 ONES、Polarion、Codebeamer、Helix ALM、Jama Connect、SpiraTeam、Nuxeo、Hansoft、Nifty 等軟硬件協同管理工具,幫助團隊打通需求-缺陷-版本管理全流程。 軟硬件協同交付的難點 在複雜系統研發裏,軟件團隊習慣以迭代節奏驅動交付,硬件團隊則以階段評審與變更控制驅動質量。兩種節奏並行並不矛盾,真正讓項目失控的往往是:軟硬件共

項目管理 , 軟件 , 硬件

收藏 評論

PC2005-cloud - STM32HAL庫中斷教程以及分裝中斷工具函數(附下載地址)

文章內容 使用HAL庫實現引腳外部中斷 封裝中斷工具函數 快速入門 訪問git倉庫: Guardian-Elf/Guardian-Elf-Embedded 找到並下載中斷工具文件(2個文件:Interrupt.h/.c) 由於我的項目中使用了串口來調試中斷函數,所以如果報錯就把無關的代碼刪除 代碼示例 // 配置GPIOB的1,0引腳 void Interrupt_Servic

操作系統

收藏 評論

MrVolleyball - 追蹤鏈路--使用envoy來記錄後端pod真實ip

前言 之前使用了iptables、ipvs,在數據包的必經之路(POSTROUTING)上攔截並且記錄日誌,本文使用一個比較成熟的組件envoy來記錄後端pod的真實ip 環境準備 環境準備如同之前 ▶ kubectl get pod -owide NAME READY STATUS RESTARTS AGE IP

雲計算

收藏 評論