tag 數據

標籤
貢獻724
424
05:56 PM · Oct 25 ,2025

@數據 / 博客 RSS 訂閱

夜行者3號 - 常見的數據脱敏方法介紹_脱敏算法

寫這篇文章的起因很方便:我們在表格裏頻繁會處理手機號、身份證號、郵箱、地址等敏感信息,發給外部前最好做一層“看得見、可追溯、保留原始”的脱敏處理。WPS 表格能很穩地完成這件事,而且不需安裝繁瑣插件。下面我把常用方法和踩坑點整理出來,給到一份能直接拿去用的操作手冊。 具體操作步驟 比如我們需將手機號進行脱敏。 脱敏有兩種方案, 函數法和飛快填

批量處理 , 數據 , 原始數據 , 前端開發 , Javascript

收藏 評論

xjsunjie - 不是數據越多越好,而是數據質量越高越強:構建企業高質量數據集的五大認知革命

引言 在數字化轉型加速背景下,企業普遍將數據規模作為能力指標,卻忽視了數據質量對決策效能的根本性制約。 本文基於真實企業實踐與數據治理框架(DAMA-DMBOK、DCMM、ISO 8000),系統提出構建高質量數據集的五大認知革命:從“數據量優先”轉向“關鍵數據可信”、從“IT主導”轉向“業務主責”、從“事後清洗”轉向“流程嵌入”、從“追求完美”轉向“場景化閾值”、從

it , yyds乾貨盤點 , 數據 , 數據質量 , 人工智能 , 數據分析

收藏 評論

mob64ca140d96d9 - token存在sessionStorage裏瀏覽器手動刷新後接口裏token就沒了

一、三者的定義 Cookie是瀏覽器用來保存用户信息的文件,可以保存比如用户是誰,購物車有哪些商品等。 Session是一次會話,會話是指我們訪問網站的一個週期。 比如用户打開一個瀏覽器訪問某個位的站點。 在這個站點點擊多個超鏈接查看各個網頁,然後關閉瀏覽器,整個過程稱之為一個會話。 token是服務器返回的一個臨時簽名數據,

服務器 , 數據 , 服務器端 , 架構 , 後端開發

收藏 評論

Chikaoya - R語言21天學習計劃 - 第七天:機器學習入門

📚 今日目標 理解機器學習基本概念和分類 掌握數據預處理與特徵工程 學習監督學習基礎算法 瞭解無監督學習方法 掌握模型評估與驗證技術 🤖 第一部分:機器學習基礎 1.1 機器學習概述 # 機器學習是讓計算機從數據中學習規律的方法 # 主要類型: # 1. 監督學習:有標籤數據 # 2. 無監督

隨機森林 , 決策樹 , 數據 , AI寫作 , aigc

收藏 評論

上海拔俗網絡 - AI 行為分析系統:從“行為識別”到“風險與決策支持”的工程實踐

在很多項目中,“行為分析”最初被理解為一件相對直接的事情: 採集行為數據 用模型做分類或識別 輸出標籤或結果 但一旦進入真實業務場景,很快就會發現問題: 單次行為識別價值有限 行為結果波動大、誤判率高 不同行為之間缺乏上下文關聯 分析結果難以支撐實際決策 這説明一個事實: AI 行為分析系統的核心價值,

模式識別 , 建模 , 數據 , NLP , 人工智能

收藏 評論

煜見Ai未來 - 馬斯克560億對賭背後:2026-2030,普通人最後的翻身窗口

凌晨又被社羣消息炸醒 😮💨 有人轉了馬斯克那個 560 億美金薪酬方案通過的新聞… 我當時就懵了。 4000 多億人民幣… 沙特一年 GDP 才 1 萬億… 這錢夠我買多少個 Claude 訂閲了??(省錢人的第一反應🤣) 好多人以為是獎勵過去的功勞… 害… 我熬夜看完那 3 小時訪談(開倍速都看不完,困死),背後涼颼颼的…這哪是發工資,這明擺着是梭哈啊 🎰

機器學習 , AIGC二三事 , 數據 , 產品經理 , 人工智能 , 原型圖

收藏 評論

mob64ca12f31496 - Extracting Training Data from Diffusion Models

Extracting Training Data from Diffusion Models 在當今的機器學習領域,擴散模型因其強大的生成能力而受到廣泛關注。一個核心問題則是如何提取這些模型的訓練數據。這篇博客將詳細記錄解決“Extracting Training Data from Diffusion Models”這一問題的過程,內容包括環境準備、分步指南、配置詳解、驗證測試、優

data , 數據 , aigc , Python

收藏 評論

14224 - k8s etcd存儲原理

要將 Kubernetes 的 Event 資源單獨存儲到一個獨立的 etcd 集羣,只需在 kube-apiserver 的啓動參數中增加 --etcd-servers-overrides 配置即可,無需遷移數據或重啓其他組件。 配置步驟 部署一套獨立的 etcd 集羣,用於專門存儲 Event 數據。假設該集羣的訪問地址為: https://etcd-e

數據 , 後端開發 , 重啓 , ide , Python

收藏 評論

mob64ca12d70c79 - ollama配置優先使用的gpu

在當今的 IT 領域,GPU 的高效利用成為了推動計算性能的關鍵。對於使用 Ollama 的開發者來説,正確配置其優先使用的 GPU 是提高模型推理性能的一個重要步驟。在本文中,我將詳細記錄如何解決“ollama配置優先使用的gpu”這一問題的過程。 環境準備 在配置之前,我們需要為後續的操作做好準備,確保所有軟件和硬件的配合都能有效地發揮性能。 首先,需要安裝必要的前置依賴

數據 , 配置文件 , aigc , CUDA

收藏 評論

TDengine濤思數據 - 攜手桂冠電力、南網儲能、中能拾貝,TDengine 三項案例入選“星河獎”

12 月 18 日,2025 數據資產管理大會在北京盛大召開,大會現場重磅揭曉了數據智能 “星河(Galaxy)” 案例評選結果。濤思數據攜手廣西桂冠電力股份有限公司、中能拾貝科技有限公司、南方電網儲能股份有限公司信息通信分公司聯合申報的三項案例,從超 930 份申報項目中脱穎而出,成功入選 “星河(Galaxy)” 案例榜單。 對濤思數據來説,這不是“多拿了三張證書”這麼

大數據 , 數據 , 數據倉庫 , 時序數據庫 , 數據庫

收藏 評論

智慧園區探索者 - 重回單體,真的不是技術倒退

軟件技術發展這麼多年,我們經歷了單體,再到SOA,再到微服務的架構轉變,這些變化的實踐發起者都是用户規模龐大的大型企業,引來行業無數中小公司的效仿。可近些年出現了這樣一個現象。那些已經遷移到微服務的公司,逐漸在試着迴歸單體架構。這不僅是中小公司的選擇,像亞馬遜、字節跳動、阿里、騰訊甚至谷歌都在這樣做。 要想弄懂這種轉變的背後底層邏輯,我們必須清楚以下幾個點,微服務流行的契機

數據 , 微服務 , 運維 , 後端開發 , harmonyos

收藏 評論

京東雲開發者 - SQL 抽象語法樹及改寫場景應用

1 背景 我們平時會寫各種各樣或簡單或複雜的sql語句,提交後就會得到我們想要的結果集。比如sql語句,”select * from t\_user where user\_id 10;”,意在從表t\_user中篩選出user\_id大於10的所有記錄。你有沒有想過從一條sql到一個結果集,這中間經歷了多少坎坷呢? 2 SQL引擎 從MySQL、Oracle、TiDB、CK,到Hive、HBa

字符串 , 數據 , 抽象語法樹 , sql語句 , SQL

收藏 評論

mob64ca13f7ecc9 - 基於混沌系統的文本加密算法研究(一)——混沌及混沌加密的基礎知識_文本加密和圖像加密有什麼區別

基於混沌加密的OFDM系統實現,包括混沌序列生成、加密算法設計以及完整的OFDM系統集成 1. 混沌系統與序列生成 1.1 多種混沌系統實現 classdef ChaosEncryption % 混沌加密系統 methods (Static) function sequence = logistic_map(x

數據 , 構造函數 , 後端開發 , bc , Python

收藏 評論

南大通用GBase - 南大通用GBase 8c邏輯複製槽實踐解析

GBase 8c的邏輯複製槽功能是實現實時數據複製的核心組件,它通過解析事務日誌(xlog)生成邏輯變更流,為異構數據庫同步提供基礎支持。邏輯複製槽代表一個數據更改流,確保事務按原始順序在目標端重放。它主要作用是防止所需的事務日誌被系統回收,為邏輯解碼提供穩定的日誌源。 核心特性 事務級解碼:以事務為單位輸出邏輯日誌,僅在事務提交後解碼 異構數據庫支持:降低對目

數據 , MySQL , 異構 , 數據庫 , GBase 8c

收藏 評論

bigrobin - 冗餘的索引對插入的效率影響有多大

本文主要討論四個問題: (1)為什麼會有冗餘表的需求 (2)如何實現冗餘表 (3)正反冗餘表誰先執行 (4)冗餘表如何保證數據的一致性 一、需求緣起 互聯網很多業務場景的數據量很大,此時數據庫架構要進行水平切分,水平切分會有一個patition key,通過patition key的查詢能夠直接定位到庫,但是非pati

消息總線 , 冗餘的索引對插入的效率影響有多大 , 大數據 , 數據 , 離線 , 數據倉庫

收藏 評論

數據科學家 - 使用Riverpod的Flutter和Firebase應用程序的初始架構

FlutterFire實時應用架構:基於Firebase的應用設計 【 在移動應用開發中,實時數據同步和高效的後端服務集成是提升用户體驗的關鍵。FlutterFire作為Firebase官方提供的Flutter插件集合,為開發者提供了一站式解決方案,涵蓋身份驗證、數據庫、存儲、消息推送等核心功能。本文將深入探討如何基於FlutterFire構

數據 , 離線 , firebase , 前端開發 , Javascript

收藏 評論

mob64ca13f7ecc9 - Linux 進去Spark sql

Tom,DataBase,80 Tom,Algorithm,50 Tom,DataStructure,60 Jim,DataBase,90 Jim,Algorithm,60 Jim,DataStructure,80 ....... 根據給定的數據在spark-shell中通過編程來計算以下內容 (1) 該系總共有多少學生;

spark , 大數據 , 數據 , Linux 進去Spark sql , SQL

收藏 評論

flybirdfly - knn近鄰分類算法k值大值

k-近鄰算法原理 K-近鄰算法採用測量不同特徵值之間的距離方法進行分類。 • 優點:精度高、對異常值不敏感、無數據輸入假定。 • 缺點:時間複雜度高、空間複雜度高。 適用數據範圍:數值型和標稱型。 工作原理 存在一個樣本數據集合,也稱作訓練樣本集,並且樣本集中每個數據都存在標籤,即我

機器學習 , 數據集 , 樣本集 , 數據 , 算法 , knn近鄰分類算法k值大值 , 人工智能

收藏 評論

mb6911caa73d1d1 - 從實戰出發:數字孿生如何重塑國防航天運維效率

作為一名在國防航天領域工作多年的工程師,我親歷過無數挑戰:複雜的設備監控、緊急的故障排查、以及瞬息萬變的戰場環境模擬。過去,我們依賴傳統系統,常常在數據孤島和響應延遲中掙扎。直到我們引入了一套創新的數字孿生平台—孿易IOC,才真正實現了運維的智能化轉型。今天,我想分享我們的實戰經驗,希望能為同行們提供一些啓發。 一、全面監測:讓複雜運維變得直觀高效

數據 , 運維 , 數據可視化 , 人工智能 , 數字孿生 , 實戰經驗

收藏 評論

阿森CTO - C++ IO流

@TOC 一、C語言的輸入輸出機制 C語言中,輸入輸出主要依賴scanf() 和printf() 兩個核心函數。 scanf():從鍵盤等標準輸入設備讀取數據,將其存儲到指定變量中。 printf():將格式化後的內容輸出到屏幕等標準輸出設備。 C語言的輸入輸出依賴緩衝區實現,其核心作用有兩點: 屏蔽低級I

大數據 , yyds乾貨盤點 , 輸入輸出 , 字符串 , 數據 , 數據倉庫

收藏 評論

mob64ca1406d617 - sqluldr2導入hive

由於從老系統導數據是通過excel表的方式導出的,裏面數據有幾十萬條數據,如果只是簡單通過複製黏貼的方式複製到數據庫中,那麼這個過程將會非常耗時和繁瑣的。於是就去研究了下sqlloader如何使用,經過研究後發現這個方法非常管用,就記錄下來供大家參考參考 第一步:整理Excel表格的數據如下: excel表格的數據列分別對應數據庫表的字段(注意:順序一定要嚴格按照數據

大數據 , 數據 , hive , 加載 , sqluldr2導入hive , SQL

收藏 評論

mob64ca1408d5ff - 處理可變長度輸入強化學習

固定長度的數據結構很簡單,大家每天都在用。 可變長度數據結構,都可以通過內嵌對象的形式,轉化成固定長度的數據結構,大家每天也都在用,例如: struct person { int id; string name; string address; }; 每個 person 對象的長度是固定的,但是,其

機器學習 , 字段 , 處理可變長度輸入強化學習 , 數據 , 數據結構 , 人工智能

收藏 評論

智能創新夢想家 - 結合RBAC模型講解權限管理系統需求及表結構創建 - 字母哥博客的個人空間 -

hsweb-framework是一個基於Spring Boot 2.x開發的全響應式企業級後台管理系統,其權限管理功能支持RBAC模型和數據權限控制,為企業應用提供完整的安全解決方案。 🎯 權限管理核心功能 hsweb-framework的權限模塊提供了強大的安全保障,主要包含以下核心功能: RBAC權限控制:基於角色的訪問控制,實現精細化的

權限控制 , 權限管理 , 數據 , Css , 前端開發 , HTML

收藏 評論

戀上一隻豬 - 最強最全面的大數據SQL面試題和答案【四】

真題題目: 真題一: movie category 《阿凡達2》 懸疑,動作,科幻,劇情 《滿江紅》 懸疑,警匪,動作,心理,劇情 《流浪地球》 科幻,動作,災難 得到如下數據: 《阿凡達2》 懸疑 《阿凡達2》 動作 《阿凡達2》 科幻 《阿凡達2》 劇情 《滿江紅》 懸疑 《滿江

數據 , hive , 面試 , 後端開發 , 職場和發展 , Json , Python

收藏 評論