tag 數據

標籤
貢獻725
473
05:56 PM · Oct 25 ,2025

@數據 / 博客 RSS 訂閱

DoraemonQ - 僅400K的工具,賊牛批

聊一聊 電腦硬盤、U盤等存儲設備常因損壞或升級換代而被更換。很多小夥伴會將舊設備轉賣或丟棄,在這個數字化時代,這些設備中往往存有大量敏感個人信息。僅通過簡單刪除或格式化操作,數據仍可能被專業軟件恢復,存在隱私泄露風險; 分享一款專業的磁盤數據擦除工具:Blank And Secure v8.21; Blank And Secure是一款專業的數據安全刪除工具,主要用於徹底擦除硬盤上的敏感數

隨機數 , 殘留數據 , yyds乾貨盤點 , 數據 , 辦公效率

收藏 評論

程序員小2 - 終於把機器學習中的交叉驗證搞懂了!!

核心思想 在標準的模型訓練中,我們通常會將數據集劃分為訓練集和測試集。訓練集用於模型學習參數,測試集用於評估模型的最終性能。 然而,如果測試集本身具有偏差,或者我們想更精細地調整模型(例如超參數調優),僅僅使用一次劃分可能會導致評估結果不夠穩定或具有過高的方差。 交叉驗證的核心目標是:獲得一個更穩定、更可靠的模型性能估計,減少對特定數據劃分的依賴。 交叉驗

數據集 , 數據 , 交叉驗證 , 代碼人生

收藏 評論

powertoolsteam - 低代碼平台與辦公軟件:協同進化,重塑數字化辦公新生態

低代碼平台與辦公軟件:協同進化,重塑數字化辦公新生態 在數字化轉型加速的今天,辦公場景正面臨從 “工具化” 到 “智能化” 的深刻變革。辦公軟件作為企業日常運營的核心載體,承載着數據記錄、流程協作、信息傳遞等基礎需求;而低代碼平台憑藉 “可視化開發、低門檻構建、高靈活擴展” 的特性,正成為解決辦公軟件定製化難、集成弱、響應慢等痛點的關鍵力量。兩者的協同融合,不僅重構了數字化辦公的技術

數據 , 低代碼 , 拖拽 , 辦公軟件

收藏 評論

資深程序設計 - 基於大數據的信貸風險評估的數據可視化分析與預測系統

1 研究背景 在現代金融市場中,信貸業務作為金融機構的核心業務之一,對於促進經濟增長、推動企業發展以及滿足個人資金需求等方面發揮着至關重要的作用。信貸業務的快速發展也伴隨着信貸風險的不斷積累。信貸風險主要包括信用風險、市場風險和操作風險等,其中信用風險尤為突出。信用風險是指借款人因各種原因未能按時足額償還貸款本息,從而給金融機構帶來損失的可能性。隨着全球經濟形勢的複雜多變、

機器學習 , 信貸分析 , yyds乾貨盤點 , 數據 , 數據可視化 , 後端開發 , Python

收藏 評論

wx63f42b7e9714d - 連續三年拿下全球第一,添可怎麼做到的?

2020年以前,家庭地面清潔是一個被傳統方式固化了半個多世紀的場景。 吸塵器雖然能比掃把清理得更乾淨,但僅限幹垃圾。面對濕垃圾和頑固污漬,需要戴上手套拿着抹布反覆進行清理。拖地本身更是痛點密集:頻繁換洗拖布、用髒水越拖越髒、清潔工具自身還會發黴發臭。 轉折發生在2020年。添可發明芙萬智能洗地機,改寫了地面清潔的底層邏輯。 添可芙萬智能洗地機首次將“吸、

數字化轉型 , 安裝配置 , 數據 , 用户需求

收藏 評論

代碼天地 - AI智能體(Agent)應用開發入門手冊

就目前調研下來的功能來説。開發AI智能體,入門選langchain沒錯,架構很成熟,能力很強,基本上所有的場景都可以覆蓋,可以很好管理起大型的AI應用架構。而且js、java、python各種語言都支持。 上手很快,但是用好的話還是多花些時間學習他的底層實現邏輯。 這篇文檔,會介紹一下AI應用開發的一些基礎知識。 連接模型 MCP的介紹以及如何

服務器 , 數據 , 搜索 , 工作流程 , 分佈式

收藏 評論

是Dream呀 - AI驅動開發新範式:基於 CodeWave 的考勤系統落地實踐

在快節奏的企業軟件開發環境中,如何快速將想法轉化為可執行的代碼應用,成為了每個開發團隊追求的目標。網易CodeWave智能生成應用的出現,為我們提供了一個全新的解決方案——通過自然語言描述快速構建全棧應用,讓開發效率實現質的飛躍。 一、智能生成應用:重新定義開發流程 1.核心功能與價值 網易CodeWave的智能生成應用功能,其核心創新

數據挖掘 , 數據 , 自然語言 , 人工智能 , 主鍵

收藏 評論

wx62088446a1f70 - 多模態深度學習:跨模態理解與生成的融合智能

多模態深度學習:跨模態理解與生成的融合智能 引言 人類通過視覺、聽覺、觸覺等多感官通道協同理解世界,而當前AI系統大多侷限於單一模態處理。多模態深度學習通過建立跨模態的聯合表徵與轉換機制,正推動人工智能向更接近人類認知方式的方向演進。本文將深入探討多模態深度學習的核心算法、統一框架、訓練範式以及前沿應用,呈現這一跨領域研究方向的最新進展與未來趨勢。 一、多模態表徵學習 1

數據 , 深度學習 , 代碼人生 , 模態

收藏 評論

叫做長大จุ๊บ - 文心 5.0 登場:打破邊界,定義未來智能新範式,開啓原生全模態智能新時代!

作為一名每天與代碼為伴、重度依賴AI工具的開發者,我經歷過從早期語言模型的稚嫩,到如今大模型混戰的喧囂。就在剛剛GPT推出了5.1而百度推出了文心5.0,當看到ERNIE 5.0發佈時,我的第一反應是:又一個版本更新?但在深入瞭解後,我必須承認——這次,真的不一樣。 一、重新定義"全模態":從概念到生產力 看看這個界面: 文檔區:圖片、

AIGC二三事 , 文心一言 , 數據 , aigc , 開發者 , 模態 , 百度

收藏 評論

feiry - 詳解Hive窗口函數及10道實戰練習

📑 目錄(Table of Contents) 一、示例數據 二、常見窗口函數詳解 1. ROW_NUMBER 2. RANK 3. DENSE_RANK 4. SUM OVER 5. AVG OVER 6. LAG 7. LEAD 8. FIRST

大數據 , 數據 , hive , 面試 , 窗口函數

收藏 評論

架構師李哲 - PPO最強,DPO一般?一文帶你瞭解常見三種強化學習方法,文末有大模型微調神器!

很多人第一次接觸各家大模型時,都會覺得它們的回答能帶來意想不到的驚喜,但有時,AI回答又怪怪的、囉嗦、甚至有點危險。 這背後,其實就是一個核心問題:對齊(Alignment)。 預訓練讓模型會“説話”,但對齊訓練,才讓模型更符合人類偏好:更有用、更安全、更有温度。在當下的大模型時代,有三種常被提到的對齊方法:PPO、DPO和KTO。 本期,LLaMA-F

強化學習 , 數據 , 損失函數 , 人工智能 , 深度學習

收藏 評論

字節小舞神 - 【論文閲讀】Swin Transformer Embedding UNet用於遙感圖像語義分割_swin transformer和unet

論文鏈接:https://arxiv.org/pdf/2402.03302 Code: https://github.com/JiarunLiu/Swin-UMamba 摘要: 醫學圖像分割的挑戰在於需要同時整合多尺度信息,從局部細節到全局依賴關係。但現有方法難以有效建模長距離的全局信息:

數據集 , 論文閲讀 , 圖像分割 , 數據 , 雲計算 , OpenStack

收藏 評論

16213681 - Apollo代碼學習(六)—模型預測控制(MPC)_模型預測控制代碼

第1章:避障狀態機 想象我們擁有一架超級智能的無人機,它可以完全自主飛行 現在,假設這架無人機需要穿過一個擺滿傢俱的雜亂房間,或者在有許多樹木的森林中導航,而且不能發生碰撞。 它是如何知道每個時刻該做什麼的?當出現障礙物時,它如何決定何時起飛、何時前進或何時減速? 這就是**避障狀態機(AvoidanceStateMachine)**的用

狀態機 , 無人機 , 數據 , Css , 前端開發 , HTML

收藏 評論

jkfox - XXTea加密的使用

XXTEA加密解密的快速入門,離不開極簡代碼的助力。本文將用簡潔的代碼示例,為你梳理XXTEA的加密解密流程,從基礎原理到代碼實現,層層遞進,讓你輕鬆上手,快速掌握XXTEA的核心技能。 XXTEA(eXtended eXtended Tiny Encryption Algorithm)是一種輕量級的對稱分組加密算法,由David Wheeler和

字符串 , 數據 , 16進制 , Css , 前端開發 , HTML

收藏 評論

u_13778063 - 為什麼 RAG 落地難?解析數據處理 “三重困境”,事件驅動架構如何破局?

作者:稚柳 前言 當企業想用大模型和內部非公開信息打造智能問答系統時,RAG(Retrieval-Augmented Generation,檢索增強生成)已成為必備技術。然而,在實際落地中,構建 RAG 應用的數據準備過程繁瑣複雜且充滿挑戰,讓很多企業和開發者望而卻步。本文將介紹構建 RAG 的最佳實踐:通過阿里雲事件總線 EventBridge 提供的多源 RAG

EventBridge , 數據 , 雲計算 , 阿里雲 , 雲服務 , 數據處理 , 結構化

收藏 評論

袋鼠雲數棧 - 某頭部能源集團“數據治理”到“數智應用”躍遷案例剖析

本案例詳細闡述了某能源集團在數據治理與指標體系建設中的實踐歷程,以及如何通過AI技術賦能指標應用,實現從"數據治理"到“數智應用”的關鍵躍遷。案例聚焦項目經營管理為主線,同時涵蓋合同、採購、合規、財務等多業務領域,系統展示了企業如何通過指標體系建設與AI融合應用,解決數據分散、語義混亂、流程不貫通、指標失真等核心痛點,最終構建起全域數據資產的標準化、結構化、貫通化治理能力。 集團痛點深度剖析 火電

數字化轉型 , 能源 , data , 數據 , 指標平台

收藏 評論

百度Geek説 - 維度爆炸背景下uv計算在Feed業務的高效實踐

導讀 本文介紹了優化大數據計算中多維度用户數統計的方法,通過數據打標的方式避免數據膨脹,提高性能並減少計算成本。首先分析了大數據計算中遇到的多維度數據統計問題,然後提出了利用數據打標進行處理的解決方案,詳細闡述了優化方案的實施步驟和效果。通過對比實驗結果,驗證了優化方案在提升性能和降低成本方面的顯著效果。最後,總結了優化方案的優勢和適用場景。 01 背景 Feed是百度App的一個重要業務組成部分

大數據處理 , 數據 , uv

收藏 評論

AI領域佈道師 - 數據入湖 架構

作者 | 蔡芳芳 採訪嘉賓 | 馬進 網易數帆平台開發專家 數據中台也要從離線為主走向實時化,湖倉一體是第一步。 數據從離線到實時是當前一個很大的趨勢,但要建設實時數據、應用實時數據還面臨兩個難題。首先是實時和離線的技術棧不統一,導致系統和研發重複投入,在這之上的數據模型、代碼也不能統一;其次是缺少數據治理,實時數據通常沒有納入

數據 , 數據入湖 架構 , 離線 , 架構 , 後端開發 , 解決方案

收藏 評論

mob64ca14116c53 - QMS-雲質-企業數字化轉型-企業質量數字化案例_質量數碼化

一、數字化轉型背景下的質量管理挑戰 隨着工業4.0時代的深入推進,製造企業面臨的質量管理環境日益複雜。傳統依賴紙質記錄與Excel表格的管理模式存在顯著缺陷:數據完整性不足、人為錯誤頻發、信息孤島林立。據統計,一家中等規模的製造企業通常需要管理超過1萬種原材料,若持續採用人工記錄方式,不僅效率低下,更難以保障數據的準確性與可追溯性。例如,質量信息分散在研發、生產

spark , 大數據 , 數據 , 項目經理 , 質量管理

收藏 評論

wx6218aeded7a51 - 簡易睡眠分析儀

代碼功能概述 這段代碼實現了一個智能睡眠質量分析器應用,專注於監測、分析和改善用户的睡眠質量。主要功能包括: 睡眠記錄追蹤:記錄每日睡眠時間、入睡時間和醒來時間 睡眠質量評估:基於多個維度自動評估睡眠質量 睡眠週期分析:分析深睡、淺睡和REM睡眠分佈 睡眠環境監測:記錄卧室温度、光照和噪音水平 智能建議系統:根據睡眠數據提供個性化改善建議 睡眠

華為 , 微信開發 , 移動開發 , 數據 , lua , text , harmonyos

收藏 評論

blueice - go語言併發原理和機制【二】

目錄 Go語言協程機制詳解 一、協程的基本概念與特點 二、GPM調度模型詳解 1. GPM模型組成 2. 調度機制 3. 調度模型參數 三、協程間通信方式 1. Channel通信 2. 共享內存與鎖 3. 條件變量

sed , 數據 , Css , 前端開發 , go , HTML

收藏 評論

angel - AI:大力出奇跡?Bigger is better?AI下一代浪潮?—人工智能的大語言模型(LLMs)的簡介、發展以及未來趨勢

岐金蘭指出了一個根本性的方向:下一代AI的突破,將不再侷限於“語言理解”的範式內優化,而是邁向“行為理解與生成”的新範式——即“大行為模型”。 這並非簡單的技術升級,而是一場認知架構的範式革命。 以下是對這一構想的剖析與延伸: 一、核心理念:從“符號世界”到“行為世界” · 大語言模型(LLM)的本質侷限:當前LLM本質上是符號(語言)

數據 , 後端開發 , 行為模型 , 原語 , Python

收藏 評論

ceshiren2022 - 【乾貨】如何從軟件測試轉型為AI測試開發?這份面試題指南值得你一看!

你是軟件測試從業者,但想轉向人工智能測試開發崗位嗎? AI 測試崗位不僅考察傳統測試技能,還要求你理解 AI/ML 模型特性、設計測試流程、編寫自動化腳本。 今天,我們整理了一份面試題,從基礎概念到實戰場景,幫你快速掌握 AI 測試面試要點。 一、基礎認知題:AI 面試入門必備 AI、ML、DL 的區別? • ML 是 AI 的子集,通過數據學習規律; • DL 是 ML

面試題 , 數據 , 人工智能 , 深度學習 , 灰度 , ML

收藏 評論

拓端tecdat - 專題:2025中國醫療器械出海現狀與趨勢創新發展研究報告|附160+份報告PDF、數據、可視化模板彙總下載2025全球醫療器械報告-創新與效率平衡之道320+份彙總解讀|附PDF下載

2024年,中國醫療器械行業正站在“從本土領先到全球突圍”的關鍵節點——一邊是邁瑞醫療把監護儀賣到190多個國家,海外營收佔比超48%;一邊是不少企業卡在歐盟MDR認證環節,臨牀數據補了3次仍未通過。這種“一邊風光一邊難”的反差,本質是全球醫療需求擴張與國內競爭加劇的必然結果。 引言 從核心數據看,2024年全

大數據 , 數據 , 腦機接口 , pdf , 人工智能 , 前端開發 , Javascript

收藏 評論