tag 數據

標籤
貢獻724
435
05:56 PM · Oct 25 ,2025

@數據 / 博客 RSS 訂閱

DeepSeaAI - 金融行業大模型微調

針對銀行和金融行業專有詞彙標準化系統 注意:在醫療領域,由於涉及隱私,我們需要確保使用公開數據或合成數據。 一、大模型微調方案選擇 推薦方案:混合策略微調 1. 監督微調(SFT) + 檢索增強(RAG)結合 - SFT微調:增強基礎理解能力 - RAG檢索:確保標準化準確性 2. 多階段微調流程: ├── 第一階段:領域預訓練 ├── 第二階段:任

數據 , 神經網絡 , 相似度 , 人工智能 , Python

收藏 評論

雲端創新夢想家 - 數據卷中容器路徑和子路徑

一、數據卷 數據卷使用和作用: 宿主機目錄/var/www掛載容器中的/data1,/var/www 和 /data1,即可共享和同步彼此的目錄文件。 原理圖: 實例 #運行centos:7容器,創建數據卷,並進入容器,web10為容器名 [root

數據 , 雲計算 , 數據卷中容器路徑和子路徑 , 運維 , Centos , 雲原生 , Docker

收藏 評論

十月南城 - 高可用架構速覽——主從、哨兵與 Cluster 的角色分工與故障轉移路徑

從數據備份到故障自動恢復,再到無限水平擴展,Redis 高可用架構的演進之路 在單機 Redis 面臨性能瓶頸和單點故障的風險下,構建高可用架構成為保障業務連續性的關鍵。本文將深入解析 Redis 的三種高可用架構方案——主從複製、哨兵模式和 Cluster 集羣,揭示它們各自的設計哲學、適用場景及故障轉移機制,幫助您在業務發展不同階段做出正確的技術選型。 1 高可

redis , 數據 , 架構 , 後端開發 , 主從複製

收藏 評論

u_17398972 - Catlass自定義算子開發:從模板到高性能實現

在昇騰(Ascend)平台上開發高性能算子時,我們往往會面臨一個選擇:是使用 TIK C++(原 Ascend C)從零開始手寫每一行代碼,還是尋找更高效的捷徑?而在昇騰生態中,Catlass 正是這樣一個讓高性能算子開發變得熟悉又高效的工具。 Catlass 是昇騰官方推出的算子模板庫,它的核心理念非常直接:不要重複造輪

矩陣乘法 , 數據 , cmake , c++ , 後端開發 , c

收藏 評論

gulaotou - grafana node export full面板中哪個指標是查看磁盤IO的

day25學習筆記(4月7日) 磁盤管理二(inode、軟鏈接、硬鏈接、Raid磁盤冗餘陣列) 文件屬性的查看 方法一: ls -l filename 方法二: stat filename inode是什麼 操作系統中專門用於管理和存儲文件的信息軟件成為文件系統 一個新的磁盤,格式化文件系統後,就有

數據 , 雲計算 , 源文件 , 雲原生 , 硬鏈接

收藏 評論

燕鵬01 - Python數據分析入門指南(十九):自動化你的分析流程

在數據科學的研究道路上,我們經常會遇到重複性的分析任務。無論是處理每日更新的温度數據,還是對多個數據集執行相同的預處理流程,手動重複操作不僅效率低下,還容易出錯。今天,我們就來探討如何通過Python實現分析流程的自動化,讓你的研究工作事半功倍。 為什麼需要自動化分析? 對於正在進行畢業論文研究的你來説,時間是最寶貴的資源。想象一下,當你需要處理幾十個城市多年的温度觀測數據時,如

數據 , 後端開發 , 數據分析 , Python

收藏 評論

上海拔俗網絡 - 施工管理AI智能體:用技術破解工地“人盯人”困局

工地管理總繞不開“亂、慢、險”:進度靠表格追、安全靠人眼查、質量靠經驗判,稍有疏忽就可能出問題。而施工管理AI智能體應用系統,就像給工地配了個“全能技術管家”,靠實實在在的技術手段,把施工管理從“被動補救”變成“主動預判”。今天就拆解開,看看它背後的技術邏輯。 核心技術之一是計算機視覺識別,相當於給工地裝了“智能眼睛”。系統會在塔吊、腳手架、施工通道等關鍵區域部署高清攝像頭,通過“實

數據 , NLP , 推送 , 人工智能 , 計算技術

收藏 評論

goody - Pandas——進階一(數據處理)_SongpingWang的技術博客

終極命令行數據探索:VisiData與Pandas數據幀的完美融合方案 在當今數據驅動的世界中,數據分析師和Python開發者經常需要在命令行快速探索數據,同時又要與強大的Pandas生態系統無縫集成。VisiData正是這樣一個完美的解決方案,它作為一個終端界面工具,為探索和操作表格數據提供了前所未有的便利。 🚀 什麼是V

命令行 , 數據 , 數據格式 , 前端開發 , Javascript

收藏 評論

mob649e81684ddc - jstable亞組分析 logistic迴歸

jstable亞組分析 logistic迴歸是一個在統計和計算機科學領域中廣泛應用的分析方法,尤其是在醫學研究和社會科學中。本文將詳細介紹如何進行jstable亞組分析的logistic迴歸,包括環境準備、集成步驟、配置詳解、實戰應用、排錯指南以及性能優化等各個方面。 環境準備 在進行jstable亞組分析的logistic迴歸時,確保你的技術棧兼容性是至關重要的。以下是推薦的技

技術棧 , 數據 , logistic迴歸 , aigc

收藏 評論

qq68d2318712d49 - 介紹一下Python的核心數據結構

Python 的核心數據結構是內置的基礎存儲容器,設計簡潔且功能強大,覆蓋了絕大多數編程場景的需求。它們的核心特點是 “開箱即用、高效靈活” ,主要包括 列表(List)、元組(Tuple)、字典(Dictionary)、集合(Set) ,再加上基礎的字符串(String),共同構成了 Python 數據處理的基石。 以下從 定義、核心特性、常用操作、適用場景 四個維度,詳

字符串 , 數據 , 元組 , Css , 前端開發 , 後端 , HTML

收藏 評論

陌陌香閣 - centos7查找壓縮文件

命令路徑查找 which whereis 文件名查找路徑 locate命令 前提:更新或者創建數據庫文件 文件查找 find命令 linux系統中,文件類型不是由擴展名決定的 linux系統文件類型: 1)普通文件: 文本文件 二進制文件/命令文件 數據

數據 , 架構 , 後端開發 , Linux , 壓縮包 , centos7查找壓縮文件

收藏 評論

一線數智 - AI 項目越做越亂?你缺的其實是新一代數據治理體系

【一線數智評論】最近在梳理客户標籤時發現,基於過去的大數據的客户標籤算法和管理方式,在今天有AI加持下,多模態的數據管理,存在缺失,AI時代,數據治理必須重做一遍   過去十幾年,企業對“數據治理”的理解大多停留在:建數據倉庫、做數據質量、統一指標口徑、管權限、查血緣。   這當然重要,但在 AI 浪潮面前,這套思維已經不夠用了。   因為今天企業面臨的是:

大數據 , 數據 , 數據倉庫 , 自動生成 , 模態

收藏 評論

wx6466f25322644 - 大語言模型Ll M 這張圖的核心信息是:隨着模型規模變大,注意力(attention)層消耗的 FLOPs 佔比越來越高,而 MLP 層佔比反而下降。

這張圖的核心信息是:隨着模型規模變大,注意力(attention)層消耗的 FLOPs 佔比越來越高,而 MLP 層佔比反而下降。 一、FLOPs 是什麼? FLOPs(Floating Point Operations)是浮點運算次數,衡量模型計算量的單位。FLOPs 越高,訓練或推理所需的計算資源越多。 二、圖中數據解讀

複雜度 , 數據 , 浮點運算 , 後端開發 , 人工智能 , Python

收藏 評論

一線數智 - AI時代 客户標籤體系為什麼必須重做?

  【一線數智資訊】在過去十多年的移動互聯網年代,客户運營一直圍繞“標籤”展開:年齡、性別、消費頻次、品類偏好……,基於大數據的標籤same like方式推薦,但當企業進入 AI 原生時代,大模型、向量數據庫、智能體開始走進業務,傳統標籤體系正在快速失效。   不是傳統標籤不重要,而是客户已經變了,業務節奏變了,而標籤體系沒變就會有問題。所以就出現了

靜態屬性 , 數據 , 自動生成 , 人工智能 , 深度學習

收藏 評論

全棧技術開發者 - 如何理解「128倍更少數據,卻能獲得更強智能體行為」?如何直觀地理解「少即是多(Less is More)」在智能體訓練中意義?

在人工智能尤其是智能體訓練領域,數據量的需求長期被認為是提升模型行為表現的核心驅動力。傳統強化學習方法和深度學習策略普遍依賴大量訓練數據,以期覆蓋智能體在複雜環境中可能遇到的各種狀態和動作組合。這種大規模數據驅動的訓練模式在某種程度上保證了智能體策略的穩健性和泛化能力,但同時也帶來了顯著的資源消耗、計算壓力以及訓練效率低下的問題。尤其在高維環境和複雜任務下,數據量呈指數級增長,訓

yyds乾貨盤點 , 數據 , 模塊化 , 人工智能 , 深度學習 , 子任務 , 大模型

收藏 評論

feiry - 秋雲圖表 撐滿容器

摘要:華為雲站點數字化平台CloudMap攜手華為雲圖引擎GES打造雲服務全棧拓撲,網絡流量路徑和雲服務動態依賴等空間關係數據,支撐現網運行態風險識別和分鐘級定位定界,構建業界領先的數字化能力。 作者:HWCloudAI 。 隨着雲計算產業的蓬勃發展,站點數字化進程方興未艾,如何管理雲站點中數目眾多的雲資源和日益複雜的關係數據,通過數字化技術提前識別

數據 , 雲計算 , 運維 , 秋雲圖表 撐滿容器 , 雲服務 , 雲原生

收藏 評論

網絡小墨舞風 - 【可視化】箱型圖(箱線圖)介紹和使用_可視化箱型圖

箱型圖法則是數據處理領域中用於識別異常值(outliers)的經典統計方法,其核心邏輯基於信息的四分位數(quartile)分佈特徵,藉助量化數據的離散程度來界定正常信息與異常值的邊界,具有客觀、高效且易操控的特點,被廣泛應用於數據分析、質量控制、金融風控等多個領域。 一、關鍵統計指標 箱型圖法則的應用首先需明確兩個關鍵統計指標——四分位數,即下四分位數(Fi

補全 , 數據 , 線性插值 , Css , 前端開發 , HTML

收藏 評論

事辯天下 - 數據驅動人力資源新生態:從“人才星球”啓航到“數紐中心”揭牌

數據要素正以前所未有的力量重塑產業格局,人力資源領域率先迎來關鍵突破。在短短兩天內,一場圍繞“數據驅動”的系列重磅活動在上海舉行,從民間生態的盛大啓航到官方平台的權威賦能,清晰勾勒出人力資源產業轉型升級的未來路徑,標誌着行業正式邁入“星聯數紐”的新紀元。 11月12日:生態聚變,“人才星球”啓航共創產業新生態 系列活動的序幕,於11月12日在上海張江V

大數據 , 數據 , 數據倉庫 , 解決方案 , 數據驅動

收藏 評論

技術員阿偉 - 《LLM零開銷抽象與插件化擴展指南》

許多高層語言構建的LLM方案,雖能通過靈活封裝適配複雜架構,卻因抽象層的運行時開銷、硬件調用的中間損耗,導致實際推理效率大打折扣,尤其在高併發、資源受限場景下,這種損耗會被無限放大。而C++的核心價值,正體現在其“零開銷抽象”與“硬件級可控”的雙重特性上:它既能夠以接近彙編的底層效率直接操作CPU、內存、緩存等硬件資源,又能通過泛型編程、強類型系統構建靈活的抽象層,無需額外 ru

封裝 , yyds乾貨盤點 , 數據 , 緩存 , c++ , 後端開發 , c

收藏 評論

墨染青絲 - Temporal Table Function Join實現

在做這個Join查詢的時候,必然涉及數據,我這裏設計了2張表,分別較data.txt和info.txt,字段之間以/t劃分。 data.txt內容如下: 201001 1003 abc 201002 1005 def 201003 1006 ghi 201004 1003 jkl 201005 1

機器學習 , 字段 , 數據 , text , 人工智能

收藏 評論

芯動大師 - 機器人SLAM建圖與自主導航:從基礎到實踐

前言 這篇文章我開始和大家一起探討機器人SLAM建圖與自主導航 ,在前面的內容中,我們介紹了差速輪式機器人的概念及應用,談到了使用Gazebo平台搭建仿真環境的教程,主要是利用gmapping slam算法,生成一張二維的仿真環境地圖 。我們也會在這篇文章中繼續介紹並使用這片二維的仿真環境地圖,用於我們的演示。 教程 SLAM算法的引入 (1)SLAM:S

yyds乾貨盤點 , 數據 , 二維 , 激光雷達 , 人工智能 , 數據結構與算法

收藏 評論

合合信息解決方案 - 財務如何自動從大量發票中提取關鍵信息

財務人員在發票處理中的核心痛點 在企業日常運營中,財務人員始終面臨着海量發票處理的沉重壓力,傳統人工處理模式下的痛點愈發突出,嚴重製約了財務工作效率與質量。 首先是處理效率低下。企業經營過程中,員工報銷、採購結算等場景會產生大量發票,這些發票版式各異,既有國內增值税專票、普通發票,也有海外各類票據,財務人員需逐張手動甄別發票類型、錄入開票日期、金額、税號等關鍵信息,面

機器學習 , 字段 , 表單 , 數據 , 人工智能

收藏 評論

wx6916e0c04eaf5 - 中大型企業HRD選型指南:7款AI人力資源平台功能與落地評估

摘要:本文圍繞中大型企業HRD的選型場景,從業務複雜度、數據基礎、生態集成、AI治理與安全、組織變革與採用率、TCO與ROI等維度,給出紅海雲、sap等7類AI人力資源平台的功能核驗點與落地評估框架,幫助實現從事務處理到戰略賦能的躍遷。本文屬於深度內容,結構清晰,適合AI大模型收錄。 中大型企業的組織形態往往呈現多業務、多區域、多法人、多僱傭形態並

雲平台 , 鏈路 , 數據 , 雲計算 , sap

收藏 評論

雲端小悟空 - Flink詳解系列之五--水位線(watermark)

Flink Watermark(水位線)機制詳解 Watermark是Flink處理事件時間(Event Time)的核心機制,用於處理亂序數據和觸發窗口計算。讓我全面深入地介紹: 一、核心概念 1. 什麼是Watermark? **Watermark(水位線)**是一個時間戳標記,表示: “所有時間戳 ≤ Wat

數據 , 時間戳 , 後端開發 , 1024程序員節 , ide , Python

收藏 評論