tag 聚類

標籤
貢獻10
51
06:00 AM · Nov 16 ,2025

@聚類 / 博客 RSS 訂閱

mob64ca14154457 - K-均值聚類算法

一、算法原理與改進策略 1. 核心思想 將人工蜂羣算法(ABC)的全局搜索能力與K均值聚類(KMC)的局部優化能力結合,通過以下改進解決傳統KMC的缺陷: 初始化優化:採用最大最小距離積法選擇初始聚類中心 自適應搜索:引入基於距離的動態步長調整策略 混合更新機制:融合全局最優引導與局部擾動策略 2. 算法流程

聚類 , 初始化 , 後端開發 , 迭代 , Python

收藏 評論

autohost - matlab乾貨總結(三)基礎學習篇之數據可視化

文章目錄 MATLAB 基因表達數據處理與可視化全流程案例 一、數據準備與預處理 1. 模擬/加載基因表達數據 二、高維基因表達數據降維可視化 三、差異表達基因分析與可視化 四、基因表達時序數據可視化(擴展) 五、關鍵技巧與注意事項 六、真實數據加載示

聚類 , 數據 , 開發語言 , 加載 , MATLAB , 後端開發 , harmonyos

收藏 評論

mb61c46a7ab1eee - 【文獻分享】依據基於大型語言模型嵌入的蛋白質的 k 均值聚類來探索同源性檢測

文章目錄 介紹 代碼 參考 介紹 從序列信息中推斷蛋白質的同源性對於理解物種進化以及實現能力註釋的轉移至關重要。除了基於相似性的方法外,還構建了多種利用不同方式表示蛋白質素材的機器學習方式。 在這裏,大家使用具有生物學導向的大型語言模型來表示蛋白質,並對嵌入的信息應用 k 均值聚類來提取同源關係。儘管我們的方法缺乏

聚類 , github , 語言模型 , 後端開發 , harmonyos

收藏 評論

mob64ca1409970a - pytorch 餘弦相似度與mseloss結果對比

聚類分析之K-means算法 文章目錄 聚類分析之K-means算法 一.距離度量和相似度度量方法 1.距離度量 2.相似度 二.K-means算法原理 1.選取度量方法 2.定義損失函數 3.初始化質心 4.按照樣本到質心的距離進

聚類 , 相似度 , pytorch , 聚類分析 , 人工智能

收藏 評論

未聞花名AI - 構建AI智能體:四十、K-Means++與RAG的融合創新:智能聚類與檢索增強生成的深度應用

一、前言 前面的文章我們詳細講過,大型語言模型雖在自然語言處理領域展現卓越能力,但仍面臨幻覺問題、知識時效性不足及領域專業性缺失的問題,結合RAG通過“檢索外部知識+增強模型生成”的範式,作為大模型的“外置知識庫”有效緩解上述痛點,無需重新訓練即可動態整合最新領域知識,顯著提升回答準確性與可信度。 然而,傳統 RAG 系統在處理大規模知識庫時存在顯著侷限:全局檢索模式

AIGC二三事 , 聚類 , 人工智能 , 深度學習 , RAG , K-Means++

收藏 評論

編程小匠人傳奇 - 第945期機器學習日報(2017-04-20)_ai100

目錄 摘要 Abstract 一、優化目標 二、K-means算法的直觀理解 總結 摘要 今天深入學習了K-means算法的數學原理和優化過程。通過分析成本函數的構成,我理解了算法如何通過交替優化聚類分配和中心位置來最小化平方距離。具體來説,第一步是將每個點分配到最近的聚類中心,第二步是重新計算聚類中心為所屬點的

機器學習 , 聚類 , 最小化 , 人工智能 , Css , ci , 前端開發 , HTML

收藏 評論

我是數據分析師 - 軟件工程學習筆記

一、核心知識點梳理 聚類算法:K-means(無監督學習的典型代表) • 基本思想: 將數據集劃分為K個簇,使得同一簇內的數據點儘可能相似,而不同簇間的數據點儘可能不同。 • 偽代碼與流程: 1. 輸入: 數據集 D,預設的簇數量 K。 2. 初始化: 隨機選擇K個數據點作為初始質心。 3. 迭代優化: a. 分配

隨機森林 , 聚類 , 相似度 , 前端開發 , Javascript

收藏 評論

JavaEdge - Embedding Atlas:Apple推出的開源Embedding可視化工具!

本文已收錄在Github,關注我,緊跟本系列專欄文章,咱們下篇再續! 🚀 魔都架構師 | 全網30W技術追隨者 🔧 大廠分佈式系統/數據中台實戰專家 🏆 主導交易系統百萬級流量調優 車聯網平台架構 🧠 AIGC應用開發先行者 | 區塊鏈落地實踐者 🌍 以技術驅動創新,我們的征途是改變世界! 👉 實戰乾貨:編程嚴

聚類 , yyds乾貨盤點 , 數據 , 人工智能 , 深度學習 , 開發者

收藏 評論

全棧技術開發者 - 聚類和降維有什麼區別與聯繫?譜聚類與K-Means有什麼本質異同?密度聚類如何處理噪聲數據和異常點?降維是否總能提升聚類效果?

在現代數據科學與人工智能研究中,數據的規模與複雜性呈指數增長。每一個高維數據集不僅包含大量觀測值,還藴含着潛在的結構信息,這些結構可能體現為樣本之間的相似性、變量之間的相關性,或更高階的非線性模式。面對這樣的數據,人類直覺和簡單統計方法往往難以捕捉其內在規律。無監督學習因此成為理解複雜數據的核心工具,其中聚類與降維是最基礎也是最重要的兩類方法。 聚類強調在無標籤條件下發現樣

機器學習 , 聚類 , yyds乾貨盤點 , 數據 , 相似度 , 人工智能

收藏 評論

mob64ca1404baa2 - 評價文本生成模型生成效果

生活是美好的,佈滿每個角落,不要用良家婦女的心態去club,拜託!還是回家洗衣服去吧。 目的:評論自動分類 美護好評作為基礎數據,總共9萬6千條,數據越多訓練的模型越準確。 1. 首先對用户的評論進行標點符號去除,然後分詞,最後去掉停用詞。保存到一個文件中,一行是一條評論,每個詞之間用空格分開。 2. 使用word2vec訓練,得

聚類 , 評價文本生成模型生成效果 , 人工智能 , 深度學習 , 數據結構與算法 , 詞向量

收藏 評論