收藏 / 列表

u_14767244 - 十億 JSON 秒級響應:Apache Doris vs ClickHouse,Elasticsearch,PostgreSQL

坦白講,每次看性能測試排行榜,我都會下意識地先找找 Apache Doris 在哪個位置。 這次打開 JSONBench 的榜單,心情一如既往的期待加緊張。 好在結果讓我鬆了一口氣:默認配置下就能排到第三,僅次於維護方 ClickHouse 的兩個版本。 不過,Doris 只能止步於此了嗎?經過一系列優化後,查詢時長能不能再縮短點?和 ClickHouse 的差距在哪裏?

大數據 , 數據 , 數據倉庫 , apache , Json

StarRocks - 從 ClickHouse 到 StarRocks 存算分離: 攜程 UBT 架構升級實踐

作者:魏寧 攜程大數據平台開發專家 導讀: 在攜程龐大的數據體系中,UBT(User Behavior Tracking,用户行為追蹤系統)承擔着核心的用户行為採集與分析任務,日新增數據量高達 30 TB。為應對不斷增長的業務與性能需求,攜程技術團隊將 UBT 從 ClickHouse 遷移至 StarRocks 存算分離架構。 遷移後,系統實現了查詢性能從秒級到毫秒級的跨越——平均查詢耗

clickhouse , starrocks , SQL

wx6603b05eb93d0 - 新華社評車圈營銷亂象:零件命名武俠風,拉踩陰陽友商博關注……

幾年前,小柴就發文調侃,如今的汽車行業,核心競爭力好像是車企領導們的嘴,以及養車評人加上對負面新聞的OTA能力。 比如,在創始人的嘴這方面,他們有人説,BBA這些落後的東西;還有人説,咱們不要嘲笑邁巴赫,以及千萬以內最好;還有輪端輸出扭矩超過了1.8萬匹馬力;甚至開車能延壽三十年…… 類似的還有,倒車想撞都難;公開直播更是宣稱,有了領先幾代的智駕,上車可以打盹

數據 , 汽車行業 , 人工智能 , 數據分析 , 核心技術

Aloudata - 如何找到適合好用的 AI 數據分析軟件?實用指南

AI 數據分析軟件顯著提升企業決策精準性與敏捷性 在數字經濟時代,數據已經成為企業最核心的生產要素,無論是戰略規劃、市場策略調整,還是日常運營優化,都依賴於對數據的深度洞察。而 AI 數據分析軟件則是將數據轉化為決策力的關鍵工具。 傳統數據分析依賴人工處理與經驗判斷,存在“響應慢”、“分析不靈活”、“誤差率高”等問題,難以滿足快速變化的市場需求。AI 數據分析軟件則通

自然語言問數 , 大數據 , 數據倉庫 , dataagent , 數據分析 , 智能問數 , chatbi

阿里雲大數據AI - 阿里雲 AI 搜索開放平台新增:服務開發能力

隨着 AI 技術的快速發展,用户對 以算法驅動的 AI 搜索相關能力需求日益增長。AI 搜索開放平台已提供20+原子化服務能力,可靈活組合搭建AI搜索。本期發佈將重點解決用户在代碼開發中的不便,通過集成 dsw 能力,新增 notebook 功能,為用户提供更便捷的代碼編寫、調試及運行環境,進一步提升服務調試體驗。 一、產品能力 1. 文檔解析服務 支持文檔、圖片分鐘級解析,針對 PDF、DOC、

搜索引擎 , 大數據 , 人工智能 , 數據分析 , 數據處理

隱語SecretFlow - 國泰君安基於隱語SecretFlow生產場景探索實踐

業務背景及痛點 作為一家綜合性的證券金融集團,國泰海通證券在探索數據協同與隱私保護方面始終走在行業前列。 我們技術團隊內部在集團推動部署 SecretFlow(以下簡稱“隱語”)平台,主要出於兩個核心動因:一方面是加強集團內部各子公司之間的數據協同能力;另一方面則是希望藉助前沿技術在行業中發揮示範與引領作用。 在內部數據協同方面,證券行業對數據的保密性與敏感性要求極高。 即使在同一集團內部,子公

隱私 , 數據 , 開源 , SQL

葡萄城技術團隊 - 在 Angular 應用程序中使用 Genkit 的完整指南

引言 隨着人工智能技術的快速發展,將 AI 能力集成到現代 Web 應用程序中已成為提升用户體驗的重要方式。Genkit 作為一個強大的 AI 開發工具包,為開發者提供了便捷的方式來構建和集成 AI 功能。本文將詳細介紹如何在 Angular 應用程序中使用 Genkit 流(flows),從項目創建、依賴安裝到流定義和前後端交互的全過程。 Angular 作為主流的前端框架之一,結合 Genki

angular

deephub - LLM安全新威脅:為什麼幾百個毒樣本就能破壞整個模型

數據投毒,也叫模型投毒或訓練數據後門攻擊,本質上是在LLM的訓練、微調或檢索階段偷偷塞入精心構造的惡意數據。一旦模型遇到特定的觸發詞,就會表現出各種異常行為——輸出亂碼、泄露訓練數據、甚至直接繞過安全限制。 這跟提示注入完全是兩碼事。提示注入發生在推理階段,屬於臨時性攻擊;而投毒直接改寫了模型的權重,把惡意行為永久刻進了模型裏。 幾種主流的攻擊方式 預訓練投毒最隱蔽,攻擊者把惡意文檔混進海量的預訓

llm , 教程 , 知識 , 人工智能

哀涕狗 - 小白學習Python前看看,這份入門指南,能讓你少走很多彎路!

“讀萬卷書,不如行萬里路,行萬里路,不如大師帶路” 你是否也在學習Python中遇到有很多的問題?甚至不知道該從什麼地方入手,那麼這裏介紹一些工具以及學習方法。希望對你有用。 首先是選擇方向 在學習Python之前,首先一定要明確自己的學習方向。python目前主要幾個方向有web開發、辦公自動化、網絡爬蟲、數據分析及可視化等等,選擇大於努力,方向不對,努力白費,所以一定要把有限的時間和精力

python3.x , python3.5 , python2.7 , python爬蟲 , Python

nixidexuegao - API接口與物聯網:構建萬物互聯的基石

在數字化和智能化浪潮的推動下,物聯網(IoT)正以前所未有的速度改變着我們的世界。從智能家居到智慧城市,從工業4.0到智慧農業,物聯網的應用場景日益豐富,萬物互聯的時代已經到來。而在這一宏偉藍圖的背後,API接口(應用程序編程接口)扮演着至關重要的角色,成為構建萬物互聯的基石。 一、API接口與物聯網的緊密聯繫 API接口是連接不同軟件系統、促進數據共享與功能交互的關鍵技術組件。在物聯網中,

API , 電商 , 爬蟲 , 接口

小小張説故事 - Python爬蟲深度優化:Scrapy庫的高級使用和調優

在我們前面的文章中,我們探索瞭如何使用Scrapy庫創建一個基礎的爬蟲,瞭解瞭如何使用選擇器和Item提取數據,以及如何使用Pipelines處理數據。在本篇高級教程中,我們將深入探討如何優化和調整Scrapy爬蟲的性能,以及如何處理更復雜的抓取任務,如登錄,處理Cookies和會話,以及避免爬蟲被網站識別和封鎖。 一、併發和延遲 Scrapy使用異步網絡庫Twisted來處理網絡通信,可以實現高

scrapy , 爬蟲 , Python

馬哥python説 - 【爬蟲工具】2025微博採集軟件,根據搜索關鍵詞批量爬帖子,突破50頁限制!

本軟件工具僅限於學術交流使用,嚴格遵循相關法律法規,符合平台內容合法合規性,禁止用於任何商業用途! 一、背景分析 1.1 開發背景 微博是國內非常流行的社交媒體平台,內容主要以文字和圖片為主,在實時性和KOL關注熱度方面尤為突出。廣大網友在微博平台大量輸出自己的觀點、看法,組成了一個活躍度極高的社區羣體。同時,我本人也發現,每次熱點事件爆發的時候,微博熱搜也是所有媒體平台裏最先曝光的平台(其

工具軟件 , 微博採集 , python爬蟲 , 爬蟲 , 網絡爬蟲