stable diffusion 控制空間構圖 -ControlNet Depth
ControlNet,使得 Stable Diffusion 可以接受條件輸入來指導圖像生成過程,從而開啓了AI生圖的可控時代。其中,開源的 ControlNet 模型包括如 OpenPose 姿勢識別、Canny 邊緣檢測、Depth 深度檢測 等等,每種模型都有其獨特的特性。本文將深入探索 Depth 深度檢測 的工作流程和應用實例,展示其如何幫助我們控制姿勢、轉換性別或物種、修改材質以及創建
昵称 球球
贡献者185
粉丝0
ControlNet,使得 Stable Diffusion 可以接受條件輸入來指導圖像生成過程,從而開啓了AI生圖的可控時代。其中,開源的 ControlNet 模型包括如 OpenPose 姿勢識別、Canny 邊緣檢測、Depth 深度檢測 等等,每種模型都有其獨特的特性。本文將深入探索 Depth 深度檢測 的工作流程和應用實例,展示其如何幫助我們控制姿勢、轉換性別或物種、修改材質以及創建
昵称 球球
Adobe 什麼!就連Adobe也開始進軍AI了?你們沒有看錯,作為咱們設計界的老大哥,Adobe也開始推出一系列AI工具,設計行也將迎來一場革命性的變革。 Adobe AI應用上新 Adobe作為設計軟件領域的絕對霸主,其一舉一動都牽動着整個行業的神經。近期,Adobe正式宣佈全面進軍AI生成領域,推出了包括Firefly、AI增強版Photoshop和Illustrator、A
昵称 慧星雲
最近在做AI語音對話的功能,用到了azure的語音語音服務,開發的時候還算順利,部署到線上後,發現在正式服上無法完成語音轉文本的操作,提示: org.springframework.web.util.NestedServletException: Handler dispatch failed; nested exception is java.lang.UnsatisfiedLinkE
昵称 背影輪廓
近日,教育部發布通知,公佈了首批18個“人工智能+高等教育”應用場景典型案例—— 為深入貫徹落實國家關於開展“人工智能+”行動的戰略部署,積極推動高等教育與人工智能技術的融合發展,利用智能技術支撐人才培養模式的創新、教學方法的改革、教育治理能力的提升,教育部高等教育司組織了首批“人工智能+高等教育”典型應用場景案例的徵集和論證工作,尋找、發掘和推廣在人工智能技術應用上具有代表性、前瞻性且能
昵称 Momodel
細胞治療產品 (CTP) 作為先進治療藥物 (ATMPs) 的重要組成部分,正為罕見病和疑難雜症患者帶來希望。然而,其生產過程極易受到微生物的侵擾,微生物污染始終如陰霾般籠罩着這束希望之光。傳統的無菌檢測方法,如沿用半個世紀的 USP 71(美國藥典第 71 章記錄的無菌檢測法),在面對精準醫療的新需求時顯得力不從心:長達兩週的培養週期、繁瑣的預處理步驟、依賴主觀判斷的渾濁度觀察,不僅嚴重滯後於細
昵称 超神經HyperAI
DeepMind 披露 LLM 的“自信悖論” 最新論文指出,LLM 在多輪追問或遭遇矛盾信息時,往往一面頑固堅持錯誤答案,另一面又輕易放棄已驗證的正確結論,呈現“過度自信 + 過度懷疑”的雙重失衡。(X (formerly Twitter), arXiv) 勝算短評:這相當於把“漂移”和“幻覺”結合成一個新級別風險:即便提示工程再精細,也可能在深層對話中被拖入邏輯黑洞。
昵称 DM今天肝到幾點
**話題:《AI 編程會取代程序員嗎?還是讓開發更自由?》 ——AI固然取代了一部分程序員日常需要去做的事情,但AI 編程並非“職業終結者”,而是幫助程序員擺脱重複性勞動、聚焦高價值創造的“超級外援”** 1. 先拋結論:AI ≠ 職業終結者,而是“超級外援” 替代的是單調機械的 30 % API 接口封裝、樣板代碼生成、重複性測試腳本……這些工作 AI 已經能 24
昵称 DM今天肝到幾點
1️⃣ MIT 發佈 CodeSteer:讓大模型學會“打組合拳” 當你拋出一道需要既寫代碼又解釋邏輯的難題時,現有 LLM 往往陷入“只説不算”或“只算不説”的尷尬。MIT CSAIL 最新提出的 CodeSteer(論文同時在 arXiv 與 MIT News 官網公開)就是針對這一弱點而生: 動態決策器:首先用一個輕量策略網絡判斷下⼀步應當觸發“代碼模式”還是“文本模式”,避免模
昵称 DM今天肝到幾點
如果你嘗試過像ChatGPT這樣的LLM,就會知道它們幾乎可以為任何語言或包生成代碼。但是僅僅依靠LLM是有侷限的。對於數據可視化的問題我們需要提供一下的內容 描述數據:模型本身並不知道數據集的細節,比如列名和行細節。手動提供這些信息可能很麻煩,特別是當數據集變得更大時。如果沒有這個上下文,LLM可能會產生幻覺或虛構列名,從而導致數據可視化中的錯誤。 樣式和偏好:數據可視化是一種藝術形式,每個人都
昵称 deephub
原文鏈接:https://www.nocobase.com/cn/blog/github-open-source-ai-agent-...。 大概一個多月前,我在 Hacker News 上刷到一篇討論熱度很高的文章——《停止構建 AI Agent》。 作者在文中分享了自己的親身經歷:他用 CrewAI 組建了一個“研究小組”——三名 Agent、五個工具,紙面上分工完美無缺。但真正運行時,研究
昵称 NocoBase
現在的量化交易早就不是簡單的技術指標了。真正有效的交易系統需要像一個完整的投資團隊一樣工作——有專門的分析師收集各種數據,有研究員進行深度分析和辯論,有交易員制定具體策略,還有風險管理團隊把關。問題是傳統的程序很難模擬這種複雜的協作流程。 LangGraph的多智能體架構正好解決了這個問題。我們可以構建一個像真實投資公司一樣運作的系統,每個智能體負責特定的職能,它們之間可以進行辯論、協商,最終形成
昵称 deephub
隨着數字化轉型步伐的加速,數字內容管理(Digital Content Management,簡稱DCM)已成為推動企業效率提升、優化客户體驗及增強市場競爭力的關鍵工具。全球範圍內,DCM正經歷着前所未有的快速發展。從企業的內容服務平台迭代到行業技術的革新,Forrester、IDC等多家權威機構的研究報告均揭示了該領域的巨大潛力與面臨的挑戰。下面,我們將基於這些機構的真實數據報告,深入剖析202
昵称 HelpLook
為了更好地滿足用户需求,HelpLook近期推出了一系列新功能,特別是支持套餐靈活升級和網站主題色模式豐富化,讓用户體驗更加自由和個性化。此外,我們針對欄目管理、權限設置和界面優化等多個方面進行了全面升級,助力企業高效管理知識庫內容,優化用户體驗。 一、欄目與內容管理: 1.欄目支持控制是否允許AI訓練 通過選擇性地控制哪些數據用於訓練,可以定製化AI回答,使AI回答滿足特定的應用場景需求。
昵称 HelpLook
隨着 AI 技術的快速發展,用户對 以算法驅動的 AI 搜索相關能力需求日益增長。AI 搜索開放平台已提供20+原子化服務能力,可靈活組合搭建AI搜索。本期發佈將重點解決用户在代碼開發中的不便,通過集成 dsw 能力,新增 notebook 功能,為用户提供更便捷的代碼編寫、調試及運行環境,進一步提升服務調試體驗。 一、產品能力 1. 文檔解析服務 支持文檔、圖片分鐘級解析,針對 PDF、DOC、
昵称 阿里雲大數據AI
隨着信息技術的飛速發展,搜索引擎作為信息獲取的重要工具,扮演着不可或缺的角色。阿里雲 AI 搜索開放平台以其強大的技術支持和靈活的開放性,持續為用户提供高效的搜索解決方案。 一、阿里雲 AI 搜索開放平台 一站式的 AI 搜索開放平台作為阿里雲 AI 搜索整個產品體系核心,提供豐富的 AI 搜索組件化服務。兼容主流開發框架 LangChain和 LlamaIndex,支持搜索專屬大模型、百鍊等大模
昵称 阿里雲大數據AI
本文詳細介紹瞭如何使用 PAI-LangStudio 和 Qwen3 構建基於AI搜索開放平台 x ElasticSearch 的 AI Search RAG 智能檢索應用。該應用通過使用 AI 搜索開放平台、ElasticSearch 全文檢索+向量檢索引擎的混合檢索技術配合阿里雲最新發布的 Qwen3 推理模型編排在一個 Agentic Workflow 中,為客户提供了業內領先的 AI Se
昵称 阿里雲大數據AI
降本增效、永不“塌房”、24小時不下播……數字人直播的誘惑越來越大,但坑也多得超乎想象。 “一年成本只要一兩千塊,和真人主播幾萬塊的月薪相比,簡直是九牛一毛!”一位剛試水數字人直播的電商賣家如此感慨。隨着AI技術迅猛發展,數字人直播因其低成本、無“塌房”風險、可全天候工作的特點,迅速成為電商從業者和創業者的新寵。 當前技術下,數字人直播效果已無限接近真人:能自動講解商品、根據關鍵詞回覆
昵称 青否Ai
你是否遇到過這樣的場景 深夜,辦公室裏燈火通明。你和你的團隊成員,還在為明天的直播腳本絞盡腦汁,反覆排練,只為那幾小時的完美出鏡。 或者,看着飛速發展的短視頻風口,你深知必須入局,打造個人或品牌IP,但一想到要頻繁面對鏡頭,組織語言,處理複雜的拍攝和剪輯,一股無形的壓力便撲面而來。 又或者,你算了一筆賬:聘請一個專業的主播團隊,高昂的薪資、漫長的培訓、狀態的不穩定……成本與效果之
昵称 青否Ai
降本增效、永不“塌房”、24小時不下播……數字人直播的誘惑越來越大,但坑也多得超乎想象。 “一年成本只要一兩千塊,和真人主播幾萬塊的月薪相比,簡直是九牛一毛!”一位剛試水數字人直播的電商賣家如此感慨。隨着AI技術迅猛發展,數字人直播因其低成本、無“塌房”風險、可全天候工作的特點,迅速成為電商從業者和創業者的新寵。 當前技術下,數字人直播效果已無限接近真人:能自動講解商品、根據關鍵詞回覆
昵称 憂鬱的吐司
PAIPhysicalAINotebook詳解1:基於Isaac仿真的操作動作數據擴增與模仿學習 PhysicalAI是AI技術演進的一個熱門話題,目的是基於Transformer、Diffusion等主流大模型結構,訓練得到可以在實際物理空間中指導機器人本體完成各種任務的AI模型。 在PhysicalAI模型的開發過程中,需要用到遙操採集、數據合成、數據增強、模仿學習、模型測評等多個過程,也會用
昵称 阿里雲大數據AI
一年一度的雙十一狂歡購物節已經拉開帷幕。踏入各大電商平台的店鋪直播間,會看到一些主播彷彿擁有無窮精力,連續直播數十小時仍神采奕奕。 他們不僅對產品特點進行細緻入微的講解,還能實時與新進入直播間的觀眾流暢互動。然而,只要稍加留意屏幕角落,便能發現一行小字——“AI生成”。原來,這些看起來與真人別無二致的主播,實則是人工智能打造出的。 一、突破極限:24 小時流量收割機(青否數字人源頭v
昵称 憂鬱的吐司
原文鏈接:https://tecdat.cn/?p=44204 原文出處:拓端抖音號@拓端tecdat 2023年,北京車主李女士換車時還在糾結燃油車與混動的油耗差異;2025年,她的鄰居已開着L2+級電動車實現自動避障接送孩子——這兩年,中國汽車產業正經歷“燃油退潮、智能崛起”的顛覆性轉型。這種轉型並非偶然:政策端“雙碳”目標持續發力,技術端電池成本下降超60%,消費端新能源滲透率從20
昵称 拓端tecdat
1、DFT 籤核為何至關重要? DFT 籤核確保 IC 設計滿足所有測試能力(testability)要求,為製造後測試提供基礎保障。通過完善的籤核流程,可提前發現問題、減少 costly 迭代,提升產品質量與可靠性。 2、核心籤核技術與實踐經驗 I. 掃描鏈插入與優化 意義:增強 IC 內部狀態的可控性與可觀測性,是高效測試的核心之一; 實踐案例:某領先廠商利用
昵称 星星上的柳樹
3D Gaussian Splatting(3DGS)現在幾乎成了3D視覺領域的標配技術。NVIDIA把它整合進COSMOS,Meta的新款AR眼鏡可以直接在設備端跑3DGS做實時環境捕獲和渲染。這技術已經不只是停留在論文階段了,產品落地速度是相當快的。 所以這篇文章我們用PyTorch從頭實現最初那篇3DGS論文,代碼量控制在幾百行以內。雖然實現很簡潔但效果能達到SOTA水平。 需要説明的是,
昵称 deephub