tag generative-ai

標籤
貢獻15
75
07:36 AM · Oct 30 ,2025

@generative-ai / 博客 RSS 訂閱

GPUStack - GPUStack Windows(WSL2)部署指南

GPUStack v2 以高性能推理與生產級穩定性為核心演進方向,對整體架構進行了全面重構,實現了組件間的靈活解耦,並對多推理引擎和異構算力進行了深度優化,充分釋放推理引擎在吞吐、延遲與併發方面的性能潛力。 基於這一架構設計,GPUStack v2 聚焦 Linux 原生環境,以充分利用其在生態和 AI 基礎設施領域的成熟優勢。 對於 Windows 用户,推薦通過 WSL2(Windows Su

generative-ai , llm , 人工智能 , Docker

收藏 評論

Baihai_IDP - 為什麼語言模型偏愛使用破折號?反駁多種主流解釋,並提出猜想

編者按: 難道語言模型對破折號的偏愛,真的只是因為它們“喜歡”嗎? 我們今天為大家帶來的文章,作者的核心觀點是:當前主流大語言模型對破折號的偏愛,很可能源於其訓練數據中大量引入了 19 世紀末至 20 世紀初的紙質書籍 —— 這些文本本身就比當代英語更頻繁地使用破折號。 文章系統梳理並逐一反駁了多種主流解釋,然後通過分析標點使用的歷史趨勢、尼日利亞英語語料庫統計數據,以及 GPT-3.5

generative-ai , 觀點 , llm , 知識 , 人工智能

收藏 評論

lrhao - 如何在AWS體驗Titan IG以及Prompt分享

SDXL簡介 SDXL 可以生成幾乎任何藝術風格的高質量圖像,是照片寫實主義的最佳開放模型。 可以提示不同的圖像,而無需模型賦予任何特定的“感覺”,從而確保風格的絕對自由。 SDXL 1.0 特別針對鮮豔而準確的色彩進行了精心調校,與前身相比,具有更好的對比度、照明和陰影,所有這些均採用原始 1024x1024 分辨率。 此外,SDXL 可以生成圖像模型難以渲染的概念,例如手和文本或空間排列的構

亞馬遜雲科技 , generative-ai , 2023reinvent , challenge

收藏 評論

HuiZhu - 別讓今天的技術選型,成為明年團隊的"辭職信"

技術圈有個殘酷的真相:70% 的技術債務,在項目啓動的第一週就已經註定了。 我們往往以為自己在做"技術選型",實際上可能只是在進行一場"盲目跟風"。看到大廠出了新框架就想用,聽到 K8s 是未來就硬上,覺得微服務時髦就強拆單體。結果呢?一年後,團隊為了維護這套並不適合業務的複雜架構疲於奔命,當年的"前瞻性決策"變成了如今甩不掉的"填坑噩夢"。 選型不是選美,更不是賭博。它是用有限的資源,去換取未來

generative-ai , 技術選型 , 架構設計 , prompt , 效能工具

收藏 評論

HuiZhu - 團隊擴張的"隱形天花板":用AI把"金牌員工"的經驗一鍵複製

"這個去問老王,那個得問Lisa" 場景重現: 新員工小張:"主管,這個緊急退款流程怎麼走?系統裏沒找到入口。" 主管:"啊,這個特殊情況得特批。你去問問財務的老李,他上次處理過。" 老李:"這事兒以前是運營的老趙管的,我現在只負責打款,審批流還得問問現在的運營負責人..." 小張拿着單子轉了一圈,一下午過去了,客户還在羣裏罵娘。 這段對話熟悉嗎? 在很多快速發展的團隊裏,這被稱為"部

generative-ai , 教程 , chatgpt , 人工智能 , prompt

收藏 評論

LinkinStar - 2023 re:Invent 用 PartyRock 10 分鐘構建你的 AI 應用

前言 一年一度的亞馬遜雲科技的 re:Invent 可謂是全球雲計算、科技圈的狂歡,每次都能帶來一些最前沿的方向標,這次也不例外。在看完一些 keynote 和介紹之後,我也去親自體驗了一些最近發佈的內容。其中讓我感受最深刻的無疑是 PartyRock 了。PartyRock 真的算是做到了:能讓任何人快速的構建一個屬於自己的 AI 應用。當然,本文最後也分享我對於其他在 re:Invent 上提

亞馬遜雲科技 , generative-ai , 2023reinvent , challenge

收藏 評論

龍智DevSecOps - Perforce《2025遊戲技術現狀報告》Part 1:遊戲引擎技術的廣泛影響以及生成式AI的成熟之路

Perforce《2025遊戲技術現狀報告》現已正式發佈,由JetBrains提供洞察支持。該報告基於對全球521位來自遊戲、媒體與娛樂、汽車與製造業等行業領袖及創作者的深入調研,全面揭示了遊戲引擎與生成式AI如何作為核心驅動力,從“實驗探索”邁向“業務必需”,並正在重新定義各行業的創新邊界。 龍智作為Perforce中國授權合作伙伴,將此重磅報告完整翻譯為中文,並將以系列文章的形式陸續發佈,旨在

generative-ai , unity , 遊戲開發

收藏 評論

Vekly羊羊 - 非計算機專業小白體驗 Amazon Q

引言 提到 2023 的年度技術熱詞,AI 毫無疑問拔得頭籌。而在剛剛結束的 re:Invent 2023 全球大會上,亞馬遜雲科技也帶了一系列 AI 產品和重磅發佈。作為非計算機專業科班出身的科技愛好者,最吸引我的莫過於 Amazon Q。 簡而言之,Amazon Q 是一款新型生成式人工智能助手。和 ChatGPT 等 to C 的產品不同,這款產品旨在滿足企業辦公場景的需求,並提供定製化服

亞馬遜雲科技 , generative-ai , amazon-web-services , 2023reinvent , challenge

收藏 評論

HuiZhu - 拒絕做"SQL取數機":我用這條AI指令,把枯燥報表變成了商業參謀

90%的數據報告都在"裸奔" 你有沒有算過這樣一筆賬:你花了3天清洗數據,寫了500行SQL,做了10張精美的Echarts圖表,最後熬夜寫出的分析報告,老闆只看了不到30秒。 "數據我都看到了,然後呢?" 這句話是不是像一把刀子插在心上? 我們在SegmentFault這樣的技術社區裏,討論了太多關於Pandas、Spark、ClickHouse的技術細節,卻往往忽略了一個殘酷的現實:在商業世界

generative-ai , chatgpt , 人工智能 , 數據分析 , prompt

收藏 評論

HuiZhu - 以為是貓踩了鍵盤?這串“亂碼”其實能幫你省下兩小時加班

望着屏幕上那行 ^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([a-z\.]{2,6})$,你的腦海裏是否閃過一絲疑惑:我是誰?我在哪?這到底是代碼還是我的貓剛才跳上了鍵盤? 在程序員的世界裏,有一種“咒語”叫做正則表達式(Regex)。它強大到能從百萬行日誌裏精準揪出那個報錯的IP,卻也晦澀到讓無數英雄好漢競折腰。 甚至有個段子説:如果你有一個問題,你決定用正則表達式解決,那

generative-ai , regexp , chatgpt , 正則表達式 , prompt

收藏 評論

Baihai_IDP - 壓縮而不失智:LLM 量化技術深度解析

編者按: 如何在資源受限的設備上高效部署大語言模型,同時還儘可能保持其性能表現? 我們今天為大家帶來的這篇文章,作者的核心觀點是:量化技術通過在模型精度與效率之間尋找最優平衡點,使得大語言模型能夠在資源受限的設備上高效部署,而幾乎不降低其“智能水平”。 文章從量化的基本原理出發,深入剖析了訓練後量化(PTQ)與量化感知訓練(QAT)的適用場景,詳細解釋了縮放因子、零點、對稱/非對稱量化等關

generative-ai , 觀點 , llm , 知識 , 人工智能

收藏 評論

小白要生髮 - 2023 re:Invent AI生成產品體驗,從 Bedrock 到 Amazon Q

引 如果你也有如下問題,那麼接下來的文字會一一為你解答 一套數據集,如何微調不同類型的開源大模型?—— Bedrock 如何只有產品説明書,如何構建一個智能問答機器人?—— Q 哪裏還有免費的GPU算力——在線Jupyter平台?—— SageMaker 發佈會 亞馬遜雲科技re:lnvent 發佈會,在 2023 年11月底於拉斯維加圓滿召開,介紹了一些雲產品的升級,以及自研芯片的升級

亞馬遜雲科技 , generative-ai , 2023reinvent , 人工智能 , challenge

收藏 評論