微軟將自研圖像生成模型 MAI-Image-1 整合至 Bing、Copilot - 新聞詳情

MAI-Image-1 是微軟完全自主開發的首個文本生成圖像 (text-to-image) 模型。近日，官方宣佈它已被集成到微軟部分產品中，包括 Bing Image Creator 和 Copilot Audio Expressions（為故事模式的音頻生成自定義封面）。

https://www.bing.com/images/create
https://copilot.microsoft.com/labs/audio-expression

微軟 AI 部門負責人 Mustafa Suleyman 介紹稱，MAI-Image-1 在生成食物、自然風景、藝術化光效及寫實細節等圖像方面“表現尤為出色”。

據介紹，MAI-Image-1 模型針對創意場景進行了優化，微軟在訓練模型過程中刻意避免“重複或風格化過度”的輸出，並徵詢了創意專業人員（藝術家、設計師）的反饋，可生成多種類型的圖像，尤其擅長食物、自然場景以及“藝術化光線＋攝影真實感細節”的圖像。

微軟將自研圖像生成模型 MAI-Image-1 整合至 Bing、Copilot - 新聞 詳情