微軟將自研圖像生成模型 MAI-Image-1 整合至 Bing、Copilot - 新聞 詳情

MAI-Image-1 是微軟完全自主開發的首個文本生成圖像 (text-to-image) 模型。近日,官方宣佈它已被集成到微軟部分產品中,包括 Bing Image Creator 和 Copilot Audio Expressions(為故事模式的音頻生成自定義封面)。

https://www.bing.com/images/create
https://copilot.microsoft.com/labs/audio-expression

微軟 AI 部門負責人 Mustafa Suleyman 介紹稱,MAI-Image-1 在生成食物、自然風景、藝術化光效及寫實細節等圖像方面“表現尤為出色”。

據介紹,MAI-Image-1 模型針對創意場景進行了優化,微軟在訓練模型過程中刻意避免“重複或風格化過度”的輸出,並徵詢了創意專業人員(藝術家、設計師)的反饋,可生成多種類型的圖像,尤其擅長食物、自然場景以及“藝術化光線+攝影真實感細節”的圖像。