MAI-Image-1 是微軟完全自主開發的首個文本生成圖像 (text-to-image) 模型。近日,官方宣佈它已被集成到微軟部分產品中,包括 Bing Image Creator 和 Copilot Audio Expressions(為故事模式的音頻生成自定義封面)。
https://www.bing.com/images/create
https://copilot.microsoft.com/labs/audio-expression
微軟 AI 部門負責人 Mustafa Suleyman 介紹稱,MAI-Image-1 在生成食物、自然風景、藝術化光效及寫實細節等圖像方面“表現尤為出色”。
據介紹,MAI-Image-1 模型針對創意場景進行了優化,微軟在訓練模型過程中刻意避免“重複或風格化過度”的輸出,並徵詢了創意專業人員(藝術家、設計師)的反饋,可生成多種類型的圖像,尤其擅長食物、自然場景以及“藝術化光線+攝影真實感細節”的圖像。