蘋果公司近日發佈Pico-Banana-400K數據集,含40萬張精選圖像,該數據集依託Google Gemini-2.5系列模型構建,相關研究論文《Pico-Banana-400K:面向文本引導圖像編輯的大規模數據集》同步公開。
https://www.arxiv.org/abs/2510.19808
數據集採用非商業研究許可,僅限學術與AI研究使用,不可商用。其構建以OpenImages的真實照片為基礎,涵蓋35種編輯類型(分8類),經Gemini-2.5-Flash-Image(Nano-Banana)生成編輯圖像後,由Gemini-2.5-Pro審核指令合規性與視覺質量。數據集包含單輪編輯、多輪編輯序列及成敗結果偏好對。
儘管蘋果公司承認Nano-Banana存在技術侷限,但期望該數據集為下一代編輯模型提供訓練與基準測試基礎。研究論文可在arXiv查閲,數據集於GitHub免費開放。