Apple совместно с исследователями Калифорнийского университета выпустила модель искусственного интеллекта с открытым исходным кодом MGIE. Модель может редактировать изображения на основе инструкций на естественном языке (в данном случае английском). Есть код, веса и публикация. На моих тестах работает пока не очень, но любопытно посмотреть, как это видит Apple.
MLLM-guided Image Editing (MGIE) - a Hugging Face Space by tsujuifu