Дослідники Apple випустили нову модель ШІ-інструмента для зміни зображень. MLLM-Guided Image Editing (скорочено – MGIE) дозволяє користувачам «редагувати» знімки словом – вони можуть описати те, що хочуть змінити, і програми-фоторедактори їм більше не потрібні.

Замість коротких, але неоднозначних вказівок, MGIE виводить явні візуальні наміри та веде до розумного редагування зображень. Ми проводимо ґрунтовні дослідження різних аспектів редагування та демонструємо, що наш MGIE ефективно покращує продуктивність, зберігаючи конкурентоспроможність.

MGIE, спільна розробка Apple та Каліфорнійського університету у Санта-Барбарі, за допомогою текстових підказок може обрізати фото, змінити його розмір, перевернути і додати фільтри до зображення. Просто опишіть те, що хочете змінити у фото, і на ваше прохання MGIE зробить піцу «здоровішою», додавши туди овочевої начинки, а небо блакитнішим, збільшивши яскравість небесної частини зображення. MGIE доступна для завантаження через GitHub; також Apple випустила вебдемоверсію моделі на платформі Hugging Face Spaces.

Літературний редактор.

Коменти