
Останній інструмент штучного інтелекту Apple може анімувати зображення на основі вашого опису
в iCases BlogЯкий використовує великі мовні моделі (LLM).
Apple описує цю інноваційну технологію в новій дослідницькій роботі під назвою "Keyframer: Empowering Animation Design Using Large Language Models".
У той час як одноразові інтерфейси є звичайними інтерфейсами для передавання тексту в зображення, як-от Dall-E і Midjourney, ми стверджуємо, що анімація потребує складнішого набору користувацьких міркувань, як-от час і координація, які важко повністю зазначити в одній підказці - отже, можуть знадобитися альтернативні підходи, що дають змогу користувачам ітеративно створювати й доопрацьовувати згенеровані проєкти, особливо для анімації.
"Ми об'єднали нові принципи проєктування для мовного запиту артефактів дизайну з можливостями генерації коду LLM для створення нового інструменту анімації на базі штучного інтелекту під назвою Keyframer. За допомогою Keyframer користувачі можуть створювати анімовані ілюстрації зі статичних 2D-зображень за допомогою підказок природною мовою. Використовуючи GPT-4 3, Keyframer генерує код анімації CSS для анімації вхідної масштабованої векторної графіки (SVG).
Щоб створити анімацію, користувач завантажує SVG-зображення (наприклад, космічну ракету) і вводить такі підказки, як "Створіть три дизайни з небом, яке переливається різними кольорами і мерехтливими зірками". Потім Keyframer генерує анімований CSS-код, який користувач може доопрацювати, відредагувавши код безпосередньо або ввівши додаткові текстові підказки.
"Keyframer, - пояснюють автори, - дає змогу користувачам ітеративно покращувати дизайн за допомогою послідовних підказок, а не вивчати весь дизайн заздалегідь". За допомогою цього дослідження автори сподіваються надихнути майбутні інструменти для створення анімації, які поєднують потужні генеративні функції LLM для прискорення створення прототипів дизайну з динамічним редактором, що дозволяє авторам зберігати творчий контроль".
Згідно зі статтею, дослідження ґрунтується на інтерв'ю з професійними дизайнерами та інженерами-аніматорами. Я думаю, що це було набагато швидше, ніж багато речей, які я робив раніше, - сказав один із них." Раніше, я думаю, на подібне йшли години".
Ця інновація - лише остання в низці проривів Apple у сфері штучного інтелекту. Минулого тижня дослідники Apple представили модель штучного інтелекту, яка використовує можливості мультимодальних LLM для внесення попіксельних змін у зображення.
Наприкінці грудня Apple також оголосила про винахід інноваційної технології флеш-пам'яті та досягнення прогресу в розгортанні LLM в iPhone та інших пристроях Apple з обмеженим об'ємом пам'яті.
За даними The Information і аналітика Джеффа Пу, Apple планує впровадити в iPhone і iPad генеративний штучний інтелект у тій чи іншій формі після виходу iOS 18 наприкінці цього року, повідомляє кореспондент Bloomberg Марк Гарман. З чуток, наступна версія мобільного ПЗ Apple включатиме поліпшену Siri з функціями генеративного штучного інтелекту, аналогічними ChatGPT, що може стати "найбільшим" оновленням в історії iPhone.