В преддверии праздников компания Microsoft заявила, что обновляет модель AI, лежащую в основе Bing Image Creator — инструмента для редактирования изображений на базе искусственного интеллекта, встроенного в поисковую систему Bing. Microsoft пообещала, что новая модель — последняя версия DALL-E 3 от OpenAI с кодовым названием PR16 — позволит пользователям создавать изображения вдвое быстрее, чем раньше с более высоким качеством.
Но этого не произошло. Жалобы быстро заполонили X и Reddit.
«DALL-E, который мы любили, ушел навсегда», — заявил один из пользователей Reddit.
«Я теперь использую ChatGPT, потому что Bing стал для меня бесполезен», — написал другой.
Реакция была такой, что Microsoft заявила о возврате предыдущей модели в Bing Image Creator до тех пор, пока не будут решены проблемы.
«Верните старый DALL-E 3! Качество изображения намного лучше на старой модели. Например, эти изображения. Изображение, сгенерированное новой моделью, отстой :(» (@riegrowl)
«Мы смогли воспроизвести некоторые из сообщенных
проблем и планируем вернуться к DALL-E 3 PR13, пока не сможем их исправить», — написал во вторник вечером в посте на X Хорди Рибас, глава отдела поиска в Microsoft. «К сожалению, процесс развертывания очень медленный. Он начался более недели назад и займет еще 2–3 недели, чтобы достичь 100%».
Итак, что пошло не так? Трудно сравнивать результаты моделей по отдельным сообщениям, особенно когда запросы не стандартизированы. Но многие пользователи отметили, что PR16 склонна создавать изображения, выглядящие менее реалистично. Маянк Пармар, пишущий для Windows Latest, отметил, что изображения, созданные PR16, лишены деталей и полировки и выглядят странно мультяшными и «безжизненными».
«Я не знаю, кого вы пытаетесь обмануть этим. DALL-E объективно хуже, чем когда-либо после этого “обновления”, и вас опережают такие компании, как Google. Разница в качестве изображений сейчас и всего пару месяцев назад просто огромна» (@roccynoxy)
Это не первый раз, когда модель изображения, предположительно прошедшая внутренние проверки, не была хорошо принята публикой. В феврале Google была вынуждена приостановить способность своего чат-бота Gemini создавать изображения людей после того, как пользователи пожаловались на исторические неточности.
Эти просчеты показывают, насколько сложно оценить улучшения модели в реальном мире. По словам Рибаса, внутреннее тестирование Microsoft показало, что качество PR16 было немного лучше в среднем, по сравнению с предыдущей моделью Bing Image Creator.
Какой бы ни была внутренняя метрика, используемая компанией, очевидно, что она не совпадала с предпочтениями большинства пользователей.
Автор: dilnaz_04