Discord стал неожиданным центром для бума генеративного искусственного интеллекта

В видео толпа восторженно ревет на переполненном летнем музыкальном фестивале. Когда начинается звучать ритм над акустической системой, исполнитель наконец выходит на сцену: это Джокер. Одетый в красный костюм, с зелеными волосами и характерным гримом, Джокер качает кулаком и танцует по сцене, прыгая по подиуму, чтобы быть еще ближе к своей толпе поклонников. Когда наступает время начать рэп, Джокер нагибает колени и отталкивается от земли, подпрыгивая вверх и вниз, прежде чем сделать 360-градусный поворот на одной ноге. Это выглядит легким и естественным, но если бы вы попытались выполнить этот трюк, вы бы упали на лицо. Джокер никогда раньше не был настолько крутым.

Затем есть еще одно видео, где звезда НБА Джоэл Эмбиид выходит из-за кулис, чтобы поприветствовать толпу, прежде чем повторить те же танцевальные движения. Затем это звезда "Не взвешенности" Ларри Дэвид. Но в каждой из этих сцен что-то не так - будь то Джокер, Джоэл Эмбиид или Ларри Дэвид, тело исполнителя дрожит, а их лицевые выражения никогда не меняются.

Конечно, все это создано искусственным интеллектом, благодаря компании под названием Viggle.

Оригинальное видео показывает раппера Лил Яхти на сцене фестиваля Summer Smash в 2021 году - согласно названию видео на YouTube с более чем 6,5 миллиона просмотров, этот вход - "САМЫЙ ТЯЖЕЛЫЙ выход когда-либо". Это стало популярным форматом мемов в апреле, когда люди вставляли своих любимых знаменитостей - или своих любимых злодеев, как Сэм Банкман-Фрид - в видео Лил Яхти на сцене.

Новый инструмент искусственного интеллекта заменил Лил Яхти на Джокера Хоакина Феникса

pic.twitter.com/8s4EuKNAZd

— Dexerto (@Dexerto) 10 апреля 2024 года

Предложения текста к видео становятся страшно хорошими, но нельзя просто ввести "Сэм Банкман-Фрид как Лил Яхти на Summer Smash 2021" и ожидать, что Sora поймет точно, что вы имеете в виду. Viggle работает по-другому.

На сервере Discord Viggle пользователи загружают видео, где кто-то делает какие-то движения - часто танец TikTok - и фотографию человека. Затем Viggle создает видео, в котором этот человек воспроизводит движения из видео. Очевидно, что эти видео не реальные, хотя они все равно развлекательны. Но после того как мем с Лил Яхти стал вирусным, Viggle набрал обороты, и возбуждение не утихает.

"Мы сосредоточены на создании того, что называем моделью управляемой генерации видео", - сказал основатель Viggle Ханг Чу TechCrunch. "Когда мы генерируем контент, мы хотим точно контролировать, как персонаж двигается, или как выглядит сцена. Но текущие инструменты сосредотачиваются только на стороне текста к видео, где сам текст недостаточно указывает все визуальные тонкости".

По словам Чу, у Viggle есть два основных типа пользователей - в то время как некоторые люди создают мемы, другие используют продукт как инструмент в процессе производства для гейм-дизайна и визуальных эффектов.

"Например, команда инженеров по анимации может взять некоторые концепции дизайна и быстро превратить их в грубые, но быстрые анимационные ресурсы", - сказал Чу. "Цель состоит в том, чтобы видеть, как они выглядят и чувствуются на грубом наброске окончательного плана. Это обычно занимает для них дни, а то и недели, чтобы все сделать вручную, но с Viggle это можно сделать практически моментально и автоматически. Это экономит кучу утомительной, повторяющейся работы по моделированию".

В марте на сервере Discord Viggle было несколько тысяч участников. К середине мая их число увеличилось до 1,8 миллиона, а с началом июня сервер Viggle вырос до более 3 миллионов участников. Это делает его крупнее серверов для игр типа Valorant и Genshin Impact вместе взятых.

Рост Viggle не дает признаков замедления, за исключением того, что высокий спрос на генерацию видео делает ожидание немного длительным для нетерпеливых пользователей. Но поскольку Viggle настолько ориентирован на Discord, разработчики Discord непосредственно сотрудничают с Viggle, чтобы направить двухлетний стартап через его быстрый рост.

К счастью для Viggle, Discord уже прошел через это. MidJourney, которая также функционирует на Discord, имеет 20,3 миллиона участников на своем сервере, что делает его крупнейшим единой сообществом на платформе. В целом у Discord около 200 миллионов ежемесячных пользователей.

Источник изображения: Viggle/Discord

"Никто не готов к такому росту, поэтому на этапе вирулентности мы начинаем работать с ними, потому что они не готовы", - сказал TechCrunch вице-президент по продукту Discord Бен Шанкен. "Нам нужно быть готовыми, потому что значительная часть сообщений, отправляемых сейчас, - это Viggle и MidJourney, и много потребления и использования в Discord фактически являются генеративным ИИ".

Для стартапов, таких как Viggle и MidJourney, построение своих приложений на Discord означает, что им не нужно создавать целую платформу для своих пользователей - вместо этого они размещены на платформе, которая уже имеет аудиторию, разбирающуюся в технологиях, а также встроенные инструменты модерации контента. Для Viggle, у которого всего 15 сотрудников, поддержка Discord критически важна.

"Мы можем сосредоточиться на создании модели как на backend-сервисе, в то время как Discord может использовать свою инфраструктуру на frontendе, и, по сути, мы можем делать итерации быстрее", - сказал Чу.

Прежде чем попасть в Viggle, Чу работал исследователем в Autodesk, гиганте 3D-инструментов. Он также проводил исследования для таких компаний, как Facebook, Nvidia и Google.

Для Discord действовать как случайная компания SaaS для стартапов в области искусственного интеллекта может принести свои плоды. С одной стороны, эти приложения привлекают новую аудиторию на Discord и, вероятно, хороши для пользовательских показателей. Однако хранение такого количества видео может быть сложным и дорогим с технической стороны, особенно когда другие пользователи по всей платформе транслируют игры в реальном времени, обмениваются видео сообщениями и голосовыми вызовами. Без платформы вроде Discord, эти стартапы могли бы не смогли расти с такой скоростью.

"Ни для какой компании не легко масштабироваться, но Discord построен для такого масштаба, и мы можем помочь им вполне хорошо это поглотить", - сказал Шанкен.

Хотя эти компании могут просто принять руководящие принципы содержания Discord и использовать свои приложения для модерации контента, всегда будет вызовом убедиться, что 3 миллиона человек ведут себя прилично. Даже эти мемы с выходом Лил Яхти технически нарушают правила Viggle, которые настаивают на том, что пользователи должны избегать создания изображений реальных людей - включая знаменитостей - без их согласия.

Пока что спасительная лазейка для Viggle может быть в том, что его результаты еще не на сто процентов реалистичны. Технология действительно впечатляет, но мы знаем лучше. Эта корявая анимация Джокера определенно не реальна, но она действительно смешная.