Хочу поделиться некоторыми моими выводами об AI за полгода использования с точки зрения использования в нашем деле.
1. Развитие идёт бешенными темпами, всё говорит, что мы только в начале пути. Скорее всего это будет служить очередным драйвером роста спроса на топовые модели процессоров и видеокарт, особенно последних. Ресурсы там нужны такие, что ни одна игра не требует. Пока на рынке в принципе не существует видеокарт, которые устроили бы меня лично. Если производительность 4090 близка к необходимой, то тупое урезание видеопамяти в моделях 4 серии, к которому пришла GeForce для снижения цен в игровых моделях среднего сегмента, привело к катастрофе. Надеюсь они это поймут и исправят. Идеальное количество видеопамяти сегодня - 36-48-64-128 Гб. На рынке нет моделей, больше чем 24. 24 Гб - это максимальное разрешение 2000х1500 пикселей в основной генерации. Да, есть варианты рендера по кусочкам, но это имеет много минусов, в отличие от 3d моделирования, где это норма.
2. Нейросети проходят первые болезни роста. Понятно, что основным в развитие любой технологии является удовлетворение самых примитивных потребностей. Для нейросетей - это создание контента, запрещённого в интернете и жизни. Поэтому первые полгода 80% генераций были NFSW ( и я сейчас даже не о раздетых женщинах). Каких только извращенцев там нет! Фу-фу-фу... Я даже не думал, что кому-то это так нравится. У меня в черном списке десятки авторов, тогда как отслеживаемых - по пальцам. Западный мир умирает.
Это привело к тому, что развитие долго шло только в очень специфичном направлении, нам вообще не нужном. Лучше всего ( и охотнее всего) нейросети натренированы на человеческих портретах и телах. В любую картинку они прежде всего будут пихать персонажей, сколько не запрещай.
3. Главное, что нужно понять, нейросети, за очень редким исключением ( о котором я написал выше) не способны сгенерировать красивую правильную картинку с одного промпта (словесного описания). Я говорю о необходимых нам картинках.
После первых восторгов по поводу приятных цветов, безупречных копирований стиля рисования и композиции приходит понимание, что это всего лишь инструмент. Кисть. Не более. Любая картинка требует десятков часов кропотливого исправления явных увечий и недостатков. Это то же самое коллажирование, что и раньше, с той лишь разницей, что теперь не нужно часами искать приличные исходники в интернете. Кнопка "сделать шедевр" пока не появилась.
Для написания промпта, сложнее, чем жёлтая машина, стоящая в кустах, а лучше голая женщина, лежащая на пляже, нужно пока обладать немалым запасом специфичных выражений, вообще не очевидных не носителю языка. Гугл переводчик тут не поможет. Тут есть определённые успехи в виде самих же нейросетей, которые потихоньку обучаются переводить человеческий язык на язык промптов, добавляя нужные выражения. Но тут тоже много нюансов.
4. Ну и в завершении - генерация архитектуры.

Это жесть. Если объяснить нейросети, что пальцев должно быть пять, а не 7 или 8 с десятого раза удаётся, то рассказать, что все окна в доме должны быть одинаковыми и располагаться на равных расстояниях - невозможно по определению. Вся архитектура будет как в журнале крокодил за 1978 год. Кривая, косая, уродливая и смешанная из десятков элементов, стремящаяся засунуть головы и руки в любое похожее место.
Поведение солнечного света - это тоже та ещё песТня. Тени рисуются очень условно, без всяких соблюдений физических законов. В этом смысле я жду, наверное, появления AI в приложениях для 3D моделирования ( хотя и там ведь будут голых баб генерировать сперва).
Скажем так: первые восторги поутихли, началась сложная, долгая, очень дорогая, для простого потребителя работа. Тому, кто скажет, что гениальный правильный монтаж можно сделать за пару минут, - я первый плюну в 6 пальцев или овальные глаза.
