Картинки, текст я и сам могу генерировать.
Тащемта, да, stable diffusion. Скорее всего будет работать удобоваримо на относительно новых нвидиевских карточках, на амдшных, по идее, тоже может нормально работать, но там уже сильнее зависит от конкретной модели и может потребовать дополнительных телодвижений. В принципе, можно и с неподдерживаемой видеокартой генерировать на процессоре, но тогда стоит ожидать, что стандартная картинка 512x512 будет генерироваться 3-5 минут. В качестве альтернативы можно запускать stable diffusion в google collab, но при бесплатном использовании следует быть готовым к тому, что примерно каждые 10 минут нужно будет перезапускать, т.к. будет автоотключаться.
Интерфейсов для stable diffusion достаточно много. Самый популярный, пожалуй от AUTOMATIC1111 (можно просто загуглить и найти гитхаб с кодом и всеми инструкциями).
Я лично использую этот ui запущенный в гугл коллабе (вроде бы на встройке моего ноутбука сд может работать, если прям заморочиться, но у меня не вышло и я забил) для генерации иллюстраций для кампаний в настольные ролевые, которые веду. Пожалуй, не могу не поделиться, забавным результатом, который получил в одной из генераций. Там нужна была мужская фигура объятая пламенем и всё это в стиле старой фотографии, но одним из первых результатов у меня получилась персонификация жёлтой собаки из мема: