前段时间是不是被朋友圈的手办模型图刷屏了,不过很多人也没介绍怎么来的,不明就里的小白有点摸不着头脑。
实际上,是用自己的照片,通过Nano-Banan生成的AI图片。不过咱国内朋友大多数还是无法顺畅使用Google的产品,所以今天麦金叔就来介绍一下国产平替产品。说是平替,实际上某些方面要超过它了。
要不一起来玩一下,感受一下生图,生视频的魅力。
Seedream是什么?
即梦是字节出品的多媒体AI产品,里面有即梦图片、即梦视频、即梦数字人。
而即梦绘图底层模型是号称中国版Nano-Banana的Seedream 4.0。
所以即梦是产品,而Seedream是模型,麦金叔的粉丝朋友们应该知道模型的含义。
Seedream 4.0 首次支持4K多模态生图,可以灵活支持文本和图像的组合输入,实现多图融合创作。特别是组图的生成,能更强的保持主体一致性。
同时推理速度较3.0有较大幅度的提升,号称10倍以上,能秒级生成2K图片。
小白用户可以直接去 即梦AI - 即刻造梦 https://jimeng.jianying.com/ 使用,即可体验Seedream 4.0的强大能力,或者去火山引擎也可以免费体验一下 https://www.volcengine.com/experience/ark?mode=vision&model=doubao-seedream-4-0-250828
趣味玩法
首先,我们来小试牛刀,做一个“创意盲盒”同款。
在这里选择自己的一张底图,直接用现成的提示词,让AI给出结果。
接着我们,来个刷圈测试。选择底图,后输入提示词如下:
Convert the character from the image into a 1/4-scale PVC figure. Place two monitors behind the figure. One Apple Pro Display XDR displays a computer wallpaper,a realistic photo of the character. The other Apple Studio Display displays a 3D model of the figure in 3ds Max. Below the monitors is an Apple computer keyboard,mouse,and trackpad. Place a round plastic base in front of the keyboard and place the figure on it. The base's PVC material should have a crystal-clear,translucent surface,and the entire setting should be indoors.
高阶玩法
区别于一般人简单玩玩,更多的朋友还是想做更专业点的事情。
这就不得不说这个模型能力真的强的不是一星半点,在企业生产场景里,比如电商营销,商业设计,教育互动和文旅文创等多领域,都展示了稳定,优质并且还风格统一的视觉输出能力,从而能极大的解放生产力,为自己赢得合理的“摸鱼”时间。
比如,要给幼儿园的孩子创作一本有教育意义的绘本故事,可以按如下提示词生成:
讲述一个适合3-7岁儿童的绘本故事,故事要具有连贯性,并为这个故事的,每个场景各生成1张图片,共5张:
场景1:私塾课上逃学,李白趁先生写字,偷偷溜出学堂,朝后山方向跑
场景2:偶遇磨针老奶奶,松树下老奶奶拿一根粗铁棒在磨,李白好奇凑前,睁大眼在瞧
场景3:李白惊问:“铁棒怎变绣花针?”,老奶奶淡定擦汗:“每天磨一点就行”
场景4:老奶奶摸着小李白的头:“读书也需日日坚持”,李白红脸,低头认错,不应该逃学
场景5:小李白回私塾认真听课,夜伴油灯刻苦学习,后来成了诗仙,但仍难忘老奶奶铁棒磨针的教诲
另外,通常我们用这些工具生成的图片都会标上“AI生成”,如果只是随便玩玩,那无所谓,把它截取掉就行了。不过,如果真的是工作上用,肯定就不能这么干了,切了之后图片比例也不对了。所以,就会希望通过API来生成结果。
例如:我需要给某品牌生成一组品牌视觉图,那应该这样做。通过火山引擎申请模型权限,然后通过代码来进行结果生成。
import os
from openai import OpenAI
# 请确保您已将 API Key 存储在环境变量 ARK_API_KEY 中
# 初始化Ark客户端,从环境变量中读取您的API Key
client = OpenAI(
# 此为默认路径,您可根据业务所在地域进行配置
base_url="https://ark.cn-beijing.volces.com/api/v3",
# 从环境变量中获取您的 API Key。此为默认方式,您可根据需要进行修改
api_key=os.environ.get("ARK_API_KEY"),
)
imagesResponse = client.images.generate(
model="doubao-seedream-4-0-250828",
prompt="参考这个LOGO,做一套户外运动品牌视觉设计,品牌名称为FAKENEWS,包括包装袋、帽子、手环、挂绳等。绿色视觉主色调,趣味、简约现代风格",
size="2K",
response_format="url",
extra_body = {
"image": "https://res.tishiii.com/img/logo.png",
"watermark": False,
"sequential_image_generation": "auto",
"sequential_image_generation_options": {
"max_images": 4
},
}
)
# 遍历所有图片数据
for image in imagesResponse.data:
# 输出当前图片的url和size
print(f"URL: {image.url}, Size: {image.size}")
这样,再把这些结果的URL,下载下来,就成了。
怎么样,看起来还不错吧。
总结
现在的AI应用也好,AI模型也好,已经功能非常丰富了,只有你想不到,没有它做不到。 还是之前麦金叔说的,不是AI打败了人,而是会AI的人打败了你。现在出发,并不算晚。
如果需要更详细的介绍请移步,官方教程。 https://bytedance.larkoffice.com/docx/L4vCdah1DoDg7axVdYGcoplSn9f
如果你对AI的发展感兴趣,欢迎一键三连。有任何问题可以扫码添加好友,我们共同探讨。