中国版Nano-Banana，Seedream 4.0有料 - 文章 - 开发者社区

前段时间是不是被朋友圈的手办模型图刷屏了，不过很多人也没介绍怎么来的，不明就里的小白有点摸不着头脑。

实际上，是用自己的照片，通过Nano-Banan生成的AI图片。不过咱国内朋友大多数还是无法顺畅使用Google的产品，所以今天麦金叔就来介绍一下国产平替产品。说是平替，实际上某些方面要超过它了。

要不一起来玩一下，感受一下生图，生视频的魅力。

Seedream是什么？

即梦是字节出品的多媒体AI产品，里面有即梦图片、即梦视频、即梦数字人。

而即梦绘图底层模型是号称中国版Nano-Banana的Seedream 4.0。

所以即梦是产品，而Seedream是模型，麦金叔的粉丝朋友们应该知道模型的含义。

Seedream 4.0 首次支持4K多模态生图，可以灵活支持文本和图像的组合输入，实现多图融合创作。特别是组图的生成，能更强的保持主体一致性。

同时推理速度较3.0有较大幅度的提升，号称10倍以上，能秒级生成2K图片。

小白用户可以直接去即梦AI - 即刻造梦 https://jimeng.jianying.com/ 使用，即可体验Seedream 4.0的强大能力，或者去火山引擎也可以免费体验一下 https://www.volcengine.com/experience/ark?mode=vision&model=doubao-seedream-4-0-250828

趣味玩法

首先，我们来小试牛刀，做一个“创意盲盒”同款。

picture.image

在这里选择自己的一张底图，直接用现成的提示词，让AI给出结果。 picture.image

接着我们，来个刷圈测试。选择底图，后输入提示词如下：

Convert the character from the image into a 1/4-scale PVC figure. Place two monitors behind the figure. One Apple Pro Display XDR displays a computer wallpaper,a realistic photo of the character. The other Apple Studio Display displays a 3D model of the figure in 3ds Max. Below the monitors is an Apple computer keyboard,mouse,and trackpad. Place a round plastic base in front of the keyboard and place the figure on it. The base's PVC material should have a crystal-clear,translucent surface,and the entire setting should be indoors.

picture.image

高阶玩法

区别于一般人简单玩玩，更多的朋友还是想做更专业点的事情。

这就不得不说这个模型能力真的强的不是一星半点，在企业生产场景里，比如电商营销，商业设计，教育互动和文旅文创等多领域，都展示了稳定，优质并且还风格统一的视觉输出能力，从而能极大的解放生产力，为自己赢得合理的“摸鱼”时间。

比如，要给幼儿园的孩子创作一本有教育意义的绘本故事，可以按如下提示词生成：

讲述一个适合3-7岁儿童的绘本故事，故事要具有连贯性，并为这个故事的，每个场景各生成1张图片，共5张：
场景1：私塾课上逃学，李白趁先生写字，偷偷溜出学堂，朝后山方向跑
场景2：偶遇磨针老奶奶，松树下老奶奶拿一根粗铁棒在磨，李白好奇凑前，睁大眼在瞧
场景3：李白惊问：“铁棒怎变绣花针？”，老奶奶淡定擦汗：“每天磨一点就行”
场景4：老奶奶摸着小李白的头：“读书也需日日坚持”，李白红脸，低头认错，不应该逃学
场景5：小李白回私塾认真听课，夜伴油灯刻苦学习，后来成了诗仙，但仍难忘老奶奶铁棒磨针的教诲

picture.image

另外，通常我们用这些工具生成的图片都会标上“AI生成”，如果只是随便玩玩，那无所谓，把它截取掉就行了。不过，如果真的是工作上用，肯定就不能这么干了，切了之后图片比例也不对了。所以，就会希望通过API来生成结果。

例如：我需要给某品牌生成一组品牌视觉图，那应该这样做。通过火山引擎申请模型权限，然后通过代码来进行结果生成。

import os
from openai import OpenAI
# 请确保您已将 API Key 存储在环境变量 ARK_API_KEY 中 
# 初始化Ark客户端，从环境变量中读取您的API Key 
client = OpenAI(     
  # 此为默认路径，您可根据业务所在地域进行配置
  base_url="https://ark.cn-beijing.volces.com/api/v3",     
  # 从环境变量中获取您的 API Key。此为默认方式，您可根据需要进行修改
  api_key=os.environ.get("ARK_API_KEY"), 
) 

imagesResponse = client.images.generate(
  model="doubao-seedream-4-0-250828",     
  prompt="参考这个LOGO，做一套户外运动品牌视觉设计，品牌名称为FAKENEWS，包括包装袋、帽子、手环、挂绳等。绿色视觉主色调，趣味、简约现代风格",   
  size="2K",    
  response_format="url",    
  extra_body = {
    "image": "https://res.tishiii.com/img/logo.png",
    "watermark": False,        
    "sequential_image_generation": "auto",
    "sequential_image_generation_options": { 
      "max_images": 4        
    },    
  }
) 
# 遍历所有图片数据
for image in imagesResponse.data:    
  # 输出当前图片的url和size    
  print(f"URL: {image.url}, Size: {image.size}")

这样，再把这些结果的URL，下载下来，就成了。

picture.image

怎么样，看起来还不错吧。

总结

现在的AI应用也好，AI模型也好，已经功能非常丰富了，只有你想不到，没有它做不到。还是之前麦金叔说的，不是AI打败了人，而是会AI的人打败了你。现在出发，并不算晚。

如果需要更详细的介绍请移步，官方教程。 ‍‍‍⁠⁠⁠https://bytedance.larkoffice.com/docx/L4vCdah1DoDg7axVdYGcoplSn9f

如果你对AI的发展感兴趣，欢迎一键三连。有任何问题可以扫码添加好友，我们共同探讨。