中国版Nano-Banana,Seedream 4.0有料

Agent

前段时间是不是被朋友圈的手办模型图刷屏了,不过很多人也没介绍怎么来的,不明就里的小白有点摸不着头脑。

  实际上,是用自己的照片,通过Nano-Banan生成的AI图片。不过咱国内朋友大多数还是无法顺畅使用Google的产品,所以今天麦金叔就来介绍一下国产平替产品。说是平替,实际上某些方面要超过它了。

  要不一起来玩一下,感受一下生图,生视频的魅力。

Seedream是什么?

即梦是字节出品的多媒体AI产品,里面有即梦图片、即梦视频、即梦数字人。

而即梦绘图底层模型是号称中国版Nano-Banana的Seedream 4.0。

  所以即梦是产品,而Seedream是模型,麦金叔的粉丝朋友们应该知道模型的含义。

  Seedream 4.0 首次支持4K多模态生图,可以灵活支持文本和图像的组合输入,实现多图融合创作。特别是组图的生成,能更强的保持主体一致性。

  同时推理速度较3.0有较大幅度的提升,号称10倍以上,能秒级生成2K图片。

小白用户可以直接去 即梦AI - 即刻造梦 https://jimeng.jianying.com/ 使用,即可体验Seedream 4.0的强大能力,或者去火山引擎也可以免费体验一下 https://www.volcengine.com/experience/ark?mode=vision&model=doubao-seedream-4-0-250828

趣味玩法

首先,我们来小试牛刀,做一个“创意盲盒”同款。

picture.image

在这里选择自己的一张底图,直接用现成的提示词,让AI给出结果。 picture.image

接着我们,来个刷圈测试。选择底图,后输入提示词如下:

Convert the character from the image into a 1/4-scale PVC figure. Place two monitors behind the figure. One Apple Pro Display XDR displays a computer wallpaper,a realistic photo of the character. The other Apple Studio Display displays a 3D model of the figure in 3ds Max. Below the monitors is an Apple computer keyboard,mouse,and trackpad. Place a round plastic base in front of the keyboard and place the figure on it. The base's PVC material should have a crystal-clear,translucent surface,and the entire setting should be indoors.

picture.image

高阶玩法

区别于一般人简单玩玩,更多的朋友还是想做更专业点的事情。

  这就不得不说这个模型能力真的强的不是一星半点,在企业生产场景里,比如电商营销,商业设计,教育互动和文旅文创等多领域,都展示了稳定,优质并且还风格统一的视觉输出能力,从而能极大的解放生产力,为自己赢得合理的“摸鱼”时间。

比如,要给幼儿园的孩子创作一本有教育意义的绘本故事,可以按如下提示词生成:

讲述一个适合3-7岁儿童的绘本故事,故事要具有连贯性,并为这个故事的,每个场景各生成1张图片,共5张:
场景1:私塾课上逃学,李白趁先生写字,偷偷溜出学堂,朝后山方向跑
场景2:偶遇磨针老奶奶,松树下老奶奶拿一根粗铁棒在磨,李白好奇凑前,睁大眼在瞧
场景3:李白惊问:“铁棒怎变绣花针?”,老奶奶淡定擦汗:“每天磨一点就行”
场景4:老奶奶摸着小李白的头:“读书也需日日坚持”,李白红脸,低头认错,不应该逃学
场景5:小李白回私塾认真听课,夜伴油灯刻苦学习,后来成了诗仙,但仍难忘老奶奶铁棒磨针的教诲

picture.image

  另外,通常我们用这些工具生成的图片都会标上“AI生成”,如果只是随便玩玩,那无所谓,把它截取掉就行了。不过,如果真的是工作上用,肯定就不能这么干了,切了之后图片比例也不对了。所以,就会希望通过API来生成结果。

例如:我需要给某品牌生成一组品牌视觉图,那应该这样做。通过火山引擎申请模型权限,然后通过代码来进行结果生成。

import os
from openai import OpenAI
# 请确保您已将 API Key 存储在环境变量 ARK_API_KEY 中 
# 初始化Ark客户端,从环境变量中读取您的API Key 
client = OpenAI(     
  # 此为默认路径,您可根据业务所在地域进行配置
  base_url="https://ark.cn-beijing.volces.com/api/v3",     
  # 从环境变量中获取您的 API Key。此为默认方式,您可根据需要进行修改
  api_key=os.environ.get("ARK_API_KEY"), 
) 

imagesResponse = client.images.generate(
  model="doubao-seedream-4-0-250828",     
  prompt="参考这个LOGO,做一套户外运动品牌视觉设计,品牌名称为FAKENEWS,包括包装袋、帽子、手环、挂绳等。绿色视觉主色调,趣味、简约现代风格",   
  size="2K",    
  response_format="url",    
  extra_body = {
    "image": "https://res.tishiii.com/img/logo.png",
    "watermark": False,        
    "sequential_image_generation": "auto",
    "sequential_image_generation_options": { 
      "max_images": 4        
    },    
  }
) 
# 遍历所有图片数据
for image in imagesResponse.data:    
  # 输出当前图片的url和size    
  print(f"URL: {image.url}, Size: {image.size}")

这样,再把这些结果的URL,下载下来,就成了。

picture.image

picture.image

picture.image

picture.image

怎么样,看起来还不错吧。

总结

现在的AI应用也好,AI模型也好,已经功能非常丰富了,只有你想不到,没有它做不到。 还是之前麦金叔说的,不是AI打败了人,而是会AI的人打败了你。现在出发,并不算晚。

如果需要更详细的介绍请移步,官方教程。 ‍‍‍⁠⁠⁠https://bytedance.larkoffice.com/docx/L4vCdah1DoDg7axVdYGcoplSn9f

如果你对AI的发展感兴趣,欢迎一键三连。有任何问题可以扫码添加好友,我们共同探讨。

0
0
0
0
关于作者

文章

0

获赞

0

收藏

0

相关资源
火山引擎大规模机器学习平台架构设计与应用实践
围绕数据加速、模型分布式训练框架建设、大规模异构集群调度、模型开发过程标准化等AI工程化实践,全面分享如何以开发者的极致体验为核心,进行机器学习平台的设计与实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论