近期豆包推出了一款非常出色的图片生成类的大模型Seedream 4.0 ,功能相当惊艳!咱们终于可以告别PS软件了。
豆包·图像创作模型 Seedream 4.0 是一个从生成到编辑的一站式图像创作模型。 产品的独特优势在哪里首次支持4K多模态生图,灵活支持文本、图像的组合输入,实现多图融合创作、参考生图、组合生图、图像编辑等核心能力,且主体一致性大幅增强。
推理速度较 Seedream 3.0 提升超 10 倍,可实现最快秒级生成2K图片 。 一举拿下了Artificial Analysis「文生图」和「图像编辑」两大榜单的第一。
我近期一直在专注RAG检索增强类的技术,那么就让Seedream4.0来帮我生成一组RAG的图片,提示词就用最简单的“文字为:RAG;背景黑色;风格:科技感”。
这个效果还是相当不错的,生成的速度也非常快。完全满足我们写博客的配图需要。这Seedream 4.0的功能可不止这点,这仅是Seedream4.0的冰山一角,接下来我们来体验下她的强大吧!
Seedream 4.0的体验中心地址:
地址: https://www.volcengine.com/experience/ark?launch=seedream
1、海报设计
参考原海报,替换里面的人物元素,提示词“把图1中的两个人物分别替换成图2、图3中的人物,巧妙的生成一张新的电影海报,并把标题改为:"甜美世家" ”
生成的效果如下:
2、故事书模式
Seedream 4.0的组图模式有3种:
- 自动
- 自动触发组图功能,是默认选项。
- 故事书
- 根据指定内容创建专属绘本
- 连环画
- 句话生成动漫、连环画
选择**“故事书模式**”,我们来写一个提示词“我的女儿奥莉五岁,非常害怕看牙医。请创作一本温暖的故事书,帮助她缓解焦虑。采用柔和的水彩画风,画面明亮温馨。”
生成效果如下,Seedream 4.0还会生成一个链接地址,可以分享给别人,也可以嵌套在网页种。
3、商业摄影
意图理解,多图融合,组图生成。提示词“参考图1和图2,将图1男人和图2女人合成至一张相片,制作双人合影写真相片,生成四张不同动作的相片,白色相片边框,相片钉在毛毡板材质的照片墙上,周围贴着旅游明信片”。
效果如下:
4、特征保持
保持图片中的原有人物特征,改变其动作。prompt提示词 “参考图中人物形象,生成一张影视画面海报,一个男人坐在王座上”。
5、多图灵活创
Seedream 4.0 突破了传统单一输入输出模式限制,支持用户自由组合文本与图像,支持多图融合、组图生成、参考生图、文生图、图生图、视觉信号可控生成(理解草图、涂鸦、辅助线等视觉信号)、上下文推理生成(理解时间约束、三维空间等复杂语境)等创作模式,玩法创意多样。
提示词“图1的女生穿图2和图5的上衣,穿图3的鞋,穿图4的裤子,头戴图7的耳机,抱着图8的猫,坐在图10的沙发上,旁边一个巨大的图6,背景是9风格的几何空间”。
6、概念图转实物图
在商业设计场景中,Seedream 4.0 支持一键将概念图转化为实物图,快速验证方案可行性。同时,凭借主体稳定的增删改编辑功能,助力企业高效完成室内设计、产品设计、UI设计等各类创意任务,缩短从创意构思到落地执行的生产周期。
提示词:“参考第二张的装修风格,为第一张图生成装修后的效果图,具有家庭生活气息,照片饱满,布局精美,分别生成不同的装修方案,更换沙发的颜色和样式、不同颜色的墙面乳胶漆。”
以下是一些具有代表性的图片生成类提示词 prompt:
风景类
-
赛博朋克城市夜景:夜晚的未来城市天际线,霓虹灯,飞行汽车,Blade Runner 风格。
-
水墨画山水:月光下的古代中国城池,灯笼点点,雾气弥漫的街道,水墨画风格。
-
热带海滩风光:Design a tropical beach scene with palm trees, white sand, and turquoise water.(设计一个有棕榈树、白色沙滩和碧绿海水的热带海滩场景。)
人物类
-
梵高风格自画像:A self - portrait in the style of Van Gogh, with bold brushstrokes and swirling colors.(一幅梵高风格的自画像,笔触大胆,色彩 swirling。)
-
皮克斯风格卡通人物:Pixar style of Barbie and Ken in a playground.(皮克斯风格的芭比和肯在操场上。)
-
日漫风格超级英雄:Wonder woman,Niji style.(神奇女侠,日漫风格。)
动物类
-
超现实悬浮动物:A hyper - realistic photograph of a cat sliced into three glossy layers, each slice floating vertically in mid - air with glistening fur.(一张超写实的猫的照片,被切成三个光滑的层,每个切片垂直漂浮在空中,毛发闪闪发光。)
-
浮世绘风格动物:Ukiyo - e Art of a man reading with cats underneath a tree.(浮世绘风格,一个男人在树下读书,身边有猫。)
-
蒸汽朋克风格机械鸟:A mechanical bird in steampunk style, with gears, cogs, and metal wings, flying over a Victorian - era city.(一只蒸汽朋克风格的机械鸟,有齿轮、轮齿和金属翅膀,在维多利亚时代的城市上空飞翔。)
物体类
-
3D 立体几何图形:Generate a 3D image of a group of interconnected geometric shapes, such as cubes, spheres, and pyramids, with a metallic texture and soft lighting.(生成一组相互连接的几何图形的 3D 图像,如立方体、球体和金字塔,具有金属质感和柔和的灯光。)
-
复古相机:A vintage - style camera with a leather strap, brass details, and a lens that reflects the surrounding environment, in a soft - focus, sepia - toned photograph.(一台复古风格的相机,有皮革表带、黄铜细节和一个能反射周围环境的镜头,在一张柔焦、棕褐色调的照片中。)
-
梦幻水晶球:A crystal ball filled with a swirling galaxy, stars, and nebulae, with a glowing base and a magical, ethereal light.(一个水晶球,里面充满了旋转的星系、恒星和星云,有一个发光的底座和神奇、空灵的光。)
这是一个最好的时代,AI 工具在不断的进化,普通人学习 AI 的门槛被拉的很低,通过简单的学习,就能创作出精美的图片和视频。Seedream 4.0还有很多强大的功能等待我们挖掘。