Dify 1.4.0 多模态来了所想即所得

大模型向量数据库云存储

字数 312,阅读大约需 2 分钟

🚀Dify v1.4.0 两个新功能
🌙 黑暗模式

推出了主题切换器,可以轻松切换亮色和暗色模式,非常适合深夜编程。点击头像体验!

🖼️ 多模态 LLM 输出

支持多模态输出,允许 LLM 在 LLMNode 中同时处理文本和图像。

picture.image

升级前 vs 升级后 的对比图

picture.image

dify升级换图标了

两个案例如下

picture.image

picture.image

多模态工作流示例

名称 :多模态助手
整体工作流 :1.开始 -- 2.LLM节点(选 gemini-2.0-flash-exp)-- 3.结束
功能 :开启”文件上传“,支持文件类型选择”图片“

picture.image

picture.image

:模型只能选 gemini-2.0-flash-exp

详见 https://github.com/langgenius/dify/pull/17372

配置Gemini

大家手里如果没有 gemini 的api,可以使用这个API平台 Let's API 练手,支持github登录,签到有福利(但不多,仅供测试)。

https://api.aigc369.com/register?aff=5rkG

picture.image

如何使用 gemini-2.0-flash-exp

1、添加令牌 API-KEY

2、在 Cherry Studio 中测试 API-KEY (这步可选)

picture.image

3、在dify的模型供应商中配置 gemini-2.0-flash-exp

picture.image

picture.image

最后

可是我用dify v1.2.0,LLM选 gemini-2.0 flash exp 也能多模态输入输出呀,更新了个寂寞。。。

picture.image

测试图片如下

picture.image

模特

picture.image

房子

dify v1.4.0官方更新日志[1]

引用链接

[1] dify v1.4.0官方更新日志: https://github.com/langgenius/dify/releases

picture.image

picture.image

点击下方卡片 关注我们

picture.image

  
📢【三连好运 福利拉满】📢  
  
🌟 若本日推送有收获:  
👍 点赞 → 小手一抖,bug没有  
📌 在看 → 一点扩散,知识璀璨  
📥 收藏 → 代码永驻,防止迷路  
🍻 分享 → 传递战友,功德+999  
🔔 关注 → 关注“AI早高峰”,追更不迷路,干货永同步  
  
💬 若有槽点想输出:  
👉 评论区已铺好红毯,等你来战!  

picture.image

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
火山引擎大规模机器学习平台架构设计与应用实践
围绕数据加速、模型分布式训练框架建设、大规模异构集群调度、模型开发过程标准化等AI工程化实践,全面分享如何以开发者的极致体验为核心,进行机器学习平台的设计与实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论