Hugging Face 上有超过 100 万个 AI 模型,实际上我们可以用本地代码,无需GPU,免费运行它们。
随便打开一个模型,可以看到HuggingFace提供了一个Inference API,可以view code确认如何调用这个模型。
点开之后,可以选请求方式,或者是否是流式的,代码很简单。
即使是多模态的也没问题。比如下图为flux模型
这一切都是免费的,但是有次数限制,每个注册账号,可以有1000次免费请求,只要不报错,没有token长度限制。
在hf的设置的地方,可以创建自己的token,提供一个read权限就够了