分享一个类似gpt4v的视觉大模型FireLLaVA及免费api调用实现ui截图生成html代码-BFW编程笔记

分享一个类似gpt4v的视觉大模型FireLLaVA及免费api调用实现ui截图生成html代码

FireLLaVA-13b 是一个类似gpt4v的视觉语言模型，它基于开源语言模型生成的指令跟随数据进行训练。

该模型支持多图像和多提示生成，可以在 Fireworks.ai 上使用，也可以在本地使用 transformers 库运行。

使用 transformers 库运行模型时，需要确保 transformers 版本不低于 4.35.3，并遵循正确的提示模板（USER:ASSISTANT:）和添加标记的位置。

先看效果，我让他用bootstrap根据ui截图生成代码，他就生成了类似的代码。

800_auto

需要注意的是，模型单次仅支持单图对话。

Fireworks.ai 在线体验地址：https://fireworks.ai/models/fireworks/firellava-13b

Fireworks.ai api调用

Fireworks.ai api调用firellava方式：

先申请一个免费的Fireworks.ai的key

800_auto

新用户每月赠送50美元的tokens

800_auto

然后就可以在代码中采用http请求api进行图片识别对话了

import requests
import json

url = "https://api.fireworks.ai/inference/v1/chat/completions"
payload = {
  "model": "accounts/fireworks/models/firellava-13b"...

点击查看剩余70%

打赏博主×

分享一个类似gpt4v的视觉大模型FireLLaVA及免费api调用实现ui截图生成html代码

网友评论

{{item.title}}

豆包收费后国产其他ai软件也会跟进收费吗？

JPEG 与 HEIF图片格式区别？

centos7版本太旧无法安装python3.11，如何在docker中运行python3.11？

python如何做个RPA按键精灵的程序？

写一个windows的cmd的python代码如何在命令行中捕获获取复制粘贴的图片？

如何将别人爆款的抖音短视频短剧文案提取为seedance2的提示词？

阿里云域名dns云解析10万次日限额如何应对？

windows电脑如何提交上架ipa苹果应用？

有没有开源的实时的一张别人图片就能摄像头换脸的免费软件？

有没有视频高清的免费开源项目？