首页
下载
文档
问答社区
视频
捐赠
源代码
AI 助理
赞助商
CRMEB
Apipost
腾讯云
微擎
禅道
51Talk
商业产品
Swoole AI 智能文档翻译器
Swoole-Compiler PHP 代码加密器
CRMEB 新零售社交电商系统
登录
注册
全部
提问
分享
讨论
建议
公告
开发框架
CodeGalaxy
发表新帖
SwooleAI 助理 的 GPT-4V 和 DALL·E 3 画图功能
就在昨天的 11月6日 旧金山的 OpenAI 首次开发者大会上,OpenAI 公司公布了一系列工具更新,其中比较有趣的 `GPT-4V` 和 `DALL·E 3` 画图功能也向面向所有开发者开放。 OpenAI 更新 ---- ![](https://wenda-1252906962.file.myqcloud.com/uploads/202311/1_654a163135c8f.png) Swoole AI 助理 2.3 版本 ---- 我们在收到更新后在第一时间发布了 `SwooleAI 助理` 的 `2.3` 版本,支持了 `GPT-4V` 和 `DALL·E 3` 这两个最新的特性。 1. 支持了 `GPT-4V` (`gpt-4-vision-preview`) ,可向模型发送图像并获得有关图像的问题回答 2. 支持了 `Dall.E 3` 画图,分为两个模型 `OpenAI-v3` 和 `OpenAI-v3-高清` 3. 调整了费率,与 `OpenAI` 保持一致,输入和输出应用不同的倍率 4. `GPT-4` 价格下调一倍 5. `GPT` 模型知识库更新到了 `2023 年 4 月` 现在可以付费订阅 `SwooleAI 助理源码了`,包含所有功能,价格为 `398 元`,可终身使用,永久更新。详情请见 <a href="https://wenda.swoole.com/detail/109160" target="_blank">https://wenda.swoole.com/detail/109160</a> GPT-4V ---- 最早的 `GPT-3` 和 `GPT-4` 只能处理文本内容,无法理解图片、视频、音频等多媒体格式内容。`GPT-4V` 是 `OpenAI` 推出多模态大模型,它可以接收图像并回答有关图像的问题。 在 `SwooleAI 助理` 的模型列表中找到 `GPT-4V` 点击即可使用。也可以创建会话,然后切换到 `GPT-4V` ,就可以看到最下面的输入框左侧多了一个“图片”的 `icon`,点击打开后可以选择图片。 ![](https://wenda-1252906962.file.myqcloud.com/uploads/202311/1_654a1888691ec.png) ![](https://wenda-1252906962.file.myqcloud.com/uploads/202311/1_654a19135d08e.png) 这些图片将作为附件发送给 `GPT-4V`, `GPT-4V` 会理解图像中的内容,然后做出回答。 ![](https://wenda-1252906962.file.myqcloud.com/uploads/202311/1_654a182e9fa95.png) `GPT-4V` 的功能非常强大,相比 `ChatGPT` 又是一个新的里程碑式产品。 DALL·E 3 --- 早期 `OpenAI` 提供的画图模型 `DALL·E 2` 效果非常差,相比 `Midjouney` 和开源的 `Stable Diffusion` 存在较大的差距。最新公布的`DALL·E 3` 新版画图 `AI` 彻底改变了这一局面。它对于自然语言理解的能力更强,效果非常好。 ![](https://wenda-1252906962.file.myqcloud.com/uploads/202311/1_654a1a24a6256.png) 使用非常简单, `SwooleAI 助理` 提供了两个模型选项 `OpenAI-v3` 和 `OpenAI-v3-高清` ,使用其中一个模型创建画图的绘画即可。`DALL·E 3` 基于 `GPT-4` 的大语言模型,不需要进行中英文的翻译,直接输入中文内容发送即可。`高清` 模型侧重与图像质量,而`非高清`模型则可以提供更快的生成速度。 > 目前一次只支持生成 `1` 张图片,不支持进度查询,等待后续版本中进行优化 可以看到生成的图片画质非常高,包括最困难的人物手脚部分都是正确的。这一点已经大幅超越了 `Midjouney` 和 `Stable Diffusion` ,非常值得一试。 注意目前 `DALL·E 3` 价格还是比较昂贵的,最高分辨率、高清模式下一张照片的价格超过了 `1元` 人民币。 ![](https://wenda-1252906962.file.myqcloud.com/uploads/202311/1_654a1b8977a4f.png) 大家快来体验吧 [https://chat.swoole.com/](https://chat.swoole.com/) 微信交流群 ---- ![](https://wenda-1252906962.file.myqcloud.com/images/wxg.jpg?cache=2023107)
发布于1年前 · 27 次浏览 · 来自
分享
Rango
就在昨天的 11月6日 旧金山的 OpenAI 首次开发者大会上,OpenAI 公司公布了一系列工具更新,其中比较有趣的 `GPT-4V` 和 `DALL·E 3` 画图功能也向面向所有开发者开放。 OpenAI 更新 ---- ![](https://wenda-1252906962.file.myqcloud.com/uploads/202311/1_654a163135c8f.png) Swoole AI 助理 2.3 版本 ---- 我们在收到更新后在第一时间发布了 `SwooleAI 助理` 的 `2.3` 版本,支持了 `GPT-4V` 和 `DALL·E 3` 这两个最新的特性。 1. 支持了 `GPT-4V` (`gpt-4-vision-preview`) ,可向模型发送图像并获得有关图像的问题回答 2. 支持了 `Dall.E 3` 画图,分为两个模型 `OpenAI-v3` 和 `OpenAI-v3-高清` 3. 调整了费率,与 `OpenAI` 保持一致,输入和输出应用不同的倍率 4. `GPT-4` 价格下调一倍 5. `GPT` 模型知识库更新到了 `2023 年 4 月` 现在可以付费订阅 `SwooleAI 助理源码了`,包含所有功能,价格为 `398 元`,可终身使用,永久更新。详情请见 <a href="https://wenda.swoole.com/detail/109160" target="_blank">https://wenda.swoole.com/detail/109160</a> GPT-4V ---- 最早的 `GPT-3` 和 `GPT-4` 只能处理文本内容,无法理解图片、视频、音频等多媒体格式内容。`GPT-4V` 是 `OpenAI` 推出多模态大模型,它可以接收图像并回答有关图像的问题。 在 `SwooleAI 助理` 的模型列表中找到 `GPT-4V` 点击即可使用。也可以创建会话,然后切换到 `GPT-4V` ,就可以看到最下面的输入框左侧多了一个“图片”的 `icon`,点击打开后可以选择图片。 ![](https://wenda-1252906962.file.myqcloud.com/uploads/202311/1_654a1888691ec.png) ![](https://wenda-1252906962.file.myqcloud.com/uploads/202311/1_654a19135d08e.png) 这些图片将作为附件发送给 `GPT-4V`, `GPT-4V` 会理解图像中的内容,然后做出回答。 ![](https://wenda-1252906962.file.myqcloud.com/uploads/202311/1_654a182e9fa95.png) `GPT-4V` 的功能非常强大,相比 `ChatGPT` 又是一个新的里程碑式产品。 DALL·E 3 --- 早期 `OpenAI` 提供的画图模型 `DALL·E 2` 效果非常差,相比 `Midjouney` 和开源的 `Stable Diffusion` 存在较大的差距。最新公布的`DALL·E 3` 新版画图 `AI` 彻底改变了这一局面。它对于自然语言理解的能力更强,效果非常好。 ![](https://wenda-1252906962.file.myqcloud.com/uploads/202311/1_654a1a24a6256.png) 使用非常简单, `SwooleAI 助理` 提供了两个模型选项 `OpenAI-v3` 和 `OpenAI-v3-高清` ,使用其中一个模型创建画图的绘画即可。`DALL·E 3` 基于 `GPT-4` 的大语言模型,不需要进行中英文的翻译,直接输入中文内容发送即可。`高清` 模型侧重与图像质量,而`非高清`模型则可以提供更快的生成速度。 > 目前一次只支持生成 `1` 张图片,不支持进度查询,等待后续版本中进行优化 可以看到生成的图片画质非常高,包括最困难的人物手脚部分都是正确的。这一点已经大幅超越了 `Midjouney` 和 `Stable Diffusion` ,非常值得一试。 注意目前 `DALL·E 3` 价格还是比较昂贵的,最高分辨率、高清模式下一张照片的价格超过了 `1元` 人民币。 ![](https://wenda-1252906962.file.myqcloud.com/uploads/202311/1_654a1b8977a4f.png) 大家快来体验吧 [https://chat.swoole.com/](https://chat.swoole.com/) 微信交流群 ---- ![](https://wenda-1252906962.file.myqcloud.com/images/wxg.jpg?cache=2023107)
赞
0
分享
收藏
提问
分享
讨论
建议
公告
开发框架
CodeGalaxy
评论
还没有评论!
微信公众号
热门内容
作者其它话题
- CodeGalaxy K3s 轻量集群节点之间如何实现负载均衡
- 有没有办法判断当前是否运行在swoole守护进程里面?
暂无回复的问答
- CodeGalaxy K3s 轻量集群节点之间如何实现负载均衡
- 关于openssl CURL WARNING swSSL_connect: SSL_connect(fd=69) failed. Error: error:141A318A:SSL routines:tls_process_ske_dhe:dh key too small[1|394]
- 多个模型如何进行事务异常回退?
- websocket开启wss报错
- 协程tcp服务器如何使用多进程?recv()方法接收信息,打印出来的pid一直是同一个。没用使用到多进程啊。