0 0 0

ChatGPT 图像输入功能使用方法和局限性

openai
13天前 89

什么是图像输入以及它们在 ChatGPT 中如何工作?

ChatGPT 现在具有图像功能,可以理解和解释您作为图像输入添加到对话中的图像。

我应该如何在对话中使用图像输入?

基本用途:上传照片即可开始。询问图像中的对象、分析文档或探索视觉内容。在稍后的回合中添加更多图像以加深或转移讨论。随时带着新照片回来。

注释图像:要引起对特定区域的注意,请考虑在上传之前在图像上使用照片编辑标记工具。这会引导 ChatGPT 专注于您认为重要的元素。

哪些计划可以使用图像输入?

Plus 和 ChatGPT Enterprise。

哪些型号可以接受图像输入?

GPT-4。

哪些平台可以输入图像?

所有平台,包括网络(chat.openai.com)和移动(iOS / Android)。

我的图像是否用于改进您的模型?

对于每种产品,我们使用内容(包括图像)的方法都是相同的。

请参阅如何使用您的数据来提高模型性能,以更好地了解如何使用 ChatGPT 上的内容来提高模型性能以及用户拥有的选择。

对于ChatGPT Enterprise,我们不使用内容来训练我们的模型。

如何在 ChatGPT 中添加图像输入?

确保模型选择器设置为 GPT-4,然后点击提示区域中的 + 图标以添加图像输入。

图像输入支持视频吗?

不,它不能处理视频。目前仅支持处理静态图像。

ChatGPT支持哪些文件类型?

PNG (.png)、JPEG(.jpeg 和 .jpg)和非动画GIF (.gif)。

我可以一次上传多少张图片?

您可以添加到对话中的图像数量取决于多种因素,包括图像的大小和伴随图像的文本量。作为一般准则,如果遇到问题,请考虑减少图像数量或大小。

每张图片的大小限制是多少?

20MB。

图像功能如何处理模糊或不清楚的图像?

如果图像不明确或不清楚,模型将尽力解释它。然而,结果可能不太准确。

用户在使用 ChatGPT 和图像输入时应注意哪些限制?

如果您使用 ChatGPT 的新图像输入功能,请务必注意以下限制:

  1. 医疗:该模型不适合解释 CT 扫描等专业医学图像,也不应用于提供医疗建议。

  2. 非英语:该模型在处理包含非拉丁字母文本(例如日语或韩语)的图像时表现不佳。

  3. 大文本:放大图像中的文本以提高可读性,但避免裁剪重要细节。

  4. 旋转:模型可能会误解旋转/颠倒的文本或图像。

  5. 视觉元素:模型可能难以理解颜色或样式(如实线、虚线或点线)变化的图形或文本。

  6. 空间:该模型难以处理需要精确空间定位的任务,例如识别国际象棋位置。

  7. 准确性:在某些情况下,模型可能会生成不正确的描述或标题。

  8. 形状:模型难以处理全景和鱼眼图像。

  9. 元数据和调整大小:模型不处理原始文件名或元数据,图像在分析之前会调整大小,从而影响其原始尺寸。

  10. 计数:可以给出图像中对象的近似计数。

AD:GPT-4官方账号:点击购买

请先登录后发表评论!

最新回复 (0)

    暂无评论

返回
请先登录后发表评论!