ChatGPT再进化!能接受语音、图片输入指令,加强AI聊天机器人互动

OpenAI 针对 ChatGPT 推出了新升级功能,很快升级版用户将可以语音方式直接向 ChatGPT 输入指令、此外它也将能读懂用户上传的图片。
(前情提要:ChatGPT上线Canva扩充功能!可快速生成图片、影片内容)
(背景补充:ChatGPT企业版上线!OpenAI客制模型、共享对话…六大功能一次看)

本文目录

OpenAI 开发的人工智慧聊天机器人 ChatGPT,在 25 日宣布将正式支援用户以口说的方式来输入指令,且 GPT 将能够直接与用户语音对话、同时还将能读懂用户上传的图片。

官方表示语音、图像辨识新功能将在 2 周内部署给 ChatGPT Plus 及企业(Enterprise)用户;同时官方表示很快也会推向开发人员及免费版用户,但尚未给出详细时间。

延伸阅读:ChatGPT企业版上线!OpenAI客制模型、共享对话..六大功能一次看

可透过语音向 ChatGPT 输入指令

官方说明,用户马上可以使用语音功能来与 ChatGPT 进行来回对话,例如为您的孩子播放睡前故事、给你晚餐的建议、练习口说能力…应用范围广泛。

如何开启语音功能?

(一)若要开启语音功能,官方表示需前往行动应用程式上的「设定」→「新功能」

(二)然後选择加入语音对话

(三)点击主画面右上角的耳机按钮,还可以从五种不同的声音中选择你喜欢的声音

ChatGPT 可读懂图片

很快的,用户可以点击照片按钮拍摄或选择影像,丢给 ChatGPT 来执行更多元的指令。例如可以拍下冰箱内部的照片就可取得餐点食谱建议,或是拍下孩子的数学作业照片就能帮忙解决题目。

GPT 的模型能读懂照片、萤幕截图以及包含文字和图像的文件。其实早在今年 3 月时,OpenAI 在发布 GPT-4 时就展示过看图的功能,但由於当时安全性以及功能不完善等原因,直到近期才决定开放权限。

📍相关报导📍

OpenAI传破产危机?报告:ChatGPT每日烧2000万、用户流失超两成

实测》Etherscan即时聊天App「Blockscan Chat」,用以太坊钱包和V神对话

CoinFund谈投资Worldcoin:除了ChatGPT之父,更看重WLD的全球愿景..

Leave a Reply

Your email address will not be published. Required fields are marked *