OpenAI 正在为 ChatGPT 引入突破性功能,使其能够通过使 AI 能够看到、听到和说话来打破障碍。用户交互的多模态和增强功能将在未来两周内推出,这是基于文本的交互的重大飞跃。以下是您需要了解的有关此版本的信息:
1.语音交互:
ChatGPT 将首次口头响应用户的查询,使其成为更具互动性和吸引力的对话伙伴。此功能将在 iOS 和 Android 上可用,用户可以选择使用语音与 AI 进行来回对话。
这使得 ChatGPT 与 Siri 和 Alexa 等知名语音助手直接竞争。
2. 增强的多模态交互:
用户现在可以向 ChatGPT 展示图像并就它们进行实时对话,从而获得更直观、更丰富的用户体验。此功能是在交互期间提供更多上下文的重要一步,可在所有平台上使用。
3. 个性化人工角色:
包括 Juniper、Breeze 和 Ember 在内的五个中立的人工角色将口头回答用户查询。最终,OpenAI 计划允许用户创建个性化的声音,从而拓宽用户体验。
4. 高级耳语引擎:
先进的 Whisper 引擎为 AI 语音提供动力,尽管其风格可能会让人觉得具有侵入性,但它们因其类似人类的交互而获得了积极的初步评价。
5. 基于订阅的访问:
新的语音和图像功能将是 ChatGPT Plus 订阅者独有的,价格为每月 20 美元,专注于为专用用户提供高级功能。
6. 解决道德问题:
OpenAI 有信心解决大多数错误,并专注于解决意识形态问题,包括潜在的语音欺诈、对不常见口音的歧视以及无意中将社会和政治包袱归因于 AI 的声音。他们确保通过 ChatGPT 中的照片对个人进行去匿名化的能力已被阻止。
7. 新用例:
这些功能提供了更通用的应用程序,允许用户拍摄地标或其冰箱内容物的照片,并就它们进行实时对话,从而在旅行、烹饪或学习等各种场景中提供帮助。
想查看新语音功能的测试并了解如何在 ChatGPT 中开始使用 Voice?我将在我的时事通讯“AI Hunters”中对其进行测试和审查。在那里,您可以找到最具突破性的 AI 仪器的新仪器和用例。订阅;完全免费!
总结:
随着这些新功能的引入,OpenAI 的 ChatGPT 有望变得更加互动和用户友好,使其更紧密地与用户的需求和偏好保持一致,并扩大其应用范围。
语音交互、图像识别、个性化 AI 角色和道德考虑的融合,都强调了 OpenAI 致力于提供创新和负责任的 AI 解决方案的承诺。
随着这些增强功能的部署,ChatGPT 不仅仅是另一个聊天机器人,而是正在成为一个多方面的助手,为其用户带来直观和丰富的体验。