OpenAI在其API中推出新的语音智能功能

OpenAI在其API中推出新的语音智能功能

AI公司OpenAI周四表示，其 API现在将包括一系列新的语音智能功能，旨在帮助开发者创建能够与用户进行对话、转录以及翻译对话的应用。该公司的新款GPT‑Realtime‑2是另一个语音模型，旨在创建能够与用户对话的逼真语音模拟。然而，与其前代模型不同的是，这款模型采用了 GPT‑5 级别的推理能力，OpenAI公司表示该推理能力是为了处理用户更复杂的请求而创建的。该公司还推出了GPT‑Realtime‑Translate，正如其名，旨在提供与用户对话节奏 “保持同步” 的实时翻译服务。该功能包括超过70种输入语言和13种输出语言。最后，还推出了一项新的转录功能GPT‑Realtime‑Whisper，为用户提供在交互发生时即时捕捉的实时语音转文本功能。

—— Techcrunch

OpenAI在其API中推出新的语音智能功能

联系人表单