OpenAI在其API中推出新的语音智能功能
AI公司OpenAI周四表示,其 API现在将包括一系列新的语音智能功能,旨在帮助开发者创建能够与用户进行对话、转录以及翻译对话的应用。该公司的新款GPT‑Realtime‑2是另一个语音模型,旨在创建能够与用户对话的逼真语音模拟。然而,与其前代模型不同的是,这款模型采用了 GPT‑5 级别的推理能力,OpenAI公司表示该推理能力是为了处理用户更复杂的请求而创建的。该公司还推出了GPT‑Realtime‑Translate,正如其名,旨在提供与用户对话节奏 “保持同步” 的实时翻译服务。该功能包括超过70种输入语言和13种输出语言。最后,还推出了一项新的转录功能GPT‑Realtime‑Whisper,为用户提供在交互发生时即时捕捉的实时语音转文本功能。
—— Techcrunch
AI公司OpenAI周四表示,其 API现在将包括一系列新的语音智能功能,旨在帮助开发者创建能够与用户进行对话、转录以及翻译对话的应用。该公司的新款GPT‑Realtime‑2是另一个语音模型,旨在创建能够与用户对话的逼真语音模拟。然而,与其前代模型不同的是,这款模型采用了 GPT‑5 级别的推理能力,OpenAI公司表示该推理能力是为了处理用户更复杂的请求而创建的。该公司还推出了GPT‑Realtime‑Translate,正如其名,旨在提供与用户对话节奏 “保持同步” 的实时翻译服务。该功能包括超过70种输入语言和13种输出语言。最后,还推出了一项新的转录功能GPT‑Realtime‑Whisper,为用户提供在交互发生时即时捕捉的实时语音转文本功能。
—— Techcrunch