OpenAI發布更新，實現實時跨音頻、視覺和文本推理

WEEX Blog 唯客博客， PANews 10月2日消息，據Cointelegraph報道，OpenAI在10月進行了四項重要更新，提升了AI模型的對話能力和圖像識別性能。首項重大更新是實時API，允許開發者通過單個提示創建人工智慧生成的語音應用，實現類似ChatGPT高級語音模式的自然對話。此前，開發者需要拼接多個模型來實現此類體驗，語音應用程序也通常存在較高延遲。藉助實時API的流媒體功能，開發者現在可以實現即時、自然的交互，類似語音助手的體驗。此外，OpenAI還推出了圖像微調工具，增強AI對圖像的理解能力，提升視覺搜索和物體檢測功能。開發者可以通過人類反饋優化AI生成的響應。其他更新還包括「模型蒸餾」和「提示緩存」，幫助小型模型向大型模型學習，並減少開發成本和時間。預計OpenAI的收入將在2025年增至116億美元，高於2024年的37億美元。 WEEX唯客交易所官網：weex.com