OpenAI發布更新,實現實時跨音頻、視覺和文本推理

WEEX Blog 唯客博客, PANews 10月2日消息,據Cointelegraph報道,OpenAI在10月進行了四項重要更新,提升了AI模型的對話能力和圖像識別性能。首項重大更新是實時API,允許開發者通過單個提示創建人工智慧生成的語音應用,實現類似ChatGPT高級語音模式的自然對話。此前,開發者需要拼接多個模型來實現此類體驗,語音應用程序也通常存在較高延遲。藉助實時API的流媒體功能,開發者現在可以實現即時、自然的交互,類似語音助手的體驗。 此外,OpenAI還推出了圖像微調工具,增強AI對圖像的理解能力,提升視覺搜索和物體檢測功能。開發者可以通過人類反饋優化AI生成的響應。其他更新還包括「模型蒸餾」和「提示緩存」,幫助小型模型向大型模型學習,並減少開發成本和時間。預計OpenAI的收入將在2025年增至116億美元,高於2024年的37億美元。 WEEX唯客交易所官網:weex.com

Previous:

Next: