WEEX Blog 唯客博客, PANews 10月17日消息,據Techcrunch報道,微軟旗下研究團隊在新研究中發現,可能是由於GPT-4更傾向於遵循「越獄」提示,繞過模型內置的安全措施,因此在某些情況下,GPT-4比其他LLM更容易產生有毒、有偏見的文本。換句話說,GPT-4的良好「意圖」和改進的理解能力,在掌握在不當之人手中時,可能會導致它誤入歧途。 研究寫道:「我們發現儘管GPT-4在標準基準上的可信度通常高於GPT-3.5,但在越獄系統或用戶提示下,GPT-4更容易受到攻擊,這些提示是惡意設計來繞過LLM的安全措施的,可能是因為GPT-4更準確地遵循(誤導性)指示。已確認所確定的潛在漏洞不會影響當前面向客戶的服務。」此外,研究團隊已將我研究成果分享給GPT的開發者OpenAI,它在相關模型的說明中已經注意到了潛在漏洞。 WEEX唯客交易所官網:www.weex.com