微軟發現GPT-4存在漏洞，易受「越獄」提示繞過安全措施

WEEX Blog 唯客博客， PANews 10月17日消息，據Techcrunch報道，微軟旗下研究團隊在新研究中發現，可能是由於GPT-4更傾向於遵循「越獄」提示，繞過模型內置的安全措施，因此在某些情況下，GPT-4比其他LLM更容易產生有毒、有偏見的文本。換句話說，GPT-4的良好「意圖」和改進的理解能力，在掌握在不當之人手中時，可能會導致它誤入歧途。研究寫道：「我們發現儘管GPT-4在標準基準上的可信度通常高於GPT-3.5，但在越獄系統或用戶提示下，GPT-4更容易受到攻擊，這些提示是惡意設計來繞過LLM的安全措施的，可能是因為GPT-4更準確地遵循（誤導性）指示。已確認所確定的潛在漏洞不會影響當前面向客戶的服務。」此外，研究團隊已將我研究成果分享給GPT的開發者OpenAI，它在相關模型的說明中已經注意到了潛在漏洞。 WEEX唯客交易所官網：www.weex.com

微軟發現GPT-4存在漏洞，易受「越獄」提示繞過安全措施

發佈留言