메타마인드원격교육학원
Search
5개월 전  ·타임라인 피드 본문

'깊은 무지'를 학습한 AI 모델들이 생물무기 훈련에 저항한다

"Deep Ignorance"라고 명명된 이 연구는 AI 훈련 데이터셋에서 위험한 콘텐츠를 제거하는 것이 기존의 훈련 후 안전 조치보다 더 강력한 보호장치를 만들 수 있음을 입증합니다.

즉, AI 모델을 초기 학습시킬 때부터 위험한 내용을 제거한 데이터로 학습시킨 경우, 유저의 위험한 요청에 대하여 더 잘 거부한다는 뜻입니다. 예를 들어, 애초에 마약이나 폭탄 제조 방법을 제거한 데이터로 학습시킨 AI 모델에게 마약이나 폭탄을 제조해달라고 요청한 경우, 훈련 후 안전 조치를 적용한 모델보다 더 안전하게 대응한다는 이야기입니다.

이는 AI 모델을 학습시킬 때 사용되는 데이터가 얼마나 중요한지를 단적으로 보여주는 사례로 볼 수 있습니다.

자세히 보기: https://www.perplexity.ai/page/ai-models-taught-deep-ignoranc-hHeQ4wDJR.m8EuSdlZ335g

조회 127 ·
전체 0