메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
동향자료
저자정보
김낙우 이동수 채원석 유호영 이상은 김현진
저널정보
한국전자통신연구원 [ETRI] 전자통신동향분석 전자통신동향분석 제40권 제1호
발행연도
2025.2
수록면
64 - 73 (10page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색

초록· 키워드

오류제보하기
As artificial intelligence (AI) technology becomes more integrated into society and the economy, interactions between AI systems and humans will become increasingly complex, making it essential for AI systems to accurately interpret and align themselves with human intentions and goals. If AI systems fail to do so or if they produce unintended side effects, the consequences could be unpredictable, leading to considerable social and economic challenges. AI alignment seeks to ensure that AI systems respect and adhere to human values and ethical principles, which are vital in sensitive domains, such as autonomous driving and medical diagnostic applications. To address this, training methodologies such as the supervised fine-tuning, reinforcement learning from human feedback, and parameter-effective training methods have been developed, along with evaluation techniques such as toxicity analysis, ethical assessments, stereotype and bias detection, and factuality evaluation. These methods measure how well AI models align with human values and social responsibilities. Such research is critical for ensuring the safety and accountability of AI systems, and South Korea is actively contributing to global efforts to improve AI safety.

목차

등록된 정보가 없습니다.

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

최근 본 자료

전체보기

댓글(0)

0