메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학술저널
저자정보
이지연 (한라대학교) 김동현 (한라대학교) 이영애 (한라대학교) 김순석 (한라대학교)
저널정보
아태인문사회융합기술교류학회 아시아태평양융합연구교류논문지 Asia-pacific Journal of Convergent Research Interchange Vol.10 No.9
발행연도
2024.9
수록면
45 - 54 (10page)
DOI
http://dx.doi.org/10.47116/apjcri.2024.09.05

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색

초록· 키워드

오류제보하기
정형데이터란 일반적으로 테이블에서 하나의 셀 내에 하나의 문자나 혹은 숫자로 구성된 데이터를 말한다. 만일 여기서 하나의 셀 내에 하나의 문자나 혹은 숫자가 아니라 여러 문자나 혹은 숫자들의 집합 값으로 구성된 경우, 우리는 이것을 반정형 데이터라 부른다. 예로 우리가 마트에서 구매한 일련의 물품 아이템 들이나 혹은 병원에서 환자에 대한 여러 병명들에 대한 목록이 그러하며, 이때 한 명에 대한 집합 값들로 구성된 목록을 하나의 트랜잭션이라 부른다. 우리는 이러한 일련의 집합값들로 구성된 반정형 트랜잭션 데이터셋에서 개인정보보호를 위한 익명화 문제를 다룬다. 즉, 개인이 구매한 상품 목록이나 혹은 환자의 병명에 대한 사항들은 민감정보로서 개인의 프라이버시 차원에서 보호되어야 할 개인정보들이기 때문이다. 이러한 익명화 문제와 관련하여 우리는 기존의 LG (Local Generalization) 알고리즘을 개선하여 LGR (Local Generalization & Reallocation)이라는 새로운 알고리즘을 제안한바 있다. 그러나 만일 우리가 익명화된 개인정보들을 활용하거나 분석하는 관점에서 바라보면 안전하기도 해야하지만 이에 못지 않게 데이터가 쓸모가 있어야 한다. 즉 데이터 품질이 분석에 용이하도록 유용해야한다. 이는 반대로 익명화 과정에서 정보 손실이 최소화 되어야한다는 것과 동일한 의미를 갖는다. 기존 우리의 LGR 알고리즘은 정보 손실을 계산하기 위한 측도로 기존 LG 알고리즘과 동일한 NCP (Normalized Certainty Penalty)를 사용하였다. NCP 측도는 전체 아이템 수 대비 일반화된 아이템의 비율로 계산된다. 따라서 계산이 단순하고, 다양한 데이터셋에 쉽게 적용할 수 있는 장점이 있지만, 그 반대로 정보 손실이 많아 데이터의 유용성을 떨어뜨릴 수 있는 단점이 있다. 우리는 이러한 단점을 개선하고자 새로운 IGH (Information Gain-based Heuristic) 측도를 새로이 제안하고 이를 이론적으로 검증해 보고자 한다. 제안하는 측도는 기존 NCP 방식에 비하여 정보 손실을 최소화하고 데이터의 유용성을 최대한 보존할 수 있는 장점이 있다.

목차

등록된 정보가 없습니다.

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

최근 본 자료

전체보기

댓글(0)

0