메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
전혁수 (NHN Corporation) 최중민 (한양대학교)
저널정보
Korean Institute of Information Scientists and Engineers 정보과학회논문지 : 소프트웨어 및 응용 정보과학회논문지 : 소프트웨어 및 응용 제39권 제9호
발행연도
2012.9
수록면
750 - 758 (9page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
트랙백은 블로그와 같은 1인 미디어에서 주로 사용하는 기능으로, 자신이 작성하여 게시한 글의 링크를 원하는 대상의 글에 자동적으로 생성해 준다. 트랙백은 원문 포스트에 트랙백에 대한 링크를 생성해줌으로써 1인 미디어를 지향하는 블로그들 사이의 연결고리를 생성하여 소통 네트워크를 만들어 내는 역할을 한다. 또한 자신의 블로그에 글을 쓰기 때문에 덧글을 다는 것보다 더 자유롭게 글을 쓸 수 있다는 장점이 있다. 하지만 이러한 자유로움을 악용해 트랙백 스팸을 유발하여 네트워크의 자원을 낭비하고 방문자들에게 잘못된 정보를 전달해 해당 포스트의 신뢰를 떨어뜨리는 경우가 종종 발생한다. 트랙백 스팸은 유명한 포스트와 연계하여 자신의 포스트로 사용자들을 유도하는 특징을 가지기 때문에 일반적인 웹 스팸을 탐지하는 기술을 적용하기 어렵다. 본 논문에서는 자신이 작성한 글이 다른 사람의 글과 관련이 있다고 생각하여 다른 사람의 글에 자신의 글을 링크시키는 트랙백의 특성을 이용하여 트랙백 스팸 탐지 방법을 제안한다. 제안하는 방법의 주된 아이디어는 원문 페이지와 트랙백 페이지, 그리고 트랙백 페이지의 아웃링크 내용상의 유사도와 트랙백 페이지 내의 문장이 원문에 포함되는지 그리고 트랙백 페이지의 내용에서 링크의 비율을 분석한 것이다. 이진 분류기에서 많이 사용되는 SVM과 비교한 실험을 통해 햄(ham)과 스팸에 대한 재현율의 조화평균 값이 약 19% 나은 성능이 나왔고, 이를 통해 제안한 시스템의 성능이 만족스러움을 확인하였다.

목차

요약
Abstract
1. 서론
2. 관련 연구
3. 시스템 구조
4. 문서 의미 유사도 측정
5. 실험
6. 결론 및 향후 연구과제
참고문헌

참고문헌 (12)

참고문헌 신청

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0101-2013-569-003196751