일요일, 12월 22
Shadow

#007 시맨틱-연관어

유의어ㆍ연관어 파악 주제별 분류
검색 트렌드ㆍ이슈 변화도 한눈에

한민옥 기자 mohan@dt.co.kr | 입력: 2009-12-23 21:02 | 수정: 2009-12-24 14:42

최근 검색 포털 시장에서 네이트의 기세가 빠르게 상승하고 있습니다. 네이트 운영업체 SK커뮤니케이션즈에 따르면 12월 둘째주 기준 네이트의 통합 검색 점유율은 10.23%로, 지난 2001년 출범이래 처음으로 두 자릿수를 돌파했습니다. 이같은 네이트 상승세의 일등공신으로 꼽히는 게 바로 시맨틱 검색인데요. 아직은 개념조차 다소 생소한 시맨틱 검색의 세계에 대해 알아보겠습니다.

시맨틱(semantic)이라는 단어를 사전에서 찾아보면 `의미의’ 또는 `의미론의’라는 뜻으로, 시맨틱 검색은 한마디로 의미 기반의 검색이라고 할 수 있습니다. 이에 따라 좀 광범위하긴 하지만 시맨틱 검색은 단순히 단어의 의미를 알아서 그 동의어와 유의어, 연관어를 파악해 한번에 검색할 수 있음을 의미하기도 하고, 검색자의 마음을 읽는 맞춤 검색이라는 의미로 개인화 검색을 포함하기도 합니다. 현재 포털업계에서 얘기하는 시맨틱 검색은 주로 기존 키워드 매칭 방식의 한계를 보완하는 차세대 검색, 대안 검색의 이미지가 강합니다.

◇시맨틱 검색은 어떤 원리로 가능할까요?=시맨틱 검색은 의미를 이해하는 검색이라는 목표를 가지고 다양한 접근 방식으로 서비스를 제공합니다. 우선 가장 간단하게는 단어의 의미를 정의해 유의어, 동의어, 연관어를 파악합니다.

예를 들어 특정인의 출신 학교를 확인하고 싶을 때 아무개 출신학교라고 검색하면, 일반 검색에서는 아무개와 출신학교라는 키워드가 들어간 정보만을 찾아줍니다. 출신학교라는 키워드가 들어있지 않은 콘텐츠는 검색 대상에서 제외됩니다. 하지만 시맨틱 검색에서는 출신학교라는 키워드가 포함되지 않았어도 학력, 졸업, 수학, 공부 등의 단어가 출신학교 정보와 연관돼 있음을 인지하고 이를 함께 검색해 최종적으로 검색자가 원하는 정보를 빠르게 찾아줄 수 있는 것입니다.

이를 통해 비슷한 정보를 같은 주제어 하에 묶어서 사용자들이 보기 쉽게 전달하는 주제별 분류가 가능합니다. 주제별 분류는 사용자가 어떤 키워드에 대해 총괄적인 정보를 얻고자 할 때 매우 유용합니다.

◇시맨틱 검색은 언제 유용할까요?=시맨틱 검색은 한번의 검색으로 총괄적인 정보를 얻고자 할 때 유용합니다. 주제별로 정보를 자동 분류해주는 시맨틱 검색의 특성상 한번의 검색으로 필요한 정보를 항목별로 다양하게 얻을 수가 있습니다.

예를 들어 대상포진의 발병원인이 궁금할 때 기존 검색은 대상포진과 원인이라는 두 키워드가 들어간 콘텐츠를 찾아줍니다. 또한 정보의 의미가 아닌 블로그의 내용인지, 뉴스의 내용인지 등 출처를 분류해 정보를 제공하기 때문에 같은 정보가 중복될 가능성이 높습니다.

시맨틱 검색은 주제별 분류와 예상 답변을 분류해 보기 좋게 정리했습니다. 대상포진을 한번만 검색해도 원인 뿐 아니라, 예방법, 발병부위, 치료법, 증상 등을 확인할 수 있습니다. 왼쪽에 주제별로 구분하고 오른쪽에 해당 주제어에 대한 예상답변을 뽑아 보여줍니다. 주제어는 웹 콘텐츠에서 구문분석을 통해 추출한 것으로 최대 50개까지 제공됩니다.

◇키워드에 대한 1년간의 주요 이슈 확인 가능=시맨틱 검색에서는 키워드의 일별 검색 횟수를 분석해서 최근 1년 동안의 검색 트렌드와 이슈의 변화를 한눈에 볼 수 있게 해주는 이슈 타임라인 서비스도 제공합니다.

배우 이병헌을 검색하면 검색창 오른쪽에 막대그래프 형태의 이슈 타임라인이 그려집니다. 진하게 색칠된 부분이 특히 검색어 입력 횟수가 많았던 날로, 마우스를 가져가면 해당 키워드를 알려줍니다. 11월 23일 경에는 이병헌 부상 키워드가, 11월 말에는 이병헌 `피나시’라는 키워드가 뜹니다. 드라마 아이리스에서 총을 맞은 이병헌이 입고 있던 소매 없는 티셔츠를 흉내내 온라인 쇼핑몰에서 피색깔을 무늬로 넣은 티셔츠를 판매한 것이 화제가 된 것입니다. 또 12월 16일경부터는 이병헌 여자친구, 이병헌 여자친구 어머니 등의 키워드가 주로 검색되었으며, 신종플루 확진 뉴스까지 한눈에 볼 수 있습니다.

하지만 이같은 장점들에도 불구하고 시맨틱 검색은 아직은 갈 길이 먼 서비스라는 게 중론입니다. 그 중에서도 주제별 분류를 얼마나 의미 있게, 누락과 중복 없이 제공할 수 있느냐 하는 문제와 웹 콘텐츠 기반으로 한 예상 답변이 얼마나 신뢰성을 가질 수 있느냐의 문제는 앞으로 시맨틱 검색이 해결해야 할 과제입니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.