시맨틱 검색에 대해 많이 회자되면서 시맨틱 검색의 정의나 방향에 대한 얘기도 많이 쏟아져 나오고 있습니다. 시맨틱 검색에 대한 정의의 방향이야 말로 “시맨틱스”가 필요한 대상이 아닌가 할 정도입니다. 예를 들면, “문장이나 단락에 기술된 주제를 파악하고 이를 대상으로 검색하는 것”이라는 정의에서 “사용자의 검색 의도와 의미를 정확히 파악해주는 검색”이라는 정의도 있고, 기술적으로는 “RDF 와 같은 시맨틱 웹 기술을 사용한 검색” 이라고 범위를 좁혀 사용하는 경우도 있습니다.
정의는 나름 해야겠지만, 잠시 생각을 다른 방향으로 틀어 보면, 우리에게 왜 시맨틱 검색이 필요한 걸까라는 질문을 하게 됩니다. 아주 오래 전에 엠파스에서 “자연어 검색”이라는 용어를 사용하면서, 자연어 검색은 기존 키워드 검색 보다 검색어를 입력하기가 훨 편하다는 장점과 혜택을 강조하였었습니다. 여기에는 사람은 기계와는 달리 문장으로 생각을 표현하거나 검색 의도를 표현하기에 더 친숙하다는 배경이 있습니다. 우리에게 왜 자연어 검색이 필요하냐는 질문을 하면, 그 대답은 위와 같이 사람은 검색식 보다는 자연어 문장에 더 익숙하기 때문이라고 답하면 될 것입니다.
너무 당연한 얘기를 길게 썼는데요, 다시 시맨틱 검색이라는 주제로 돌아오면 얼마 전에 심리학과 교수가 쓴 “행복에 걸려 비틀거리다” (원제: Stumbling on happiness, Daniel Gilbert 지음) 라는 책을 읽으면서 우리에게 시맨틱 검색이 필요한 이유를 발견하는 계기를 가졌습니다. 심리학 연구 결과, 뇌는 현실을 있는 그대로 반영하지 않고 왜곡하여 정보를 받아들이거나 채워서 저장한다고 합니다. 위 책에서 소개한 실험 내용 중 일부 입니다. 먼저 아래 단어 목록을 읽고, 손으로 이 목록을 재빨리 가립니다.
침대, 휴식, 깨어 있는, 피곤함, 꿈, 일어나기, 졸기, 담요,
꾸벅꾸벅, 선잠, 코골기, 낮잠, 평화, 하품하기, 나른한
|
다음의 단어들 가운데 목록에 없던 단어는 무엇인가요?
침대, 졸기, 잠자기, 가솔린
|
많은 사람들이 가솔린만을 선택하지만, 실제로는 잠자기라는 단어도 목록에 없던 단어인데, 사람의 뇌는 각각의 단어를 모두 기억하기 보다는 단어의 핵심, 즉 잠자기와 관련된 단어의 집합이라고 저장을 하기에 잠자기라는 단어를 명확히 본 기억이 있다는 확신을 한다고 합니다.
사람의 뇌는 이처럼 주제를 파악하여 기억하려 함으로써, 없던 사실을 채워 넣기도 한다는 사실인데요, 시맨틱 검색이 나열된 단어만이 아닌 그 단어들의 관련성과 핵심을 파악(주제, 의미)하기란 점에서 사람을 닮은 검색이 시맨틱 검색이라는 생각도 해 보았습니다.
이처럼 사람의 뇌는 기계적으로 있는 그대로 인식하여 저장하지는 않을 뿐만 아니라 모호한 자극과 여러 가지 의미로 해석이 가능한 상황에서 맥락(Context), 빈도(Frequency), 최신성(Recency) 등에 영향을 받아 자극을 받아들이고 해석한다고 합니다. 예를 들어 Bank 라는 단어를 보게 되면, 은행인지, 강둑인지를 판단해야 하는데 주변에 사용된 단어를 보고 판단하고(Context), 평소에 자주 사용한 의미로 해석하고(Frequency), 최근에 사용한 의미로 쓰려는 경향이 크다는 말입니다.
이제 제가 던진 질문에 자답을 해야겠습니다. 시맨틱 검색이 필요한 이유는 사람은 실제 자극(단어)에 반응하지 않고 의미에 반응하기 때문이라고 봅니다. 아울러 개인의 선호, 시간 장소 등 주변 맥락, 여러 사용자 들의 사용 빈도, 지식 생성 시기 등과 같은 사람의 인지 심리적 특성을 닮은 기능을 갖춘 시맨틱 검색이 더욱 사람들에게 만족스런 결과를 제시할 수 있을 것입니다. 왜냐면, 사람의 뇌가 자극을 이해하고 저장하는 방식이 <시맨틱 스럽기> 때문입니다.
솔트룩스 김건오