반복되는 검색어 순위 조작 [뉴미디어 세상] 2009/10/05 20:00:00
트랙백 주소 :

검색어 순위 조작 사건이 또 적발됐다.이번에도 주요 타깃은 네이버였다.

서울중앙지검 첨단범죄수사2부(위재천 부장검사)는 5일 악성프로그램을 이용해 포털사이트 네이버의 실시간 검색어 순위를 조작하고 금품을 받은 혐의(정보통신망이용 촉진 및 정보보호 등에 관한 법률) 등으로 프로그래머 서모(25)씨를 불구속 기소했다.

이번에 적발된 사건은 지난 해 11월 광고대행사직원 안모씨의 사례와 유사하다.당시에도 안씨는 2006년부터 2년간 악성 프로그램을 이용해 네이버 등 포털 사이트 검색창에 광고 의뢰를 받은 117개 업체의 이름을 반복 입력하는 수법으로 검색 순위를 끌어올려 주고 금품(3000여만원)을 받은 혐의로 구속됐었다.당시 안씨는 5만여대의 일반인 PC를 좀비PC로 만들어 검색어 순위 조작에 이용했다.

당시와 이번 사건이 달라진 점이 있다면 규모가 더 커졌다는 점이다.이번 서모씨의 경우는 10만대가 넘는 PC를 좀비PC로 활용했고 사례금도 1억원이 넘었다.

특정 IP에서 동일한 검색어가 집중적으로 반복될 경우 이를 1로 처리하지만 한꺼번에 여러대의 PC에서 검색어가 반복될 경우엔 이를 걸러내기가 거의 불가능한 시스템을 악용한 것이다.

이런 사례는 규모가 크다보니 적발됐을 뿐이다.검색어 순위 조작 의심 사례는 수시로 발생하고 있고 때문에 관련 사례에 대해선 네이버 같은 포털 내에서 가장 언급하길 꺼리는 사안 중 하나다.네이버에서는 이번 사안의 중대성에 비춰 검찰의 수사에 적극 협조해다고 한다.

사실 이런 문제는 기본적으로 '검색어 순위'라는 시스템 자체에 기인하고 있긴 하다.순위 자체가 돈이 되는 상황에서(마치 베스트셀러 목록과 같다.리스트 상위에 오를 수록 더 방문자나 구매자가 몰리게 된다) 순위를 조작해 빠른 시일 내 이익을 보려는 유혹이 계속 생기는 것이다.

중국 바이두의 경우 검색어 순위를 놓고 아예 장사를 해 논란이 되고 있지만 굳이 이렇게 하지 않더라도 순위가 발표되는 한 이에 대한 조작 유혹이 계속 생긴다.구글의 경우도 랭킹 조작이나 부정 클릭을 막는 것에 무척이나 신경쓰고 있으니 인터넷에서 이 문제는 피할 수 없는 문제인 것 같다.

현재로선 포털사들에 문제가 되는 검색어 순위를 발표하지 말라고 하기는 쉽지 않을 것 같다.그 자체가 상당한 정보가 되기 때문이기도 하고 기업의 사업 영역이기 때문이기도 하다.

네이버는 검색어 순위 조작을 막기 위해 기술적인 노력을 쏟고 있지만 마치 보안프로그램과 크래킹의 싸움처럼 계속 새로운 순위 조작 시도가 발생하고 있다.(포털 관계자는 "지금 이 순간에도 누군가 검색어 조작 시도를 하고 있을 것"이라고 말했다)

이 문제는 사실 해답이 없는 싸움이다.검색어 순위가 돈이 되는 한,또 초대형 포털이 검색 시장을 독과점하고 있는 한.그렇지만 분명한 것은 순위 조작이 반복되고 이것이 계속 적발되는 상황이 이어진다면 검색어 순위라는 것 자체의 가치가 크게 떨어질 것이라는 점이다.

검색, 순위 조작, 네이버 댓글(0) l 트랙백(0) l 스크랩
검색이란,인생의 행복찾기다 [네이버,성공 신화의 비밀-그 이후] 2009/09/27 22:17:00
트랙백 주소 :

오랫만에 나타난 이준호 박사는 검색에 대한 자신의 철학도 업그레이드해서 말했다.검색 기술의 진화와 검색이 어떻게 될 것인지에 대한 물음에 그는 이렇게 답했다.

"검색을 과연 늙어 죽을 때까지 해도 (검색이 뭔지,이것이 얼마나 진화할 지) 알 수 있을까.인간이 어떻게 하면 행복할 수 있을까에 대한 답을 찾는 것과 비슷한 것 같다."

20년동안 검색에 매진해 온 그이기에 검색이 곧 인생이 됐겠지만,질문과 답변을 찾아가는 검색이라는 것이-그의 말을 듣고 보니- 정말 우리의 인생과 흡사하다는 느낌이 들었다.정말 100% 만족하는 검색 결과라는 게 있을까.마찬가지로 우리가 죽을 때까지 노력해도 정말 인생의 행복에 대해 답을 찾을 수 있을까. 100% 만족하는 그런 답을 말이다.

이준호 박사는 약 3년전 이런 말을 했었다.검색 스터디 모임 자리에서 내가 "검색이란 무엇이라고 생각하는가"라고 질문한 것에 대한 답의 차원에서 한 말이었다.

처음 검색 기술을 공부한 지 5년이 됐을 때는 내가 모든 것을 다 안다고 생각했다.10년이 되자 스스로 검색에 대해서는 아무것도 모르는 것 같았다.15년이 지나자 내가 검색에서 무엇을 알고,무엇을 모르는 지를 조금 알 것 같았다.요즘(17년차)에는 내가 검색 기술 개발의 어떤 부분에 있어서는 남들보다 조금 나은 부분이 있구나 하는 것을 알게 됐다.20년이 되면 무엇을 알게 될까. 지금으로선 모르겠다."

-책 '네이버 성공신화의 비밀', NHN의 사람들 7장 이준호편 p.226에서

이준호 COO는 한국의 1세대 검색 전문가로서 엠파스,NHN의 검색 엔진을 만들어  ‘한국 검색 산업의 아버지’로 통한다.숭실대 교수를 거쳐 2005년 NHN에 합류한 뒤 2007년부터 일본 검색 사업을 지휘하고 있다.검색에 몸담은 지 20년을 채우고 난 뒤에 그가 찾은 것은 결국 검색이란 인생의 행복 찾기와 유사하다는 것이었다.아마도 끝내 답을 찾지 못할,하지만 우리가 결코 포기해서는 안되는 그런 차원의 질문이란 뜻이다.

이준호, NHN, 네이버, 검색 댓글(0) l 트랙백(0) l 스크랩
네이버,일본 검색 사업 부진 [네이버,성공 신화의 비밀-그 이후] 2009/09/27 22:15:00
트랙백 주소 :

 일본 검색 사업을 진두지휘하고 있는 이준호 NHN 최고운영책임자(COO)가 오랫만에 공식 석상에 모습을 드러냈다.지난 25일 서울 태평로 프레스센터에서 열린 NHN의 컬렉션랭킹 업그레이드 발표장에 이준호 COO가 나타난 것이다.

 이날 발표는 이윤식 이사가 맡았지만 이어진 질의응답 시간엔 이준호 COO가 직접 마이크를 잡고 기자들의 질문에 답했다.그는 지난 6월 오픈한 일본 검색 서비스가 아직 현지 시장에서 좋은 반응을 얻지 못하고 있음을 인정했다."일본 검색 서비서가 부진하고 아직 좋은 평가를 얻지 못하고 있다"는 한 기자의 발언에 "하신 말씀이 모두 맞다"고 수긍했다.하지만 그는 지금이 아주 초기 단계임을 수차례 강조했다.앞으로 몇차례 유저들의 반응을 반영하고 새로운 기술을 도입한 서비스를 선보이면서 야후와 구글을 따라잡을 것을 강조했다.그와의 대화 내용을 정리했다.

-만족클릭,불만족 클릭을 어떻게 구별하나.
 “이용자가 검색어를 입력했다가 원하던 것인 줄 알고 클릭했더니 원하는 게 아닐 경우 바로 창을 닫는다.그런 경우 불만족 클릭이라고 할 수 있다.또 다른 경우는 이용자가 자신이 원하는 것을 찾기 위해 계속 검색어를 변경하면서 검색을 하게 된다.그러다 어느 순간에 가면 검색을 멈추게 돼 있다.이 경우 마지막에 입력한 것이 가장 만족할 클릭일 가능성이 높다.체류 시간도 물론 감안한다.이 외에도 많지만 이와 같은 방법으로 만족클릭,불만족클릭을 잡아낸다.아주 머리가 아픈 작업이다.검색어를 입력할 때 그 뒤에 숨은 의도가 아주 중요한데,결국 검색 기술은 그 의도를 얼마나 잘 파악해내느냐의 싸움이라고 할 수 있다.”
-창을 바로 닫아도 만족한 경우일 수 있다.또 마지막 클릭에도 만족하지 못하는 경우가 수두룩하다.너무 오차가 큰 기준 아닌가.
 “맞는 말씀이다.그것이 정보 검색과 데이터베이스의 차이다.데이터베이스 검색은 항상 정답이 나와야 한다.정보 검색은 항상 정답이 나오진 않는다.우리가 평생 끊임없이 개발해야 하는 이유다.완벽하면 기술을 개발할 이유가 없다.
 클릭을 많이 받는 문서가 사용자를 만족시키는 경향이 높다는 그런 연구 결과도 있다.완벽한 자료나 기준은 어차피 없다.다만 우리는 정확도를 높이기 위해 노력할 뿐이다.”
-컬렉션 랭킹은 검색 광고에도 적용되나.
 “광고에는 못한다.매출 때문이다.회사를 경영하다 보면 사용자 입장도 있지만 주주 입장도 있다.바꾸게 되면 매출이 떨어질 가능성 있다.매출은 검색 만족도의 후행 지표다.사용자 만족도를 높인 다음에 할 것이다.”
-검색어 조작과 같은 문제가 더 생길 수 있지 않겠나.
 “조작을 하려면 대규모 트래픽이 있어야 한다.하려면 할 수 있을텐데 이익보다 비용이 더 들어갈 것이다.웹 검색의 가장 큰 문제는 정보의 신뢰성이다.신뢰성을 어떻게 제고할 수 있는가,신뢰할 수 있는 정보를 어떻게 제공할 수 있느냐가 지금 웹 검색의 가장 큰 과제다.구글과 네이버 검색 결과를 비교해보라 구글보다 우리가 정보 신뢰성에서 더 나을 것이라고 생각한다.”
-그렇게 판단하는 이유는 무엇인가.
“구글은 크롤링(crawling)만 한다.자체 서비스를 안 한다.다른 사이트가 축적한 콘텐츠에 무임승차 하는 것이나 마찬가지다. 우리는 지식in, 블로그, 카페에 연 수백억원씩 들인다.수익은 안 나는데.구글이 ’오픈‘ 얘기 하는 것이 대서특필될 때마다 화난다.큰 돈을 들인 남의 자산에 무임승차 하는 것이다.결국 개방성으로 가장 이익을 보는 것은 구글이다.네이버는 저작권 보호를 위해 노력하고 있다.copy + paste를 못하게 차단하고 콘텐츠에 댓가를 지불하면서 저작권을 보호에 힘쓴다.”
-시맨틱 검색 계획은 어떤가.
“시맨틱 웹이라는 건 연구자마다 정의가 다양해서..그래서 시맨틱 웹이라고 할 때 그것이 정확히 뭘 의미하는지 사실 잘 모르겠다.의미 연관 검색그런 방식의 이 가장 시맨틱 검색에 근접한 정의일 텐데 그런 의미 기반 검색은 60년대부터 있었다.이후 풀 텍스트 검색으로 많이 전환 됐다.현재 알려진 것 중 마이크로소프트의 ’빙‘이 시맨틱 방식일 건데 우리도 검토하고 있기는 하다.온톨로지 검색 차원에서 노력하고 있다.”
-네이버 재팬의 검색은 어떻게 진행 중인가.
“이렇게 이해하면 될 것 같다.자존심을 걸고 하고 있다.한국에선 네이버가 콘텐츠에서 우위에 있다.우리가 일본 검색 시장 진출에 성공한다면 우리 기술이 세계 최고일 것이다.만약 그렇게 된다면 기자 여러분들도 인정하지 않겠나? 그렇게 되면 계속 얘기하는 노가다 얘기도 그만들 하지 않을까? 야후,구글이 점유한 시장에서 네이버가 성공하면.”
-네이버 재팬의 검색 서비스가 현재까지는 반응이 좋지 않은데
 “하신 말씀이 맞다.한국에서는 우리가 기술보다는 콘텐츠 확보와 운영 방식에서 우월했던 것이다.Searching Tech는 아직 개발이 덜 돼 있다.물론 우리가 기술력이 없다는 것은 아니다.다만 기술을 적용해 본 경험이 적을 뿐이다.앞으로 2,3,4차 추가로 열면 야후나 구글을 상당히 많이 따라갈 것이다.”
-네이버 재팬에 다르게 적용된 로직은.
“일본은 데이터가 많아 서버가 훨씬 더 많이 들어간다.데이터는 경제 규모랑 비례한다.우리의 몇배다.일본은 콘텐츠의 왕국이잖나.또 컬렉션 랭킹 등 우리가 가지고 있던 것을 한국보다 먼저 적용했다.네이버 재팬은 앞단에 ’지식in‘도 없다.즉 지금 한국의 통합검색과 같은 구조를 그대로 적용하기는 힘들다는 것이다.구글처럼 일단 웹검색 위주로 하고 있다.후발 주자로서 힘든 상황이다.하지만 일본에서는 기술로 승부를 봐야 한다.그래서 우리가 축적하고 개발하고 있는 온갖 기술을 다 동원하고 있다.”
-네이버 재팬의 마토메는 정확히 뭔가.
 “한국에서 하고 있는 지식iN과 유사하다고 할 수 있다.주제 키워드가 조금 다르지만 지식iN의 일본판이라고 해도 무방하다.결국은 일본에서도 시장이 통합검색쪽으로 가리라고 생각하고 있는데,통합검색을 특허로 걸어놓지 않은 것은 정말 땅을 치고 후회할 일이었다.”
-구글은 검색 알고리즘이 거의 공개가 안 되 있는데 어떻게 분석하고 있나.
 “마이크로소프트나 야후 같은 경우 검색 알고리즘에 대해 연구 논문이 다수 나와 있다.물론 이들 대부분은 재현 불가능한 것들이다.재현 불가능한 데 그게 무슨 논문이겠나.그런데 구글은 그런 논문조차 없다.정보가 거의 노출돼 있지 않다.흔히들 말하는 페이지랭크도 그것이 뭔지는 알려져 있지만 가장 중요한,구글이 그것을 어떻게 활용하는지에 대해선 아무런 정보가 없다.”

네이버, NHN, 검색, 네이버재팬, 이준호 댓글(1) l 트랙백(0) l 스크랩