리버's 아름다운 소풍

Korean Semantic Web Conference - 12월 4일

첫눈에 대한 평가 및 왜 네이버가 첫눈을 인수햇고, 검색엔진시장에 대한 견해가 잘 정리되어 있는 포스트인것 같다.

첫눈과 블로그 레벨에 대해

(이글은 민노씨의 트랙백에 대한 답글입니다.
이전에 트랙백을 보내주신 다른 분들께 써둔 글도 있는데, 아직 마무리를 짓지 못해 비공개 상태를 유지하고 있습니다. ^^ 조만간 포스팅하겠습니다. 죄송합니다.)

제 어줍잖은 소개글에 민노씨께서 질문을 주셨습니다.
간략하게나마 답글을 적습니다.


1. 첫눈과 나루의 차별성 과 2. 첫눈에 대한 평가(?)

첫눈에 관한 이야기는 첫눈에 근무하셨던 분들은 물론이고, 첫눈에 관계되셨던 여러 분들께서 활발히 블로거로 활동하고 계시니, 정확히 알지도 못하는 제가 말을 꺼내기가 참 두렵습니다.^^

제가 아는 대로 간략히 말씀드리자면, 첫눈의 스노우랭크는 "펌"(스크랩)이 활발한 한국의 웹 사용자 환경에선 중복된 정보일수록, 즉 많이 "펌"된 정보일수록 더 중요한 정보라는 가정에 바탕했다고 알고 있습니다. 구글이 페이지랭크로 웹문서의 중요도를 수치화하듯, 첫눈은 검색 결과의 우선 순위를 정하는데 스노우랭크를 사용했었습니다.

사실 그 현실적인(practical) 발상은 물론이거니와, 첫눈(1noon)이란 브랜드도 정말 멋지게 지었다고 생각했었습니다. 지금까지도 검색과 연관되어 제 머릿속에 남아 있으니까요.^^

국내외 검색업계에 한참 전부터 암묵적 maxim으로 전해지던게 '1%의 시장만 차지해도 충분히 먹고 살 수 있다'는 것이었습니다. (지난 주에 뵌 분의 말씀에 따르면 미국에선 1%만 차지하면 1B$ 회사가 된다는^^...06년 기준으로) 그러나 첫눈은 아마 그것을 달성하지 못하고 (다들 아시다시피) 꽤 큰 금액에 네이버에 인수되는 것으로 끝맺음을 했습니다. 표면적으론 네이버가 검색기술을 강화하기 위해, 그리고 그를 통해 일본시장에 진출하기 위해 첫눈을 인수했다고 했습니다. 사람들은 구글의 본격적 한국진출에 앞서 한국의 검색관련 우수 기술자를 대다수 확보하여 진입장벽을 구축하려는 네이버의 전략으로 보았습니다. (진입장벽의 6가지 중의 하나이지요.^^ resource mobilization) 혹은 그래서, 최대의 batch head hunting deal이라니, 첫눈은 헤드헌팅 회사였다느니 하는 비난도 있었습니다.^^

여튼, 첫눈은 네이버와 유사한 통합검색을 제공했었습니다. 이를 위해 편집인력도 상당수 근무했었다는 세간의 소문도 있었습니다. 아마 첫눈이 독립된 서비스로 살아남지 못하고 네이버에 인수된 데에는 (여러가지 이유가 있겠습니다만) 이렇게 첫눈이 참여했던 게임의 이슈도 있는 듯 합니다. 반면, 나루는 메인 페이지부터 네이버식의 통합검색과는 다른 모습을 하고 있습니다. 나루의 경쟁이라면, 네이버 자체라기보다 (지금은 유명무실한^^) 네이버 블로그 서치가 되지 않을까 합니다. 하지만 이것은 어디까지나 raw data의 측면에서 본 것이고, 그것의 value proposition으로 본다면 다른 경쟁상대들이 있을 겁니다.^^ 여튼 크게는 어떤 게임에 참여했는가, 어떤 데이터를 바탕으로 검색결과를 제공하는가 라는 면에서 나루와 첫눈의 차이를 생각해 볼 수 있습니다.

이제 첫눈 사이트는 개선이 중지된 상태로 보이지만, (아직 가시적인 성과는 없더라도) 네이버는 애초에 말했던 목표를 추진 중일테니, 제가 첫눈에 관해 평가(?)를 한다는 것은 적절치 않을 뿐 아니라, 제게 그럴 자격도 없다고 생각합니다.^^  다만, 첫눈이라는 기업이 애초에 한국의 상황을 고려한 독특한 방향으로 상상력을 발휘했던 점과 과점적 상태의 시장에 용기있게 뛰어들었던 시도는 높이 삽니다. 이 정도면 물어주신 데 대해 어느 정도 답이 되려나 모르겠습니다. 혹시 제 글에서 사실 관계가 틀린 것이 있으면 아시는 분들께서 덧글을 달아 주시면 감사하겠습니다.


3. 블로그 레벨에 관해

사실 나루의 블로그 레벨 산정 기준이나 알고리듬에 관해서는 제가 정확히 아는 바가 없습니다. (알고 있다고하더라도 나루의 분들께서 먼저 공개적으로 말씀하시지 않는 이상 제가 말씀드리기는 어렵겠습니다만.^^) 여튼, 객관적으로 "좋은 블로그"가 더 주목을받아 "유명"해지고, 이에 따라 나루의 검색도 신뢰성을 높일 수 있기를 나루의 분들도 바라고 계시리라 생각합니다.

나루가 "객관성과 신뢰도가 확보되지 않는 동안은 그 레벨 정책에 대해서는 보다 신중하기를 개인적으론 바라고 있습니다." 라고 주신 말씀과 그 이유로 말씀해주신 사안들에 대해 저는 대부분 동의합니다. 사실 그 아래 적어주신 부분은 매우 근본적이고 깊이있는 질문과 상황인식이라 생각합니다. 아시다시피, 이런 문제에 관해서는 백인백색의 의견이 있고 어떤 합일점을 찾기도 매우 힘든 일이겠지요.^^ 여튼 여기에 대해서는 블로고스피어에 대한 제 생각을 조금 적어보는 것이 약간이나마 민노씨에게 제 견해를 전달해드려 결례를 피하는 일이 될 것 같습니다. (제가 명쾌한 견해가 없다는 사실에 대한 어설픈 변명입니다.^^)

(현재까지) 저는 블로고스피어가 loose link로 이루어진 아나키적 상태인 것을 좋아하며, 거기에 가치의 근본이 있다고 생각합니다. 아시다시피, 블로깅을 하는 분들이 블로그에 대해 모두 같은 이유와 목적을 가지고 있지는 않을 것입니다. 당연히 많은 "사람"들이 모인 곳이니 마치 현실 세계처럼 모두 무언가 다른 어떤 것을 위해 블로깅을 하고 계실 겁니다. 어떤 분들은 정말 애드센스만을 목적으로 스플로그를 만드는 것조차 개의치 않으실 것이고, 어떤 분들은 이미 아는 사람과의 관계를 더 잘 관리하는데에 목적을 두실 것이고, 또 어떤 분들은 현실에선 모르는 다른 사람들과의 관계를 형성하는데 목적을 두실 것입니다. 어떤 분들은 자신의 생각을 그냥 풀어내는 창구로 생각하실 것이고, 어떤 분들은 영향력을 증대시키는 목적으로 글을 쓰실 것이고, 어떤 분들은 홍보의 창구로 이용하실 것이고, 어떤 분들은 현실에서 찾지 못하는 만족을 찾으실 것이고, 또 어떤 분들은 개인적인 일기로만 사용하실 수도 있을 것입니다. 저는 이 어떤 것도 다 괜찮다고 보는 입장입니다. 사실 그 안에서 누군가 통제를 하고 거르기 시작하면, 자기검열이 시작되고, 불편해진 사람들의 자유로운 마음은 다른 곳을 찾아 둥지를 틀거라 생각합니다.

"속물근성을 자극하는 장치"에 대해서도 마찬가지 견해입니다. 누가 어떤 이유로 그것을 시작했던, 그것에 반응하는 사람과 아닌 사람이 있을 것이고, 그것도 자연스레 솎아내어 질 수 있다고 생각합니다. (너무 naive한가요?^^) 결국 "좋은 블로그"가 어떤 것인가에 대한 의견도 사람마다 다 다를 수 밖에 없는 만큼, 그것을 어떻게 선정할까의 문제도 다양한 방식이 있을 수 있다고 생각합니다. 그리고 그것에 대해 저는 어떤 가치판단을 내릴 수 없다고 생각하는 편입니다. 그저 시장에 맡겨두고 볼 뿐..

저는 사람을 믿는 편입니다. 누가 어떠한 의도로 왜 어떤 일을 하는지 눈치빠른 분들은 다 알고 나름의 방식으로 대처하고 있다고 생각합니다. (대부분의 경우 무관심이 지표가 되지 않나 합니다.^^) 미투에 제가 썼던 글도 그 당시 블로고스피어에서 벌어지던 어떤 상황을 제 나름의 관찰로 해석한 느낌을 적은 것이었습니다. 그리고 그것은 이해하신 대로의 의미가 맞습니다.^^

(몇가지로 적다보니 글이 너무 길어지고, 또 너무 적나라해져서^^ 다 자르고 이만큼만 포스팅하게 되었습니다. 미흡하더라도 이해해주세요.^^)
출처: http://www.fortytwo.co.kr/tt/332#trackback16186
이 글의 관련글
일주일간 인기글
오늘 인기글
Korean Semantic Web Conference - 12월 4일

요즘들어 블로그 재미에 푹빠졌다. 재미를 붙인 제일 큰 이유는 방문자의 증가일 것 같다. 블로그를 개설하고도, 쓸거리도 없고 써봐도 봐주는 이가 없어 시큰둥했었는데 그냥 올린 하나의 포스트가 나를 변화시켰다.

점심식사를 하고 회사로 들어가다가 어린이회관에 강동어린이회관 개관이란 플랭카드가 보이길래 디카로 찍어서 블로그에 올렸다. 강동어린이회관 5월2일 개관 포스트. 내용도 없는 사진한잔 달랑 있는 다음글이다.

사용자 삽입 이미지
<<블로그에 올린 글>>


이 글을 올린 뒤 하루쯤 지나자 하루에 한두방문이었던, 그나마 그것도 검색로봇이었던 내 블로그에 수십명이 방문하는거였다. 의아하게 생각한 나는 태터툴즈의 관리자화면에 가서 키워드 통계를 보니 '강동어린이회관' 검색어가 상위에 등록되어 있었다. 다음은 현재 키워드 통계화면이다.

사용자 삽입 이미지
<<태터툴즈 키워드 통계화면>>


다수의 사용자들이 강동어린이회관이 개관한다는 얘기를 듣고 네이버 등에서 '강동어린이회관'이라고 검색을 했고, 검색결과에 내 글이 떠서 결국 내 블로그로 유입이 된것이다. 실제로 내 글이 검색포털에서 보이는지 체크해 보았다.

사용자 삽입 이미지

사용자 삽입 이미지


사용자 삽입 이미지
사용자 삽입 이미지

모두 상위에 내 글이 검색되었다. 놀랍게도 구글에서는 내 글이 강동어린이회관 정식 홈페이지보다 상위에 뜨고 있었다. 검색엔진의 놀라운 힘이 다수의 사용자들을 내 블로그로 안내한 것이다.

제2회 검색엔진 마케팅 전략 콘퍼런스에서 전병국대표가 한말이 생각이 났다. To be, or not to be 가 아니라 To be searched, or not 이라고. 검색엔진이 하나의 기업을 살리기도 죽이기도 한다는 말이 실감이 났다.

이 글의 관련글
일주일간 인기글
오늘 인기글

꽃2.0

웹.이.야.기./Web 2.0 2007/04/14 21:45 by 리버
Korean Semantic Web Conference - 12월 4일

꽃 2.0

내가 그를 발견하기 전에는
그는 다만
하나의 IP에 지나지 않았다.

내가 그를 검색하고 RSS를 구독해주었을 때
그는 나에게로 와서
1촌이 되었다.

내가 그를 검색해준 것처럼
나의 이 빛깔과 향기에 알맞게
누가 나를 발견해다오.
그에게로 가서
나도 그의 1촌이 되고 싶다.

우리들은 모두
무엇이 되고 싶다.
너는 나에게 나는 너에게
절대로 사라지지 않는 Permalink가 되고 싶다


제2회 검색엔진 마케팅 전략 콘퍼런스에서 전병국대표가 발표시간에 잠시 보여준 시다. 처음 접한 건 아니지만 다시 봐도 참 적절한 패러디가 아닌가 싶다.

이 글의 관련글
일주일간 인기글
오늘 인기글
Korean Semantic Web Conference - 12월 4일

지난 4월4일 삼성동 코엑스 그랜드볼룸에서 "제2회 검색엔진 마케팅 전략 콘퍼런스" 가 있있다.

가격이 비싼 유료 콘퍼런스인데도 참가자가 상당히 많았고, 다양한 나이층과 특히 여성분들이 많았다. 아마 쇼핑몰등을 운영하는 운영자들이 대부분이 아닐까 여겨졌다. 포털사이트나 광고 에이전트 입장에서 보면 광고주일테고.

사용자 삽입 이미지
네이버, 파란 등 폴털관계자와 광고대행사 분들이 주 발표자였는데, 주 이슈는 2007년에 검색광고가 많이 변하고 있다는 부분이었다. 구글과 다음의 제휴, 네이버의 풀질관리 도입과 CPM에서 CPC로 변화한 클릭초이스 등 다양한 검색엔진 마케팅 상품등이 등장하고 있지만 기존 상품에 비해 운영이 쉽지 않아서 전문 광고대행사에 의뢰를 하고 광고주는 랜딩페이지나 재방문율을 높이기 위한 사이트 구성에 집중하는게 더 효율적이라는 얘기다.

처음으로 전병국 대표를 접했는데, 역시 달변이었다. '스토리 텔러'가 되야 한다고 강조를 했다. 구글의 발표도 있었다. 구글이 이런 행사에 모습을 보인게 처음이라고 한다. 아마 국내에서 본격적으로 서비스를 하려나 보다.

발표를 들으면서 확신한건 블로그 마케팅은 이제 가장 확실하고 효율적인 마케팅 수단이라는 거다. 바로 회사에 와서 현재 테스트해보고 있다.

사용자 삽입 이미지

요즘 컨퍼런스를 가면 쉬는 시간을 그냥 두지 않는다. 이번 컨퍼런스에서는 쉬는 시간이면 '네이버 블로그 시즌 2' CF를 계속 틀어댔다.
이 글의 관련글
일주일간 인기글
오늘 인기글

한국식 SEO

웹.이.야.기./Web 2.0 2007/01/30 13:22 by 리버
Korean Semantic Web Conference - 12월 4일

SEO (Search Engine Optimization): 검색엔진이 검색어에 대한 결과를 돌려주는 방법을 잘 이용하여 자신의 원하는 사이트로 가능한한 많은 트래픽을 유도하는 방법. 흔히 우리 말로 “검색엔진최적화”라고도 한다.

주위 사람들과 이야기를 하다가 네이버에서 높은 조회수를 가지는 블로그를 운영하는 방법에 대한 이야기가 나왔다. 생각보다 간단했다.

1. 고등학생들 두세명이 모여서 하루종일 PC 앞에 앉아 있는다.

2. 네이버에 실시간으로 올라오는 모든 뉴스를 가능한한 모두 감시한다.

3. 기왕이면 연예, 충격, 사건 이런 것들을 위주로 뉴스를 읽으며 하나의 블로그로 스크랩한다. 왠만하면 보이는대로 즉시 스크랩한다. 이런 식으로 하루에 수백개의 기사를 퍼간다.

4. 퍼간 뉴스 중 몇 개는 시간이 조금 지나면 인기 검색어 결과가 되는 기사이다.

5. 네이버 검색 결과는 종종 지식iN과 블로그 검색 결과를 뉴스보다 상위에 보여준다. 따라서 잘 퍼간 글은 검색 결과 최상위에 노출되어 많은 클릭수를 유도한다.

6. 심지어는 이런 방식으로 하루에 수만, 수십만 방문자를 가지는 블로그들이 즐비하다.

7. 이렇게 유도되는 트래픽을 잘 이용하기 위해 곳곳에 자신의 싸이 주소를 걸어놓거나, 본인 또는 아는 사람이 운영하는 쇼핑몰로 링크를 달아놓는다.

이런 설명을 듣고 있던 한 분이 하시는 말씀.

“한국식 SEO군요. 똑똑하네요.”

그러더니 이어서 하시는 말씀,

“태우님 같이 죽어라고 새벽까지 공부하고 자신만의 글을 쓰시는 분들 참 억울하겠어요. 그런 방식 때문에 브랜드와 트래픽을 모두 도둑질 당하잖아요.”

한참동안 이를 놓고 고민을 했다. 하지만 이젠 괜찮다. 더 큰 고민이 생겼기 때문이다.

출처: 태우's log - web 2.0 and beyond

이 글의 관련글
일주일간 인기글
오늘 인기글
Korean Semantic Web Conference - 12월 4일
Introduction to The Solr Enterprise Search Server


Solr in a Nutshell

Solr is a standalone enterprise search server with a web-services like API. You put documents in it (called "indexing") via XML over HTTP. You query it via HTTP GET and receive XML results.

  • Advanced Full-Text Search Capabilities
  • Optimized for High Volume Web Traffic
  • Standards Based Open Interfaces - XML and HTTP
  • Comprehensive HTML Administration Interfaces
  • Scalability - Efficient Replication to other Solr Search Servers
  • Flexible and Adaptable with XML configuration
  • Extensible Plugin Architecture

Solr Uses the Lucene Search Library and Extends it!

  • A Real Data Schema, with Dynamic Fields, Unique Keys
  • Powerful Extensions to the Lucene Query Language
  • Support for Dynamic Result Grouping and Filtering
  • Advanced, Configurable Text Analysis
  • Highly Configurable and User Extensible Caching
  • Performance Optimizations
  • External Configuration via XML
  • An Administration Interface
  • Monitorable Logging
  • Fast Incremental Updates and Snapshot Distribution

Detailed Features

Schema

  • Defines the field types and fields of documents
  • Can drive more intelligent processing
  • Declarative Lucene Analyzer specification
  • Dynamic Fields enables on-the-fly addition of fields
  • CopyField functionality allows indexing a single field multiple ways, or combining multiple fields into a single searchable field
  • Explicit types eliminates the need for guessing types of fields
  • External file-based configuration of stopword lists, synonym lists, and protected word lists

Query

  • HTTP interface with configurable response formats (XML/XSLT, JSON, Python, Ruby)
  • Highlighted context snippets
  • Faceted Searching based on field values and explicit queries
  • Sort specifications added to query language
  • Constant scoring range and prefix queries - no idf, coord, or lengthNorm factors, and no restriction on the number of terms the query matches.
  • Function Query - influence the score by a function of a field's numeric value or ordinal
  • Performance Optimizations

Core

  • Pluggable query handlers and extensible XML data format
  • Document uniqueness enforcement based on unique key field
  • Batches updates and deletes for high performance
  • User configurable commands triggered on index changes
  • Searcher concurrency control
  • Correct handling of numeric types for both sorting and range queries
  • Ability to control where docs with the sort field missing will be placed
  • Support for dynamic grouping of search results

Caching

  • Configurable Query Result, Filter, and Document cache instances
  • Pluggable Cache implementations
  • Cache warming in background
    • When a new searcher is opened, configurable searches are run against it in order to warm it up to avoid slow first hits. During warming, the current searcher handles live requests.
  • Autowarming in background
    • The most recently accessed items in the caches of the current searcher are re-populated in the new searcher, enabing high cache hit rates across index/searcher changes.
  • Fast/small filter implementation
  • User level caching with autowarming support

Replication

  • Efficient distribution of index parts that have changed via rsync transport
  • Pull strategy allows for easy addition of searchers
  • Configurable distribution interval allows tradeoff between timeliness and cache utilization

Admin Interface

  • Comprehensive statistics on cache utilization, updates, and queries
  • Text analysis debugger, showing result of every stage in an analyzer
  • Web Query Interface w/ debugging output
    • parsed query output
    • Lucene explain() document score detailing
    • explain score for documents outside of the requested range to debug why a given document wasn't ranked higher.

이 글의 관련글
일주일간 인기글
오늘 인기글
1 
BLOG main image
리버's 아름다운 소풍
이씨플라자 개발자가 살아가는 이야기
by 리버

공지사항

카테고리

전체 (327)
살.아.가.며. (184)
웹.이.야.기. (74)
OS (13)
Software (17)
Security (4)
SQL Server (8)
Programming (24)

달력

«   2009/11   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          
textcubeDesignMyselfget rss

495

392

-30 days

today : 13