제2회 검색엔진 마케팅 전략 콘퍼런스

지난 4월4일 삼성동 코엑스 그랜드볼룸에서 “제2회 검색엔진 마케팅 전략 콘퍼런스” 가 있있다.

가격이 비싼 유료 콘퍼런스인데도 참가자가 상당히 많았고, 다양한 나이층과 특히 여성분들이 많았다. 아마 쇼핑몰등을 운영하는 운영자들이 대부분이 아닐까 여겨졌다. 포털사이트나 광고 에이전트 입장에서 보면 광고주일테고.

사용자 삽입 이미지

네이버, 파란 등 폴털관계자와 광고대행사 분들이 주 발표자였는데, 주 이슈는 2007년에 검색광고가 많이 변하고 있다는 부분이었다. 구글과 다음의 제휴, 네이버의 풀질관리 도입과 CPM에서 CPC로 변화한 클릭초이스 등 다양한 검색엔진 마케팅 상품등이 등장하고 있지만 기존 상품에 비해 운영이 쉽지 않아서 전문 광고대행사에 의뢰를 하고 광고주는 랜딩페이지나 재방문율을 높이기 위한 사이트 구성에 집중하는게 더 효율적이라는 얘기다.

처음으로 전병국 대표를 접했는데, 역시 달변이었다. ‘스토리 텔러’가 되야 한다고 강조를 했다. 구글의 발표도 있었다. 구글이 이런 행사에 모습을 보인게 처음이라고 한다. 아마 국내에서 본격적으로 서비스를 하려나 보다.

발표를 들으면서 확신한건 블로그 마케팅은 이제 가장 확실하고 효율적인 마케팅 수단이라는 거다. 바로 회사에 와서 현재 테스트해보고 있다.

사용자 삽입 이미지

요즘 컨퍼런스를 가면 쉬는 시간을 그냥 두지 않는다. 이번 컨퍼런스에서는 쉬는 시간이면 ‘네이버 블로그 시즌 2’ CF를 계속 틀어댔다.

한국식 SEO

SEO (Search Engine Optimization): 검색엔진이 검색어에 대한 결과를 돌려주는 방법을 잘 이용하여 자신의 원하는 사이트로 가능한한 많은 트래픽을 유도하는 방법. 흔히 우리 말로 “검색엔진최적화”라고도 한다.


주위 사람들과 이야기를 하다가 네이버에서 높은 조회수를 가지는 블로그를 운영하는 방법에 대한 이야기가 나왔다. 생각보다 간단했다.


1. 고등학생들 두세명이 모여서 하루종일 PC 앞에 앉아 있는다.


2. 네이버에 실시간으로 올라오는 모든 뉴스를 가능한한 모두 감시한다.


3. 기왕이면 연예, 충격, 사건 이런 것들을 위주로 뉴스를 읽으며 하나의 블로그로 스크랩한다. 왠만하면 보이는대로 즉시 스크랩한다. 이런 식으로 하루에 수백개의 기사를 퍼간다.


4. 퍼간 뉴스 중 몇 개는 시간이 조금 지나면 인기 검색어 결과가 되는 기사이다.


5. 네이버 검색 결과는 종종 지식iN과 블로그 검색 결과를 뉴스보다 상위에 보여준다. 따라서 잘 퍼간 글은 검색 결과 최상위에 노출되어 많은 클릭수를 유도한다.


6. 심지어는 이런 방식으로 하루에 수만, 수십만 방문자를 가지는 블로그들이 즐비하다.


7. 이렇게 유도되는 트래픽을 잘 이용하기 위해 곳곳에 자신의 싸이 주소를 걸어놓거나, 본인 또는 아는 사람이 운영하는 쇼핑몰로 링크를 달아놓는다.


이런 설명을 듣고 있던 한 분이 하시는 말씀.


“한국식 SEO군요. 똑똑하네요.”


그러더니 이어서 하시는 말씀,


“태우님 같이 죽어라고 새벽까지 공부하고 자신만의 글을 쓰시는 분들 참 억울하겠어요. 그런 방식 때문에 브랜드와 트래픽을 모두 도둑질 당하잖아요.”


한참동안 이를 놓고 고민을 했다. 하지만 이젠 괜찮다. 더 큰 고민이 생겼기 때문이다.

출처: 태우’s log – web 2.0 and beyond

Introduction to The Solr Enterprise Search Server

Introduction to The Solr Enterprise Search Server

Solr in a Nutshell


Solr is a standalone enterprise search server with a web-services like API. You put documents in it (called “indexing”) via XML over HTTP. You query it via HTTP GET and receive XML results.



  • Advanced Full-Text Search Capabilities
  • Optimized for High Volume Web Traffic
  • Standards Based Open Interfaces – XML and HTTP
  • Comprehensive HTML Administration Interfaces
  • Scalability – Efficient Replication to other Solr Search Servers
  • Flexible and Adaptable with XML configuration
  • Extensible Plugin Architecture

Solr Uses the Lucene Search Library and Extends it!




  • A Real Data Schema, with Dynamic Fields, Unique Keys
  • Powerful Extensions to the Lucene Query Language
  • Support for Dynamic Result Grouping and Filtering
  • Advanced, Configurable Text Analysis
  • Highly Configurable and User Extensible Caching
  • Performance Optimizations
  • External Configuration via XML
  • An Administration Interface
  • Monitorable Logging
  • Fast Incremental Updates and Snapshot Distribution

Detailed Features


Schema




  • Defines the field types and fields of documents
  • Can drive more intelligent processing
  • Declarative Lucene Analyzer specification
  • Dynamic Fields enables on-the-fly addition of fields
  • CopyField functionality allows indexing a single field multiple ways, or combining multiple fields into a single searchable field
  • Explicit types eliminates the need for guessing types of fields
  • External file-based configuration of stopword lists, synonym lists, and protected word lists

Query



  • HTTP interface with configurable response formats (XML/XSLT, JSON, Python, Ruby)
  • Highlighted context snippets
  • Faceted Searching based on field values and explicit queries
  • Sort specifications added to query language
  • Constant scoring range and prefix queries – no idf, coord, or lengthNorm factors, and no restriction on the number of terms the query matches.
  • Function Query – influence the score by a function of a field’s numeric value or ordinal
  • Performance Optimizations

Core



  • Pluggable query handlers and extensible XML data format
  • Document uniqueness enforcement based on unique key field
  • Batches updates and deletes for high performance
  • User configurable commands triggered on index changes
  • Searcher concurrency control
  • Correct handling of numeric types for both sorting and range queries
  • Ability to control where docs with the sort field missing will be placed
  • Support for dynamic grouping of search results

Caching



  • Configurable Query Result, Filter, and Document cache instances
  • Pluggable Cache implementations
  • Cache warming in background

    • When a new searcher is opened, configurable searches are run against it in order to warm it up to avoid slow first hits. During warming, the current searcher handles live requests.

  • Autowarming in background

    • The most recently accessed items in the caches of the current searcher are re-populated in the new searcher, enabing high cache hit rates across index/searcher changes.

  • Fast/small filter implementation
  • User level caching with autowarming support

Replication



  • Efficient distribution of index parts that have changed via rsync transport
  • Pull strategy allows for easy addition of searchers
  • Configurable distribution interval allows tradeoff between timeliness and cache utilization

Admin Interface



  • Comprehensive statistics on cache utilization, updates, and queries
  • Text analysis debugger, showing result of every stage in an analyzer
  • Web Query Interface w/ debugging output

    • parsed query output
    • Lucene explain() document score detailing
    • explain score for documents outside of the requested range to debug why a given document wasn’t ranked higher.