Joinc 팀블로그 리눅스 메뉴얼 정리 Joinc 위키
댓글

Recent Comments

Powered by Disqus
팀블로그 카테고리
  전체 (1105)
   공지사항 (1)
   검색엔진 (21)
   기술동향 (58)
   게임 (2)
   독서 (6)
   리눅스 (12)
   보안 (1)
   사회문제 (22)
   어셈블리 (43)
   영화 (3)
   오픈소스 (10)
   음악 (9)
   인물 (1)
   포인터 (4)
   프로그래머 (23)
   팀블로그 (20)
   테터툴즈 (29)
   C/C++ (152)
   FireFox (11)
   Gimp (2)
   Google (98)
   Java (13)
   Perl (2)
   Pthread (11)
   STL (13)
   TCP/IP (8)
   Tools (31)
   Web2.0 (42)
   Wiki (1)
«   2010/07   »
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
2007/06/08 00:14

블로그 검색엔진은 문화의 흐름을 보여주는 서비스

블로그는 문화

친구가 한명있다. 소프트웨어쪽하고는 관계없는 일을 하지만, 한때 취미로 리눅스도 만지고 웹서버도 설치해서 간단하게 PHP 프로그래밍도 하곤 했었다. 지금도 몇개 사이트를 운영하고 있기도 하다. 이 친구가 얼마전에 마케팅차원에서 커뮤니티 사이트를 운영하고 싶은데, 뭐 좋은 아이디어가 없느냐고 물어 왔더랬다. 친구의 생각하는 바가 블로그 형태와 비슷해서, 블로그를 만들면 딱이겠네, 테터툴즈같은 툴을 이용해서 블로그 만들고, 기존에 운영하는 사이트와 자연스럽게 이어질 수 있도록 메인페이지 만들고 이러쿵 저러쿵 하면 되겠네 라고 나름 조언을 해주었다.

찬찬히 듣고나더니 친구 왈 블로그? 그거 예전부터 얘기는 들어왔는데, 도대체 게시판이랑 제로보드랑 무슨차이가 있는데 ?라고 하는 거다. 나도 찬찬히 생각해보니 기능상으로 딱히 차이점이 생각나지 않는 것인게다. 사실 게시판에 글쓰고 댓글다는 거, 이거 블로그랑 차이점 없다. 트랙백? 트랙백이나 링크나 차이점이 뭔가. 내가 하도 위키노래를 불러서, 이 친구도 위키를 아는데 위키와차이가 뭔데? 하는거다. 솔직히 기능상무슨 차이가 있는건지 모르겠다. 대부분의 위키가 댓글 시스템지원하고, 카테고리 태그까지 지원한다. 게시판도 마찬가지고, CRM 툴들도 마찬가지다.

나만 해도 지금은 꽤 열심히 블로깅을 하고 있는 입장이지만 얼마전까지만 해도 위키만 사용했다. 이유는 간단하다. 위키랑 블로그랑 차이가 뭔데?

그래서 애기해줬다. 블로그가 뜬것은 기능의 우월함과 차별성으로 뜬게 아니다. 블로그는 기능을 떠나서 이미 문화가 되어버렸다. 청바지가 왜 젊음의 상징이냐. 그게 면바지 같은 것들에 비해서 기능이 더 좋아서 그러냐 ? 색깔이 청색이라서? 까짓거 청색 면바지 만들면되지, 근데 이건 아니잖아!. 그 자체가 문화가 되어버린거다. 그래서 뜬거다. 기능 측면에서 따지고 들어가면 답이 나오질 않는다. 블로그는 어떤 경로를 통해서 그렇게 되었는지 모르지만, 이미 개인 미디어의 대명사가 되어버렸으며 하나의 문화현상으로 이해해야 한다. 라고...

문화를 검색하는 블로그 검색

g_naaroo_070514.gif

[http]나루 블로그 검색서비스 얘기를 해보자.

블로그 검색 !?, 그거 구글도 서비스하고 있고 포탈도 서비스하고 있다. 지금 블로그 검색이 기능상의 무슨 차이점이 있느냐 라고 말한다. 답하자면 블로그는 기능이 아니며, 블로그 검색 역시 기능으로 승부를 하는 서비스가 아니다. 블로그 검색은 문화를 검색 하고 문화의 흐름을 보여주는 문화서비스가 되어야 한다. 기존의 문서 혹은 정보를 검색해주는 웹검색과는 분명한 차이를 보인다.

아마도 구글 블로그 검색을 보면 기능상 참으로 훌륭하다는 기분이 들것이다. 놀랍게도 10분전에 포스팅한 내 글이 검색되는 것도 봤다. 늦어도 1-2시간이내에는 검색이 된다. 검색결과도 매우 훌륭하다. 그러나 구글 블로그 검색을 보면 허전하다는 느낌이 뇌리를 스친다. 기능만 있지 문화가 없기 때문이다.

만약 나루 검색이 웹검색 이였다면, 분명히 기존 포탈이나 구글에 비해서 가질 수 있는 차별성 같은건 기대할 수 없을 것이다. 기대할 수 있는 것이라고는 - 첫눈 처럼 - 다른 거대회사에 인수되는 정도겠지.

그러나 블로그를 문화로, 블로그 검색엔진을 문화를 찾아주는 도구로 생각하면 중소기업이 만드는 것은 기존의 대기업들이 만들어서 서비스하는 것과는 또다른 분명한 차별성을 보여줄 수 있다. 거대포탈은 기존 서비스들과의 역학관계 때문에 유연한 움직임이 힘들지만, 중소기업은 문화의 흐름과 고객의 요청에 유연하게 대처할 수 있다. 이게 나루 블로그 검색 서비스의 차별화된 장점이될 수 있다. 나루 블로그 검색서비스의 미래는 얼마나 뛰어난 기능을 지원하느냐에 달려있다고 생각되지 않는다. 문화의 흐름과 사용자의 생각을 얼마나 잘 보여줄 수 있는지에 달려있다고 생각된다.
:::
2007/04/17 01:24

나루검색서비스 시연에 즈음하여.

나루 블로그 검색엔진에 대해서 이야기를 하고자 하는 이유는 내가 검색엔진관련일을 하고 있기 때문...... 이기도 하지만 나루 검색엔진을 직접 개발하고 있기 때문이다 -.-;;

내입으로 직접 개발에 참여중인 서비스를 얘기하려고 하니 낯이 좀 간지럽기는 하지만 뭐 어떠랴.

거 의 1년이라는 시간에 걸쳐서, 개발을 해왔고 드디어 지난주 금요일(2007년 4월 9일 날씨 맑음) Top 블로거와 검색엔진관련 개발자들에게 시연을 하는 자리를 가졌다. 그만님, 네오비스님, 떡이떡이님, 미친병아리님, typos님 등등의 이름만 들어도알만한 블로거분들이 참석했다. 이를테면 제한적인 클로즈베타 시연이라고 해야 할려나 ?

시연회자리도 좁고 해서, 어쩔수 없이? 시연회 자리에는 참석하지 못하고 그냥 내 자리에 앉아서 이게 잘돌아가나 어떤 검색어를입력하나 하는 등등을 모니터링 했다. 혹시라도... 죽는 사태가 발생하면 얼릉 복구해야 하니까.. ㅎㅎ.. 아시다 시피 이바닥에는 잘돌다가도 시연하는 날은 반드시 죽는다라는게 법칙처럼 되어 있으니 말이다.

완 성되지 않은 프로그램이라면, 잠재적인 버그를 가지고 있기 마련이고, 내부에서 테스트할 때야 뻔한 입력을 가지고 테스트하지만다양한 유저에게 노출되면 예상치 못한 입력에 대해서 문제가 발생할 수 있기 때문이다. 다행히도 시연은 문제없이 지나 갔다.

참석한 몇몇 분들이 시연과 관련된 글들을 적어주셨다.
주요한 이슈는 아래와 같았다.
  • 엔진은 좋은것 같다.
  • 서비스가 최적화 되어 있지 못하다.
  • 형태소 분석이 확실하지 않은거 같다.
  • attention 을 이용한 블로그 문서의 score 산정이 명확하지 못하다.

나루팀의 개발철학은 기반 기술을 튼튼히 하고, 그 위에 서비스를 구축하자 였다. 이러한 철학으로 개발을 하다보니, 중간 중간 기획에서 넘어오는 서비스 요청사항들의 상당 부분이 반영되지 못한 점이 있는것 같다. 가상화/분산검색/정확한 문서 score 알고리즘에 가장 중점을 두었고, 시연회까지도 서비스측면에서 신경쓰지 못한 부분이 많았기 때문이다. 이제 어느정도 기반시스템이 완성되었다고 생각되니 앞으로는 서비스의 수준을 올리는데 중점을 두어야 할 것이다.

후.. 한글문서 검색에 있어서 가장 큰 골치거리는 뭐니뭐니 해도 형태소분석이 될 것이다. 대한민국에서 구글과 같은 검색엔진에 있어서 한발 늦은 이유가 형태소 분석 때문이라는 말이 있을 정도로 정말 골치덩어리다. 검색기반기술이 어느정도 구축되고 나면, 실제 서비스단에서 제일 중요한것은 한글 문서를 어떻게 분석해서 색인해 두느냐와 사용자의 검색어를 어떻게 분석하느냐가 될 것이다.

형 태소분석과 함께 서비스에서 가장 중요한 또하나의 요소를 들라면, 스팸과 어뷰징, 간단히 말해서 낚시사이트를 어떻게 효과적으로걸러내고 정말 중요한 문서를 노출시키느냐가 될 것이다. 중복된 키워드를 등록해서 해당 문서를 첫화면에 노출시키느 낚시 사이트는굳이 예를 들지 않아도 많이들 경험해 보았을 것이다. google은 이러한 문제를 pagerank 기술을 이용해서 해결을 하고 있다. 링크를 일일이 조사해서, 해당 사이트를 참고하는 사이트가 많으면 높은 점수를 주겠다라는게 핵심이다.

현재 나루는 attetention이라는 것을 사용하고 있다. RSS리더기인 [http]fish의 로그를 링크처럼 활용하겠다는게 기본취지다. 로그를 분석해서 많은 방문이 이루어진 블로그 주소에 대해서 점수를 더주는 것이니, 구글의 pagerank와 그 개념은 같다고 볼 수 있다.

문 제는 pagelink 에서 사용되는 link는 범용적으로 사용되는 요소인 반면, attention은 응용프로그램에 대해서제한적이라는 점이다. 이는 효과적인 rank 산정을 어렵게 만들 수 있기 때문이다. 이 것은 나루검색팀 역시 심각하게 고민하고있는 문제중 하나로, 결국은 범용적으로 사용가능한 link 까지 함께 사용하는 방향으로 갈 것으로 생각된다. 다행히도 현재 attention만으로도 낚시 사이트를 꽤 잘 걸러주는 것같다.

역시.. 개발에 참여하는 입장에서 이런말 하기는 남사스럽긴 하지만 기다려 주시라.. 개봉박두
:::