웹서버 로그로 본 내 블로그

물론 아파치 로그를 직접 까보는 일은 회사 들어온 이래로 졸업했고 (…) 요즘은 심심풀이로 awstats / wordpress.com / google analytics 분석결과만 본다. 딱히 돈을 벌어주거나하는 블로그는 아니지만 — 이 블로그는 OB와 동아리 돈으로 IDC에 집어넣은 서버 위에서 동작한다. 즉 운영할 수록 내 돈이 깨진다 — 그래도 나름대로 생각을 정리하고, 다른 사람의 의견을 묻는 의미로 사용하고 있어서, 어느 정도의 트래픽 유입이 필요하다(…). 여튼, 오늘 아침 출근하고 까본 결과를 얘기해보겠다.

Apache gzip-compression 을 걸고나니

8월 부터 블로그 페이지들에 gzip 압축(deflate)을 걸기 시작했는데, 덕분에 awstats에 표시되는 웹 서버 네트웍 사용량이 절반 이하로 줄었다. (그 동안 UV/PV는 증가했다) 다만, 이 로그가 완전히 신뢰가 안가는건 가끔 아예 트래픽이 집계 안되는 날이 있어서 Orz. 하지만 대부분의 경우엔 실제로도 느껴질 수준으로 네트웍 사용량이 줄어들었으니, 아마도 대부분의 내용이 텍스트이고, gif 나 png는 캐슁도 잘 되고 있을테고해서 그러한듯하다.1 그리고 서버 로드도 거의 증가하지 않았다.2

웹에 보이는건 구글과 네이버 그리고 약간

WordPress.com 에서 제공하는 로그 분석 기능과 Google의 Analytics를 써서 나온 결과는 여러모로 재미있었다. 둘다 한국 내 웹검색엔진 들을 검색엔진으로 분석안해서, naver나 daum을 단순한 “referer”로 인식하는 덕에 굉장히 특이한 결과가 나온다. 검색 엔진은 죄다 구글로 잡히고, 리퍼러는 거의 네이버로 잡힌다. (다음은 사실 보이지도 않는다) 구글 analytics 데이터는 지난 한 달간 다음과 같다. (UV 6066; PV 10426)

refer

구글 검색이 전체 방문자의 1/3 도 넘는 수를 끌어들이고, 내이버가 약 1/43, 그 이외에는 거의 google reader / hanrss / egloos-valley 같은 리더 류의 사이트다. 빙/야후/다음은 잘 보이지 않는듯 고어핀드한테 이 얘기를 했더니 “자기 블로그도 그렇다"라는 답변이 오더라;

사실상 사람들이 쓰는 엔진이 뻔한 다음에야(…), 그리고 네이버 쪽 P/V가 낮은 이상에야 그냥 지금 하는데로, 구글에 사이트맵 잘 보내주고, RSS는 전문공개로 운영하면 어느 정도 찾아오는 사람이 유지될 걸로 보인다.

ps. 근데 궁굼한게 있다. 이건 내가 답이 짐작이 가지 않는게 있다. RSS 리더를 통해서 유입되는 트래픽이 약간 있는데4 — 이 블로그의 RSS는 모든 내용이 포함되서 공개되었기 때문에, 리더에서만 읽으면 되지 굳이 사이트로 찾아오지 않아도 된다 — 이 사람들은 한 페이지만 보고 나가는게 아니라, 여러 페이지를 보고나간다는 통계인데, 이 의미가 꽤나 궁굼하다.


  1. 텍스트만 있는 페이지는 대략 1/3 수준으로 줄어든다. ↩︎

  2. 물론 이건 블로그 자체에 WP-SuperCache를 걸어서 스태틱 페이지를 내보내고 있어서이긴 하다. ↩︎

  3. 네이버 검색/카페-블로그 검색/지식인이 다 분리되어 나오더라. ↩︎

  4. 위 테이블에선 google.com/co.kr 의 refereal, hanrss 정도에 해당한다. ↩︎