BGM용 세이라디오
열기▼       고정
전체
글목록

PageRank 이해하기

목요일, 2월 28, 2013
참고자료:위키피디아 페이지랭크/'쉽게 설명한' 구글의 페이지 랭크 알고리즘
물론 구글의 페이지랭크를 정확하게 이해하기 위해 가장 필요한 것은 위키피디아의 수식들을 찬찬히 순서대로 살펴보며 이해하는 것이다.
페이지랭크(이하 PR)는 웹이 거미줄처럼 복잡해지고 또 방대하게 커지면서(월드와이드웹의 탄생) 검색 엔진에게 필요해진 기술 중 하나이다. PR의 원리는 간단히 말해 링크가 많이 걸린 웹페이지가 중요도가 높다는 것에 착안하여 웹페이지의 중요도를 측정하는 것이다. 각 페이지의 링크는 그 목표에게 자신의 중요도를 '주'며, 이때 페이지의 링크의 개수로 나뉘어져 각각에게 보내어진다. 보내는 비중은 실험적으로 85%정도로 정해져 쓰이고 있다.
그러나 자신의 PR을 다른 페이지에게 줄 때 자신의 PR부터 알아야 한다는 패러독스적인 일이 생기는데, 사실 이 문제는 수없이 PR을 주고받기를 반복(iteration)하면 해결된다. 그 결과 PR은 특정 값으로 수렴하기 때문이다.(아마 PR이 1년에 4번 정도로 드물게 업데이트되는 이유 중 하나일 것이다.)
PR은 일반적으로 0에서 10까지의 값으로 사이트 소유자가 보기 좋게 변환된다.
모즈랭크, 페이지랭크 보러가기
PR은 웹의 모든 페이지에게 링크를 매개삼아 순위를 매기는 것과 같다.(하지만 실제 검색엔진에는 추가 변수가 아주 많다.) 따라서 특정 사이트의 부속 페이지들은 홈페이지와 상호작용을 하며, 외부로 통하는 링크는 사이트 전반의 PR을 떨어뜨리는 결과를 가져온다. 그래서 때로는 자신의 PR을 위해 내부 링크를 관리해야 한다.
한가지 헷갈리므로 알아둘 점은 PR은 각각의 페이지에 할당된다는 것이다.
관심이 있다면 PR의 분포와 필요한 유입링크 수 등을 찾아보기 바란다. 구글 이미지에 'pagerank chart'라고 검색하면 다양한 자료가 나온다.
첫 댓글을 써주세요!

댓글을 인용하려면 @![댓글 ID]!@와 같이 쓰시면 됩니다. "@!" 와 "!@"를 쓰시려면 "+@+!+", "+!+@+"와 같이 써주세요.

페이스북 댓글
.post-outer{ -webkit-transform:none; transform:none; display:inline; padding:0; margin:0; border-width:0; } .hentry>div{ display:none; }