BGM용 세이라디오
열기▼       고정
전체
글목록

페이지랭크(pagerank, PR), 진짜로 이해하자

목요일, 3월 07, 2013
PR(A)=(1-d)/N+d*SIGMA(PR(B)/L(B))
우선 위의 수식을 이해하자. d는 실험적으로 0.85정도의 값으로 지정되어있고, N은 웹페이지의 수, L은 링크의 수이다.(이론상으로는 모든 웹페이지에 링크가 하나라도 있어야만 PR의 합이 1이 된다.)

모든 웹페이지의 PR만큼 작은 상자에 물을 담는다고 치자. 네모나고 작은 이 상자들은 일렬로 늘어서 있고 용량은 1이며, 각각 아래에 0.15의 용량을 가진 납작한 상자를 깔고 있다.

0.15를 상자의 수만큼 나누어 각각의 아래 상자에 붓는다. 이 아래 상자의 물은 이제 변하지 않는다.

이제 위 상자에는 자신에게 링크된 상자의 물을 그 상자의 링크 수만큼 나누고, 0.85를 곱한 뒤, 그 양만큼 자신에게 붓는다. 이 때 링크를 준 상자에서 빼오는 것이 아니라 추가로 붓는 것이다. 각각의 링크에 대해 이것을 한차례 반복하고 나면 상자들에 담긴 물은 조금씩 달라진다.

링크를 따라 링크의 목적지에는 계속 물이 추가된다.
이것을 계속 반복(iteration)하면 수위가 높은 상자는 계속 조금씩 높아지다가 일정량에 수렴한다. 무한급수가 수렴하듯이.

머릿속으로 그 모습을 상상해보면 상자의 물이 링크의 흐름을 따라 파급된다는 것을 느낄 수 있다.

페이지랭크는 바로 이런 것이다. 페이지랭크는 링크를 통해 파급되지, 옮겨가거나 빼앗는 개념이 아니다. 페이지랭크 공식 어디에도 빼기는 없다. 단지 0.85로 곱하기만 있을 뿐이다.
-외부링크는 자신의 페이지랭크를 줄어들게 하지 않는다. 단지 내부의 동반상승을 전체적으로 아주 조금 감소시키고 그 외부를 도와주는 효과가 있다.
첫 댓글을 써주세요!

댓글을 인용하려면 @![댓글 ID]!@와 같이 쓰시면 됩니다. "@!" 와 "!@"를 쓰시려면 "+@+!+", "+!+@+"와 같이 써주세요.

페이스북 댓글
.post-outer{ -webkit-transform:none; transform:none; display:inline; padding:0; margin:0; border-width:0; } .hentry>div{ display:none; }