취미생활/블로그

상위노출? C-Rank 알고리즘?

해피콧 2017. 6. 16. 06:17
'); }
'); }

블로그 하시는 분들 네이버 C-Rank 알고리즘에 대해서 한번 쯤 들어보셨을 겁니다.

C-Rank 알고리즘에 대해 알기위해 많이 노력들 하시는 걸 봤는데요.

뭔가 편법으로 내 글이 검색 상위에 노출될 수 있도록 하기 위해서이죠. 내 글을 상위에 노출 할 수 있는 방법만 있다면 그 활용 용도는 무궁무진하니까요

하지만 그런 편법이 있다면 누가 방법에 대해 공유를 하려고 하겠습니까?

자신의 유료강의를 들으면 블로그 글등에 대해 상위에 노출시킬 수 있는 방법을 가르쳐주겠다는 블로그 강사들의 마케팅이라고 저는 생각합니다.


오히려 네이버의 상위노출 알고리즘을 알려면 어딘가 존재할 지 안할지 모르는 그런 편법을 찾을 게 아니라

네이버가 공식적으로 제공하고 제시하는 C-Rank 알고리즘에 대해 깊이 이해하는 것이 더 유용할 것입니다.


네이버에서 공식 블로그나 카페에서 종종 공지하는 글들을 보면 많은 정보가 들어 있습니다.


며칠 전 공지된 내용으로 이제 네이버 카페에서도 C-Rank알고리즘을 적용시킨다고 합니다.

카페 검색에도 C-Rank 알고리즘이 적용되었습니다~!

[출처] 카페 검색에도 C-Rank 알고리즘이 적용되었습니다~! (네이버 카페팀 공식카페) |작성자 카페양

http://cafe.naver.com/cafesupport/115209


■ C-Rank란?

UGC( User Generated Contents )를 찾아주는 알고리즘이며, 

좋은 Creator에 대한 순위를 매겨주는 알고리즘입니다.

결국 C-Rank알고리즘에 의해 블로그글, 카페글 같은 컨텐츠들이 1등부터 쭉 순서가 나열이 될 것입니다. 

그것이 검색결과 페이지로 표시되는거죠.


공식카페에서 밝히는 C-Rank의 기술은 다음과 같습니다.

 * C-Rank의 2가지 중요한 지표

   - Creator 저자의 인지도와 

   - 주제의 전문성

이를 판단하기 위해 저자가 카페 안팎에서의 활동 패턴, 글쓰는 패턴, 인용 패턴 등을 빅데이터분석을 통해 수치화 합니다.

그리고 딥러닝 기술을 이용해 특정 주제에 대한 전문성이 있는 글을 지속적으로 써왔는지를 판단해 가중치를 부여하는 방법을 사용합니다.



그 딥러닝 기술을 짐작해본다면  

머신러닝의 종류로서 아마도 특정 공식을 알고리즘에 입력을 하게 되겠죠

그러면 알고리즘을 학습한 S/W가 웹을 돌아다니면서 글들을 수집하고 분석을 하게 될겁니다.

글들의 단어나 문장 등을 통해 주제별로 분류를 할거고 

해당 글의 유사성 분석을 통해 웹상에 같은 자료가 복제된 것이 아닌 독창적인 컨텐츠인지를 판단해낼 겁니다.

이렇게 카테고리별로 데이터를 수집해 놓은 커다란 집합을 만들어 둘겁니다.

그러면 사용자가 검색을 했을 때 빠르게 검색어와의 관련성, 상관관계 등을 분석하여 점수를 매기고 그 순서를 나열해줄 겁니다.


결국은 진짜 양질의 컨텐츠를 먼저 보여줄 것이고

양질의 자료가 아닌데 편법을 동원해서 양질의 자료인 척하기 어렵게 하는 알고리즘인 것입니다.


여기에서 딥러닝 기술을 사용한다는 것으로 미루어 보건데 이 알고리즘은 학습을 통해 계속 강화될 것이고, 데이터가 쌓일 수록 점점 더 복잡화되고 정교해 지게 될 것입니다. 

알파고가 바둑계를 평정한 것도 같은 기술입니다. 딥러닝 알고리즘이 사람의 기보를 가지고 학습을 하다가 결국 알고리즘끼리 대국을 해서 학습을 하게 되고, 나중에는 기보를 제외한 알고리즘끼리의 학습해서 성장한 버전으로도 인간을 다 이겨버렸죠.


■ 딥러닝 기술을 통해 C-Rank 알고리즘이 발전하는 방법

검색에 대해 상위노출해주는 알고리즘도 여러 루틴이 있을 겁니다.

사용자가 검색을 하고 C-Rank 의 특정 루틴으로 순위가 나열된 검색결과에서

상위에 노출되어있는 자료들이 진짜 양질의 자료라면 클릭률이 올라갈 것이고

클릭을 해서 들어간 해당 컨텐츠에서 머무르는 시간이 길어지겠죠.

그러면 C-Rank 알고리즘은 자기가 찾은 이 방법이 옳았다고 판단할것이고 해당 루틴은 강화될 것입니다.

반대의 경우로 있을겁니다.

C-Rank가 더 높은 점수를 줘서 상위에 노출시켰던 컨텐츠임에도 불구하고 클릭률이 저조한 경우도 있을 수 있을 겁니다.

또한 클릭해서 들어갔다 하더라도 머무르는 시간이 짧다면 C-Rank알고리즘 스스로 해당 루틴은 뭔가 잘못된 부분이 있다고 판단해서 해당 루틴은 약화할 겁니다.

C-Rank 자신의 알고리즘을 평가하는 알고리즘이 한 겹 씌워지게 되는것이죠

결국 검색이 계속 이루어질수록 C-Rank 스스로 발전하는 형태로 이해할 수 있을 것입니다.

데이터가 쌓여갈수록 해당 알고리즘이 발전되므로 점점 더 편법은 불가능해지게 될 것입니다.


그러면 우리같은 블로거들이 할 수 있는 일은?

정보공여자가 필요한 컨텐츠인지를 잘(?) 생각해서 잘(?) 만드는 것이 필요하겠죠

정답이면서도 어쩌면 가장 무책임한 말인 잘(?) 하면 된다는 말로 마무리하겠습니다.

오늘 포스팅은 여기까지~

끝.