본문 바로가기

etc/it

네이버 검색 저품질 탈출방법과 C랭크 알고리즘 등에 관한 네이버 공식 블로그 글들.

지금껏 티스토리 블로그를 네이버 검색에 노출시켜오면서 막연하고 어렴풋하게 짐작하던 내용들이 이미 네이버 공식 블로그에서 충분하게 개념 설명을 하고 있군요.

아래의 링크들에서 자세한 내용들을 충분히 살펴보시면 도움이 많이 될 것입니다.

이 글들의 대략적인 전체적인 요지를 함축하자면 다음과 같습니다.

"성심성의 껏 가능한 방대하지 않은 주제로 전문적인 글 쓰기를 한다면 해당 분야에서 상위로 올라갈 가능성이 크다"

입니다.

모든 명제는 반대로도 적용이 가능합니다.

대충 작성하거나, 남이 쓴걸 베껴오거나 남의 이미지를 함부로 사용하거나, 특정한 주제 없이 오직 유입에만 목을 맨다면 네이버 검색에서 상위로 올라갈 가능성이 매우 적다는 것입니다.

http://searchblog.naver.com/221008093810 블로그 검색 C-Rank알고리즘에 대해 궁금한 점과 저품질 관련 소문 알아보기

http://searchblog.naver.com/220774795442 주제별 출처의 신뢰도와 인기도를 반영하는 C-Rank 알고리즘

http://searchblog.naver.com/220852562214 블로그 방문자 통계와 블로그 검색

http://searchblog.naver.com/220766056734 ‘최적화 블로그’와 ‘저품질 블로그’?

http://searchblog.naver.com/220760111725 블로그 검색 관련 소문 Top 10

또한 불필요한 링크, 불량한 링크, 내용과 상관없는 이미지의 사용 역시 검색에서 상위를 보장하지 않으며 이러한 결과로 소위 "저품질 블로그"라는 형태로 불이익을 당할 수 있다는 것입니다.

물론 여전히 네이버는 저품질 블로그를 인정하지 않습니다.

네이버도 모르던 개념이라고 합니다.

하지만 그렇게 오인할만한 것들에 대해서 어느정도 네이버에서 공식적인 답변을 내놓았습니다.

"그걸 의도한 건 아니지만 그렇게 비춰질 정도로 페널티를 받을 수는 있다"

가 정답입니다.

저품질 블로그의 탈출 방법에 대한 힌트도 일부 함유되어 있으니 모든 링크의 글들을 상세히 읽어보길 권해 드립니다.

http://searchblog.naver.com/220754140850 블로그에서 이미지 사용하기

http://searchblog.naver.com/220748087250 블로그에서 링크 사용하기

http://searchblog.naver.com/220742080173 뜨내기 방문자, 블로그에 득일까? 독일까?

http://searchblog.naver.com/220736004033 검색어를 고려한 블로그 글쓰기

아래의 글들은 그러한 네이버 입장 위에 조금더 참고할만한 내용들입니다.

http://searchblog.naver.com/220913149349 라이브 검색 기술이 네이버 검색으로 이식됩니다

http://searchblog.naver.com/220901375640 PC 통합검색 결과에서도 유사문서 포스트 결과가 제외됩니다.

http://searchblog.naver.com/220823191931 주제별로 살펴보는 블로그 문서 생산량

주제별로 살펴보는 블로그 문서 생산량에서 주목할 만한 내용은 내가 어떤 주제의 글을 쓰는 것이 경쟁이 덜 치열할 것인지를 확인할 수 있습니다.

경쟁이 덜 치열한 주제는 그만큼 인기가 없는 곳이기도 하지만, 

못생긴 애들 중에 내가 제일 잘생겼다가 되기에도 충분합니다.

덧붙이자면 제 경험상 저품질 블로그에 빠지는 상당수의 이유는 바로 유사문서입니다.

위의 네이버 공식 블로그에서도 지적된 바와 같이 유사도는 완전히 똑같아야만 유사문서가 아닙니다.

유사라는 말은 대략 비슷한 부분이 있다로 해석할 수 있습니다.

그런 이유로 100% 똑같다가 아닌 80%만 똑같아도 유사문서이니 아예 노출이 안될 수도 있다는 뜻입니다.

당연하게도 80%이상 유사한 문서들로만 블로그 글을 발행한다면 결국 블로그 자체가 검색에 노출되지 않게 될 수 있다는 뜻이기도 합니다.

그러나 더욱 문제는 80%는 아니더라도 5% 정도씩 유사한 문서들이 블로그에 가득 찬다면 그 역시 블로그 검색 순위 상승에 저해 요소로 작용하고 결국 네이버가 자랑하는 C-Rank 알고리즘에서 "신뢰할 수 없는 출처"가 되어 저품질 블로그의 나락으로 빠지게 된다고 이해하면 되겠습니다.

네이버는 공식적으로 블로그지수는 없다고 하지만 "출처의 신뢰성"을 C랭크 알고리즘으로 평가한다는 것 자체가 블로그 자체 더 나아가 저자의 "신뢰도"를 평가하여 검색 결과 랭킹에 반영한다고 볼 수 있습니다.

이 말의 뒤에 숨은 뜻은 네이버의 웹마스터 도구에 물려 있는 다른 방계 블로그나 사이트의 검색 결과에도 대부분은 아니지만 약간의 영향을 끼칠 가능성을 내포하고 있기도 합니다.

네이버 검색엔진은 네이버 블로그 자체는 자신의 서버니까 사용자의 방계 블로그를 확인할 수 있습니다.

하지만, 티스토리나 워드프레스 등의 블로그는 같은 저자인지 확인할 방법이 사실상 없습니다.

위의 글 중에는 "IP" 체크에 대한 언급도 했습니다.

하지만 사실 저자에 대한 ip체크는 네이버도 불가능합니다.

만약 스크립트등의 방법으로 타 서비스의 작성자 ip주소를 체크한다면 그건 위법사항이 될 수 있습니다.

티스토리 블로그 글이 네이버 검색엔진에 넘겨질 때 rss의 xml문서로 넘겨지는데 이 문서의 그 어떤 항목도 ip정보를 가지고 있지 않기 때문입니다.

그렇다면 네이버가 합법적으로 동일저자를 구분할 수 있는 가장 가능성이 큰 인자 값은 바로 웹마스터 도구에 소유 확인된 사이트로 등록된 사이트 들일 것입니다.

웹마스터 도구에 접속할 때 ip주소로 여러개의 네이버 id를 확인해서 방대하게 동일 사용자임을 확인할 수 있습니다.

이러한 작업을 하는 이유는 전문마케터나 스패머들의 불량한 행동을 감지해서 필터링하기 위해서 반드시 취해야 할 여러 필터링 인자 값들 중의 한 가지일 것입니다.

아무튼 결론은 "성심성의껏 최선을 다해서 전문적인 분야의 글을 고품질의 문서를 자연스럽게 작성해 나가는 것"이 블로그 글의 신뢰도를 높이고 C-Rank를 타고 상위 노출을 노려볼 수도 있다는 것입니다.