Thứ Sáu, 4 tháng 1, 2013

7 bí mật của thuật toán Google Panda






Thuật toán Google Panda được chính thức áp dụng lên trang tìm kiếm của Google vào ngày 24/02/2011, hậu quả là đã làm cho những website mang nội dung tiếng Anh “thất thoát” khoảng 12% lượt truy cập. Chưa dừng lại ở đó, sau lần cập nhật tiếp theo vào ngày 11/04/2011 thì con số này tiếp tục tăng thêm 2%. Và cứ thế trong suốt hơn 1 năm, đến hiện tại thuật toán Google Panda đã áp dụng lên một số nội dung website mang những ngôn ngữ khác ở châu Á như tiếng Trung, Hàn và Nhật và trở thành “cơn ác mộng” đối với dân làm SEO sử dụng các phương pháp cũ hay Blackhat SEO. Sự kiện này đã gây ra một cú sốc lớn đối với những người làm SEO nói riêng và internet marketing nói chung. Vậy nguyên nhân gì dẫn đến kết cục lâm li bi đát như vậy khi thuật toán Google Panda ra mắt?

Các chuyên gia SEO cho rằng thuật toán Google Panda được ra mắt nhằm loại bỏ những website có chất lượng kém trong trang kết quả tìm kiếm Google (SERPs), các website được Google cho là mang chất lượng kém bao gồm nội dung copy, có nhiều backlink rác, spam từ khóa, chèn nội dung quảng cáo quá mức..v..v..Và những người đau khổ nhất trong lần cập nhật thuật toán này có lẽ là những người đang áp dụng hình thức “farm” liên kết bằng cách tạo nhiều website khác nhau nhằm tăng liên kết dofollow cho website chính.




Nhưng dù thế nào đi chăng nữa, các thuật toán tìm kiếm và xếp hạng website của Google được đưa ra không bao giờ tiết lộ chính xác những thông tin chi tiết để chúng ta có thể nhận biết nhằm tìm kiếm một phương thức khác để thay đổi kế hoạch SEO của mình. Nghĩa là các kết luận về Google Panda và những “tiêu chí” của nó cũng chỉ là do phỏng đoán dựa trên những kinh nghiệm của những người làm SEO. Nhưng có một điều chắc chắn là nếu bạn dành thời gian ra để trải nghiệm thì chắc hẳn sẽ hiểu được ít nhiều Google Panda hoạt động như thế nào, dưới đây là một số mục tiêu website có thể chịu sự trừng phạt của thuật toán Google Panda.

Mục tiêu nhắm đến của thuật toán Google Panda

  • Website có nhiều backlinks trên những trang có Pagerank (PR) thấp.
  • Tốc độ xây dựng backlink không đồng đều. Nghĩa là xuất hiện “hàng tấn” backlink chỉ trong một thời gian ngắn rồi sau đó là quá chậm so với tốc độ thật.
  • Từ khóa quá nhiều hoặc quá ít. Một website bình thường luôn có những từ khóa trọng tâm, dù vô tình hay cố ý.
  • Tỷ lệ bounce rate cao.
  • Có quá nhiều backlink trên cùng một website.
  • SEO On-Page không tối ưu, không sử dụng các liên kết nội bộ (internal linking) vào nội dung.
  • Không có hoặc có quá nhiều outbound link (liên kết trỏ ra ngoài).

Vậy thuật toán Google Panda hoạt động thế nào?



Trước khi muốn làm thế nào để tránh khỏi sự trừng phạt của Google Panda hiệu quả thì chúng ta nên biết qua một số bí mật của thuật toán này. Nó sẽ giúp chúng ta thuật toán này hoạt động như thế nào và chỉ tiêu xếp hạng của một website.

7 bí mật của thuật toán Google Panda

Thuật toán Google Panda cuối cùng cũng chỉ là một ngôn ngữ máy móc và hoạt động dựa trên những thiết lập sẵn của con người, vì vậy nếu nói chính xác ra thì chúng ta vẫn có thể biết một số những bí mật của nó trong phương thức làm việc nhằm tìm ra giải pháp tối ưu hóa website tốt nhất.
1. Google Panda cập nhật thứ hạng website mỗi 30 ngày một lần

Ngay tại thời điểm mình đăng bài này, thuật toán Google Panda vô cùng máy móc và phức tạp, nó phức tạp đến nỗi nó chỉ cập nhật thứ hạng của các website mỗi 30 ngày một lần  . Hay nói cách dễ hiểu hơn, nếu như sau khi bạn đọc bài này và bạn làm một số thay đổi phù hợp, rồi ngày mai bạn được Google crawl dữ liệu và đánh chỉ mục, thì mãi đến 30 ngày sau bạn mới thấy được các kết quả chính xác của sự thay đổi đó (tăng hạng hoặc rớt thứ hạng).

Các bạn thử xét một trường hợp sau:

Hôm nay Google đánh chỉ mục website bạn và thuật toán Google Panda được áp dụng để đánh giá thứ hạng website của bạn, lúc này website bạn sẽ nằm ở trang 7 của kết quả tìm kiếm. Do vậy, bạn bắt đầu xây dựng các profile backlinks (liên kết ở trong hồ sơ tài khoản trên các web 2.0), sau một tuần trôi qua thứ hạng của bạn vẫn không thay đổi. Tiếp theo đó, bạn viết một số bài viết trên website và tối ưu hóa nó đầy đủ, một tuần sau bạn vẫn không thấy tín hiệu khả quan gì.

Tiếp theo, bạn lang thang khắp các website khác cùng nội dung và comment để tìm một mớ nofollow link, bạn kiểm tra và….Ờ….vẫn chưa thay đổi gì. 

Cuối cùng, bạn mò lên các mạng xã hội như Facebook, Google Plus, Twitter và đăng tải các liên kết của mình lên đó và submit bài viết lên một số trang social bookmarking khác. Vào cuối tuần đó, bạn sẽ thấy website mình bay vọt lên trang 3 của kết quả tìm kiếm.

Sau đó, bạn sẽ tự cho rằng áp dụng mạng xã hội vào chiến dịch SEO hay submit bài viết lên các social bookmarking là một phương pháp cải thiện thứ hạng cho website sau khi Google Panda được cập nhật. Rồi bạn đi khắp từ blog này đến diễn đàn khác để rêu rao một “chân lý” mới kiểu như đã tìm ra một bí mật để cải thiện thứ hạng website.

Nhưng, liệu bạn đã thật sự tìm ra được bí mật?

Hãy luôn nhớ rằng trước khi bạn đăng các liên kết lên mạng xã hội hay các trang social bookmarking thì bạn đã làm qua một số phương pháp như viết bài được tối ưu hóa, xây dựng profile backlinks, xây dựng backlink nofollow. Và tất cả một trong 3 bước còn lại đều có thể ảnh hưởng đến việc bạn nhảy từ trang 7 lên trang 3 của kết quả tìm kiếm.

Trên thực tế, một vài các việc làm kể trên thậm chí còn làm cho thứ hạng website của bạn bị giảm đi, nhưng lúc đó có những phương pháp khác được tác động lên và làm thế nào để mình biết phương pháp nào ảnh hưởng tốt đến thứ hạng website?

Trước tiên cần nên biết rằng, việc submit bài viết lên các trang social bookmarking vô cùng kém hiệu quả trong việc cải thiện thứ hạng website, nhưng do bạn làm nó trước một tuần khi Google Panda đánh giá thứ hạng website nên việc nhảy vọt lên trang thứ 3 làm bạn tin rằng đó là một phương pháp tốt. Vì vậy nếu bạn muốn biết được phương pháp nào ảnh hưởng tốt đến website, hãy làm một phương pháp đó đều đặn trong 30 ngày, bạn sẽ có được kết quả chính xác về những gì mình làm.

2. Tên miền được xếp hạng dựa trên các trang trong website

Một trong những lý do khiến rất nhiều website bị tụt hạng trong các lần cập nhật của Google Panda đó là quá chú trọng đến việc tạo backlink dẫn đến trang chủ mà bỏ qua việc xây dựng backlink dẫn đến các bài viết hay các trang trong website. Điều này có nghĩa là nếu website bạn có 20 trang nội dung, trong đó bạn có 3, 4 trang mang nội dung chất lượng, còn lại là những thông tin rác kém chất lượng, lúc đó thì các trang kém chất lượng sẽ kéo thứ hạng toàn bộ website của bạn xuống.

Như vậy từ yếu tố này, chúng ta rút ra một kinh nghiệm là nên tăng cường SEO cho từng trang nội dung của website, chèn các liên kết sâu trong bài viết và quan trọng là có nhiều backlink chất lượng trỏ về trang đó.
3. Tính tương tác trong website là vô cùng quan trọng

Các website được nâng cao thứ hạng sau khi Google Panda cập nhật là những website được người dùng tương tác nhiều trên đó. Hay nói cách khác, các trang web đó không chỉ có nhiều người truy cập mà họ còn tương tác nhiều lên website đó như nhấp vào các liên kết, điền email vào hộp nhận bản tin, xem video hay làm các việc khác đều ảnh hưởng tích cực đến thứ hạng tìm kiếm sau khi Google Panda được cập nhật. Vì vậy có thể hiểu rằng, nếu website của bạn làm thế nào đó mà khách truy cập dành nhiều thời gian để ghé thăm (Avg. Visit Duration) và họ nhấp vào nhiều liên kết trong website để tăng pageview (Bounce Rates sẽ giảm đi) thì mình dám cá cược với bạn rằng Google không có lý do gì để đánh giá thấp thứ hạng của bạn.

Nếu các bạn có tham gia vào các cộng đồng Internet Marketing và SEO trên thế giới hẳn sẽ biết có những trường hợp người ta chỉ bỏ vỏn vẹn ra 1 ngày để hoàn thành một blog, không tùy chỉnh hay thiết kế tối ưu hóa gì cả và quan trọng là không xây dựng bất cứ một backlink nào mà họ vẫn đạt được thứ hạng cao với vài từ khóa quan trọng và lại cao hơn nữa khi Google Panda được ra đời.

Tại sao lại như vậy?

Thứ nhất, website đó chứa đựng khoảng gần 100 trang mang nội dung cực kỳ chất lượng, những bài viết đó luôn có liên quan với nhau và được viết bởi một người có nhiều năm kinh nghiệm trong việc viết bài để SEO cho một niche mà họ tập trung vào.

Thứ 2, tỷ lệ bounce rate của website đó luôn thấp hơn 40%, các lượt truy cập hầu hết là từ Google với một từ khóa chính xác (ví dụ họ tìm “Thủ thuật SEO” thì nó dẫn tới một trang mang nội dung hoàn toàn là Thủ thuật SEO, không lẫn với các nội dung khác), thời gian họ ở lại trên website đó trung bình là 10 phút/lượt truy cập.Và những người truy cập vào website này đều xem trung bình khoảng 8 trang khác nhau cho mỗi lần truy cập.

Từ các con số này, chúng ta đều hiểu là mọi người đều thích nội dung của website này và máy tìm kiếm cũng hiểu rằng website này thật sự có ích đối với người truy cập. Từ đó thuật toán tìm kiếm của Google sẽ tự động xếp hạng của những website này cao hơn bao giờ hết. Đừng lo lắng nếu bạn không biết làm thế nào để cải thiện bounce rate và page views, mình sẽ đề cập đến nó sau.

4. Nội dung vẫn là Vua – Content Still is King



Một câu vọng cổ vô cùng quen thuộc của dân làm SEO. Mình không bắt các phải hiểu điều này vì mình biết các bạn đã hiểu nó, hiểu rằng nội dung luôn là quan trọng nhất. Nhưng bạn đang làm điều gì để biến nội dung của bạn thành “Vua”? Nói không phải đâm chọt một số người nhưng mình biết các nhà marketing trực tuyến để làm affiliate, nhất là các dịch vụ SEO chuyên nghiệp có kiêm luôn dịch vụ viết bài (các dịch vụ này hay gặp ở các blog từ Ấn Độ hay Philipines) thì họ luôn có thói quen dùng các phương pháp “spin” bài viết (xào nấu lại bài viết thủ công hoặc bằng máy móc) và khách hàng phải trả khoảng 2$ đến 3$ cho bài viết khoảng 500 từ. Họ luôn cho rằng nếu nội dung thật sự quan trọng, thì điều đó có nghĩa là họ phải viết thật nhiều nội dung để bổ sung vào website bằng mọi phương pháp để tiết kiệm thời gian nhất, chứa nhiều từ khóa quan trọng nhất, miễn là không bị trùng với các website khác.

Đây có lẽ là sai lầm nguy hiểm nhất khi nói đến việc tối ưu hóa website để phòng chống thuật toán Google Panda sờ gáy. Theo các nghiên cứu của những chuyên gia về SEO hàng đầu tại SEOmoz và những người làm Internet Marketing đã có nhiều kinh nghiệm nghiên cứu về Google Panda chỉ ra rằng, nội dung chỉ có thể được gọi là “Vua” khi nó phải có chiều sâu, nội dung thật sự chất lượng là một bài viết đạt thứ hạng cao thật sự. Nghiên cứu này dựa vào việc phân tích 3 website đứng đầu trang kết quả tìm kiếm trên một từ khóa tiếng Anh phổ biến và có độ cạnh tranh cao.

Trên thực tế, một bài viết có độ dài từ 500 đến 700 từ là một bài viết rất tốt để SEO là một khái niệm phổ biến, nó phổ biến đến mức trở thành một cái khuôn mẫu cho một lý thuyết viết bài để đạt thứ hạng cao trên máy tìm kiếm. Thật sự, một bài viết có chiều dài 3.000 từ với những thông tin bổ ích, định dạng bài viết chuyên nghiệp và những thông tin thú vị là một sự lựa chọn hợp lý hơn. Vì sao?, đơn giản là với 500 từ bạn sẽ truyền đạt bài viết như thế nào để người dùng có thể tìm kiếm được nhiều thông tin bổ ích ở đó để làm họ có thể ở lại website bạn lâu hơn?

5. Return Visitor được Google chú ý và đánh giá cao

Đây là một nguyên lý đã được phổ biến khá lâu, nhưng kể từ khi Google Panda được cập nhật thì nó lại càng quan trọng hơn. Các thuật toán của Google luôn nắm được những thông tin về các lượt truy cập vào website bạn và từ đó họ sẽ biết được website nào có nhiều return visitor (lượt truy cập quay trở lại), từ đó Google sẽ hiểu rằng website bạn có những thông tin thật tuyệt vời để khiến nhiều người thường xuyên truy cập vào website đó mỗi ngày, nghĩa là họ thích nội dung đó và Google cũng thích lắm luôn  .

Có rất nhiều Webmaster luôn cho rằng mục tiêu của họ là kiếm thật nhiều Unique Visitors (lượt truy cập dựa trên mỗi IP), điều đó có nghĩa có nhiều người khác nhau truy cập vào website. Dĩ nhiên điều này cũng rất quan trọng, nhưng nếu họ chỉ truy cập vào website một lần mà không trở lại lần thứ hai thì mọi người (kể cả Google bots) sẽ hiểu là nội dung của bạn không có gì đặc biệt, và chú Panda của Google sẽ nói rằng “Ê nhìn kìa, website của cậu này không có giá trị gì đặc biệt vậy thì tại sao chúng ta phải đưa nó lên những trang đầu tiên của kết quả tìm kiếm?“.

Nếu website của bạn có nội dung tốt và có liên kết với các tài khoản mạng xã hội thì rất có thể khi khách truy cập ghé thăm website của bạn thì họ sẽ Like hay Following các tài khoản mạng xã hội để cập nhật các nội dung từ website của bạn dễ dàng hơn, điều đó cũng có nghĩa là họ sẽ có cơ hội truy cập vào website bạn nhiều lần hơn. Hoặc nếu website của bạn có sử dụng RSS, đó cũng là một cách tốt để giúp cho khách truy cập có điều kiện cập nhật thông tin từ website bạn.

6. Click Through Rates luôn quan trọng

Bởi vì Click Through Rates (CTR – tỷ lệ click vào cho mỗi lượt hiển thị trên máy tìm kiếm) có nghĩa là nhiều người chọn liên kết dẫn tới website của bạn trong hàng đống website khác trong kết quả tìm kiếm của Google. Và như thế Google sẽ hiểu được nội dung của website bạn thu hút như thế nào thì mọi người mới click vào nhiều như thế.

Những gì chúng ta có thể làm để tăng tỷ lệ CTR cho website đó là tối ưu hóa thẻ tiêu đềvà meta descriptions thật tối ưu để người dùng có thể hiểu được các nội dung trên liên kết của bạn để có thể được họ nhấp vào. Mình không yêu cầu các bạn phải giật tít lung tung beng hay viết tiêu đề giả tạo các sự kiện nóng hổi, bởi điều đó sẽ giết chết sự uy tín của website của bạn chỉ với vài nốt nhạc sau khi họ nhận được nội dung thật sự của bạn. Nói đúng hơn, bạn nên thêm các từ khóa quan trọng vào tiêu đề một cách hợp lý, cùng với vài dòng meta descriptions chi tiết hơn nhưng không kém phần thu hút. Từ đó, khách truy cập sẽ biết được động cơ chính để họ ghé thăm website bạn.

7. Exact Match Domain (EMD) không phải luôn quan trọng

Chúng ta đều biết rằng khi chúng ta sở hữu một tên miền mang đầy đủ các từ khóa liên quan đến nội dung website (EMD) thì bạn sẽ được thứ hạng khá cao về từ khóa đó. Ví dụ như nếu mình có một website nói về Thủ thuật SEO mang domain thuthuatseo.com thì coi như đã nắm chắc trong tay cơ hội ”double-win” với từ khóa đó. Đó là một trong những lý do tại sao các domain chứa từ khóa phổ biến đều được hét với giá vài chục hay vài trăm triệu. Về ưu điểm của một website mang một tên miền liên quan như vậy thì rất nhiều, nhưng quan trọng nhất đó là nhận được rất nhiều lượt truy cập mặc dù website đó có ít nội dung. Hãy thử trả lời câu hỏi này nhé, nếu bạn đang tìm kiếm các website nói về Thủ thuật Thesis thì bạn nhấp vào website nào giữa 2 tên miền abcxyz.com và thuthuatthesis.com?



Nhưng có một tin vui dành cho những người không sở hữu các domain “vàng” như thế này đó là Google Panda sau khi ra mắt đều mong muốn tạo một “sân chơi” công bằng cho mọi website, điều đó có nghĩa là nếu website bạn có nội dung thật sự chất lượng về một chủ đề nào đó thì vẫn được thứ hạng cao hơn các website sở hữu một EMD nhưng nội dung kém.

Hơn thế nữa, Matt Cutts đã đăng một thông báo nói rằng các thuật toán để xếp hạng những website có EMD sẽ được nâng cấp hơn nhằm loại bỏ những EMD có nội dung chất lượng kém.
Vậy chúng ta sẽ làm gì để bảo vệ website khỏi Google Panda?

Trong bài này chúng ta đã điểm qua một vài bí mật có trong thuật toán Google Panda để có thể lên kế hoạch SEO website phù hợp với máy tìm kiếm Google hơn. Ở phần 2 bài viết, mình sẽ đề cập đến những phương pháp để tránh khỏi sự trừng phạt của thuật toán Google Panda.

Không có nhận xét nào:

DBS M05479
Quang Cao