Khai thác Google: Canonical SEO tiêu cực

Một phương pháp tấn công SEO tiêu cực mới đã được phát hiện. Điều làm cho việc khai thác này trở nên đặc biệt tồi tệ là hầu như không thể phát hiện ra kẻ tấn công. Không có cách nào để phục hồi nếu trang web bị tấn công.



Cho đến nay, Google vẫn còn im lặng về cách họ dự định tiến hành để khai thác lỗ hổng này trong việc xếp hạng và loại bỏ webpage.

Đáng lưu ý là việc khai thác này đã được quan sát nhưng chưa được kiểm tra và xác minh. Nếu việc khai thác này là có thật thì nó có khả năng làm gián đoạn kết quả tìm kiếm của Google.

Cuộc tấn công được phát hiện như thế nào?

Cuộc tấn công canonical trang web được phát hiện bởi Bill Hartzer của Hartzer Consulting. Một doanh nghiệp tiếp cận ông khi trang web của họ giảm thứ hạng đột ngột. Trong quá trình xem xét lại backlinks, Hartzer đã phát hiện ra các liên kết đến một trang web lạ. Nhưng khách hàng không liên kết đến trang web đó. Việc điều tra cho thấy trang web đã dẫn ông đến trang web SEO tiêu cực.

Nếu trang web tấn công đó không liên kết đến trang bên thứ 3, Hartzer sẽ không thể xác định được trang web bị tấn công. Đó là nhờ việc index mới của công ty khai thác dữ liệu SEO Majestic bao gồm canonical dữ liệu mà Hartzer có thể biết được trang web bị tấn công.



Cách hoạt động của Canonical SEO tiêu cực

Cuộc tấn công xảy ra bằng cách copy toàn bộ phần "head" của webpage nạn nhân vào phần head của webpage spam bao gồm cả thẻ canonical. Thẻ canonical nói cho Google biết rằng trang spam này là webpage của nạn nhân. Sau đó Google gán tất cả nội dung từ webpage spam vào webpage của nạn nhân.

Cách để phát hiện cuộc tấn công này

Hartzer nói rằng ông đã thử một số công cụ phần mềm bao gồm cả Copyscape và nhiều công cụ khác nhưng cho đến nay chỉ có Majestic mới có thể xác định được một số trang web bị tấn công.

Hartzer nói: "Tôi đã thử với Publicwww nhưng nó không hiển thị dữ liệu chỉ có Majestic hiển thị mối quan hệ và đó là bởi vì một trong những SEO tiêu cực đã liên kết ra. Tuy nhiên, trong các trường hợp khác tôi phát hiện ra trang web không liên kết ra. Tôi biết có những trang web khác đang thực hiện việc này để...nhìn thấy vài trang web khác".

Google làm gì để ngăn chặn việc khai thác chéo trang web không?

Gần đây Kristine Schachinger đã xác định việc khai thác tương tự, ông đưa ra những quan sát này:

"Thông thường phương pháp tấn công và kết quả có thể được theo dõi trực tiếp với nhau. Nhưng lần này, vecto tấn công không nằm trong trang web bị tấn công mà là sự yếu kém trong thuật toán của Google.
Cuộc tấn công dựa vào nhận thức "hai trang web là một" của Google. Điều này chuyển các biến số tích cực hoặc tiêu cực giữa các trang web của kẻ tấn công và nạn nhân.
Sự hỗn loạn vẫn tồn tại trong một thời gian có nghĩa là cuộc tấn công có tính lâu dài. Đây là vấn đề của Google và dường như họ không tích cực giải quyết".


Liệu đây có phải là cuộc khai thác thực sự không?

Cuộc khai thác này được ghi nhận là đã xảy ra với một số trang web. Nhưng đáng chú ý là không có thử nghiệm nào cho đến nay để xác nhận rằng loại tấn công này là khả thi.

Google có thể làm gì để ngăn chặn việc khai thác này?

Nếu khai thác này là có thật, nó có tác động đến cách Google và Bing sử dụng thẻ canonical. Trên thực tế, thẻ canonical không phải là một chỉ thị. Điều này có nghĩa là không giống với tập tin Robots.txt, công cụ tìm kiếm không bắt buộc phải tuân theo thẻ canonical. Thẻ canonical này được xử lý bởi công cụ tìm kiếm như một đề xuất.

Nếu đó là một lỗ hổng trong cách thẻ canonical làm việc thì giải pháp có thể là công cụ tìm kiếm cập nhật lại các đặc tả canonical để không được sử dụng nó trên các domain khác nhau. Lý tưởng nhất điều này nên được thực hiện thông qua Google Search Console.

Ghi nguồn diễn đàn marketing khi sao chép lại nội dung này.
 
Admin

Bình luận

Setrus

Member
Tớ là Seoer
Bị Cảnh Cáo
#4
Bài viết bổ ích, mình sẽ tìm hiểu và thực hiện.
 

nganpham

Member
Tớ là Seoer
#6
đọc được bài viết này khiến mình có nhiều vế đề trước đây chưa hiểu giờ đã hiểu!
 

taiwiki

Member
Tớ là Seoer
#8
Không giống tấn công Canonical lắm, vì cái này do lúc copy code phần head chưa chỉnh sửa, thì để lại Canonical ở trang trước đó
 

hoangphiphi

Member
Tớ là Seoer
Bị Cảnh Cáo
#12
bài viết chia sẻ hay, cảm ơn thớt nhiều!
 

Liên Kết Diễn Đàn

xem kênh thvl1 trực tuyến (26/11),

Liên Hệ Quảng Cáo

Liên Kết Diễn Đàn

xem kênh thvl1 trực tuyến (26/11),