Sitemap là một phần quan trọng của bất kỳ trang Web nào. Dưới đây là những cách để tối ưu File Sitemap.xml của bạn cho các công cụ tìm kiếm và khách truy cập.
Tạo và tối ưu File Sitemap.xml rất cần thiết đối với SEO. Sitemap (sơ đồ trang Web) giúp các công cụ tìm kiếm lấy thông tin về cấu trúc trang Web một cách dễ dàng và đơn giản. Nó cũng cung cấp một số dữ liệu quan trọng như:
- Tần suất cập nhật của mỗi trang.
- Thời gian trang được thay đổi lần cuối.
- Tầm quan trọng của các trang và mối liên hệ giữa các trang.
1. Sử dụng công cụ và Plugin để tự động tạo Sitemap cho trang Web
Việc tạo sơ đồ trang Web sẽ dễ dàng hơn khi bạn có các công cụ phù hợp. Ví dụ như Google XML Sitemap. Các trang Web WordPress đã sử dụng Yoast SEO có thể bật Sơ đồ trang Web XML trực tiếp trong Plugin.
Ngoài ra, bạn có thể tạo sơ đồ trang theo cách thủ công bằng cách làm theo cấu trúc Code của sơ đồ trang XML.
Về mặt kỹ thuật, sơ đồ trang Web của bạn thậm chí không cần phải ở định dạng XML. Tuy nhiên, các nhà quản trị Web sẽ cần phải tạo một Sitemap XML hoàn chỉnh nếu bạn muốn triển khai thuộc tính Hreflang. Vì vậy, nếu không thành thạo Code, bạn nên dùng một Plugin để tạo Sitemap dễ dàng hơn.
2. Submit Sitemap lên Google
Bạn có thể gửi sơ đồ trang Web của mình đến Google nhờ Google Search Console.Bạn vào trang tổng quan, Click chọn Sitemaps, nhập Sitemap và Click chọn “Gửi sơ đồ trang Web”. Tuy nhiên, bạn nên xem lại Sitemap trước khi thực hiện bước cuối này để kiểm tra các lỗi có thể ngăn các trang đích chính được lập chỉ mục.
Việc gửi sơ đồ trang Web lên Google sẽ giúp bạn tối ưu File Sitemap.xml. Cụ thể, nó cho phép Google hiểu cách trình bày trang Web của bạn. Đồng thời, qua việc gửi Sitemap, bạn có thể khám phá và sửa các lỗi để đảm bảo các trang được lập chỉ mục đúng cách.
Các SEOer cần lưu ý rằng, việc gửi sơ đồ trang Web sẽ cho Google biết những trang nào bạn cho là chất lượng cao và đáng được lập chỉ mục. Nhưng điều đó không đảm bảo rằng tất cả các trang bạn gửi đều sẽ được lập chỉ mục.
3. Ưu tiên các trang chất lượng cao giúp tối ưu File Sitemap.xml
Chất lượng trang Web tổng thể là yếu tố quan trọng ảnh hưởng đến xếp hạng của Website. Đừng để sơ đồ trang Web của bạn hướng Bot đến những trang chất lượng thấp. Bởi các công cụ tìm kiếm sẽ ngầm hiểu các trang này là dấu hiệu cho thấy trang Web của bạn không phải là địa chỉ mà người dùng muốn truy cập.
Thay vào đó, các nhà quản trị Web nên hướng các Bot đến các trang quan trọng nhất, chất lượng cao trên trang Web của bạn. Các trang này nên được tối ưu hóa cao với nội dung có giá trị, có hình ảnh, Video. Tốt hơn nữa, trang nên có nhận xét, đánh giá của người dùng.
4. Cô lập các chỉ mục bị lỗi, có vấn đề
Google Search Console có thể không lập chỉ mục cho tất cả các trang của bạn. Ngoài ra, nó cũng không thông báo cho chủ sở hữu Website biết trang nào có vấn đề. Tình trạng này càng dễ thấy hơn đối với các trang Web thương mại điện tử lớn. Các Website này có nhiều trang với các sản phẩm rất giống nhau.
Để tối ưu File Sitemap.xml trong trường hợp này, bạn nên cô lập các trang có vấn đề.
Theo khuyến cáo của nhà tư vấn SEO Michael Cottam, bạn nên chia các trang sản phẩm thành các sơ đồ trang XML khác nhau. Sau đó, bạn tiến hành thử nghiệm từng trang. Thông qua đó, bạn có thể nguyên nhân các trang không được lập chỉ mục. Đó có thể do trang không có hình ảnh sản phẩm, hoặc do trùng lặp nội dung,…
Khi xác định được vấn đề chính, bạn có thể tìm cách khắc phục. Hoặc bạn có thể đặt các trang đó thành “NoIndex” để chúng không làm giảm chất lượng Website của bạn. Vào năm 2018, Google Search Console đã được cập nhật Index Coverage. Đặc biệt, các trang có sự cố hiện đã được liệt kê và lý do tại sao Google không lập chỉ mục một số URL cũng sẽ được cung cấp.
5. Chỉ giữ phiên bản Canonical URLs trong Sitemap
Khi bạn có nhiều trang giống nhau, bạn nên sử dụng thẻ “Link Rel = Canonical” để cho Google biết trang nào là trang chính. Nó sẽ thu thập thông tin và lập chỉ mục cho trang chính này. Ví dụ, bạn có thể áp dụng thẻ này đối với các trang cho cùng một sản phẩm nhưng với các màu khác nhau.
6. Dùng thẻ Meta Robot trên Robots.txt bất cứ khi nào có thể
Khi bạn không muốn một trang được lập chỉ mục, bạn thường dùng thẻ Meta Robot “Noindex, Follow”. Điều này ngăn không cho Google lập chỉ mục trang nhưng nó bảo toàn giá trị liên kết của bạn. Điều này đặc biệt hữu ích cho các trang tiện ích quan trọng với trang Web của bạn, nhưng lại không cần thiết để hiển thị trong kết quả tìm kiếm.
Trong trường hợp bạn đang sử dụng hết ngân sách thu thập thông tin của mình, bạn sẽ muốn sử dụng Robots.txt để chặn các trang.
Nếu bạn nhận thấy rằng Google đang thu thập lại dữ liệu và lập chỉ mục các trang không quan trọng với chi phí như việc thu thập dữ liệu của các trang chính, bạn có thể sử dụng Robots.txt.
7. Tạo Sơ đồ trang web XML động cho các trang Web lớn
Đây cũng là một trong những cách giúp tối ưu File Sitemap.xml hiệu quả. Có thể nói, bạn gần như không thể theo kịp tất cả các Robot Meta trên các trang Web lớn. Thay vào đó, bạn nên thiết lập các quy tắc để xác định khi nào một trang sẽ được đưa vào sơ đồ trang XML của bạn và thay đổi từ Noindex thành “Index, Follow”. Bạn có thể sử dụng Plugin để tạo sơ đồ trang XML tự động dễ dàng hơn.
8. Sử dụng sơ đồ trang Web XML và nguồn cấp dữ liệu RSS/Atom
Khi bạn cập nhật một trang hoặc thêm nội dung mới vào Website, nguồn cấp RSS/Atom sẽ thông báo cho các công cụ tìm kiếm. Google khuyên bạn nên sử dụng cả sơ đồ trang Web và nguồn cấp dữ liệu RSS/Atom. Việc này sẽ giúp các công cụ tìm kiếm hiểu trang nào nên được lập chỉ mục và cập nhật.
Bạn có thể đưa nội dung cập nhật gần đây vào nguồn cấp dữ liệu RSS/Atom. Nó sẽ giúp việc tìm kiếm nội dung mới dễ dàng hơn cho cả công cụ tìm kiếm và khách truy cập.
9. Chỉ cập nhật thời gian sửa đổi khi trang có thay đổi quan trọng
Đây là một cách tối ưu File Sitemap.xml khá đơn giản nhưng nhiều bạn lại bỏ qua. Đừng cố lừa các công cụ tìm kiếm lập chỉ mục lại các trang bằng cách cập nhật thời gian sửa đổi. Nhưng thực tế bạn lại không thực hiện bất kỳ thay đổi đáng kể nào đối với trang. Điều này có thể mang đến những nguy cơ tiềm ẩn cho quá trình SEO. Google có thể xóa dấu ngày tháng của bạn nếu trang được cập nhật liên tục mà không cung cấp giá trị mới.
10. Không đưa URL ‘Noindex’ vào Sitemap
Các trang không được phép lập chỉ không có tác dụng gì trong sơ đồ trang Web của bạn. Khi bạn gửi một sơ đồ trang Web bao gồm cả các trang bị chặn và Noindex, bạn đang gửi những tín hiệu thiếu nhất quán tới Google. Công cụ tìm kiếm sẽ cùng lúc được nhận thông tin là “Việc lập chỉ mục trang này thực sự quan trọng” và “không được phép lập chỉ mục trang này”.
11. Đừng lo lắng quá nhiều về cài đặt ưu tiên
Một số Sitemap có cột “Mức độ ưu tiên” để các công cụ tìm kiếm biết trang nào là quan trọng nhất. Tuy nhiên, không có điều gì chắc chắn rằng tính năng này có thực sự hoạt động hay không. Năm 2017, Gary Illyes của Google cho biết Googlebot sẽ bỏ qua cài đặt ưu tiên trong khi thu thập thông tin.
12. Đừng để Sitemap của bạn có các File quá nặng
Bạn cần tối ưu File Sitemap.xml sao cho nhẹ nhất có thể để máy chủ của bạn càng ít phải làm việc quá tải. Google và Bing đều cho phép mỗi Sitemap có 50.000 URL. Đồng thời, các công cụ cũng tăng kích thước của các tệp Sitemap từ 10MB lên 50MB.
Tuy nhiên, có một số trang cần tạo nhiều Sitemap bởi lượng dữ liệu khổng lồ. Ví dụ, bạn đang điều hành một cửa hàng trực tuyến với 200.000 trang. Lúc này, bạn sẽ cần tạo năm Sitemap riêng biệt để xử lý tất cả những điều đó.
Bạn cần tạo các File Sitemap với kích thước nhỏ nhất có thể để giảm tải mức độ làm việc cho máy chủ Website.
13. Đừng tạo Sitemap nếu bạn không cần
Không phải mọi trang Web đều cần Sitemap. Google có thể tìm và lập chỉ mục các trang của bạn khá chính xác.
Về cơ bản, nếu trang Web của bạn hiếm khi cập nhật thì Sitemap không thực sự cần thiết. Tuy nhiên, nếu bạn xuất bản nhiều nội dung mới, muốn nó được lập chỉ mục càng sớm càng tốt hoặc nếu bạn có hàng trăm nghìn trang thì vẫn nên tạo Sitemap.
Việc tạo và tối ưu File Sitemap.xml không quá khó khăn bởi có nhiều Plugin tự động hóa quy trình cho bạn.
MrH mong rằng những chia sẻ trên đây có thể giải đáp phần nào khúc mắc của các bạn đọc về vấn đề này. Ngoài ra, để không phải lo lắng về vấn đề này, các bạn có thể sử dụng dịch vụ SEO Website. Từ đó, giúp bạn tập trung hoàn toàn vào công đoạn kinh doanh.