Sitemap XML là bước đi vô cùng quan trọng khi tiến hành SEO cho website, nó giúp hướng dẫn bot Google đến nhanh chóng đến tất cả các nội dung trên website. Việc có một Sitemap XML luôn là một yếu tố xếp hạng trong SEO, vì giúp bot Google có thể truy xuất các bài viết trên website rất nhanh ngay cả khi website được tối ưu liên kết internal kém.
Và bài viết này SEO Nam Nguyễn sẽ giải thích Sitemap là gì và cách giúp cải thiện thứ hạng website như thế nào.
Sitemap XML là gì?
Sitemap XML là một tệp thông tin của website còn hiểu theo cách khác là một bản đồ của 1 website, được các công cụ tìm kiếm sử dụng để thu thập thông tin của một website (như bài viết mới, bài viết được cập nhật, hình ảnh, video) và lập chỉ mục, nếu tốt sẽ nhanh chóng xếp hạng cao trên các công cụ tìm kiếm.
Chúng ta luôn muốn Google thu thập dữ liệu mọi trang quan trọng trên website một cách nhanh chóng. Nhưng thông thường các bài viết mới thì không có liên kết internal tới, điều này gây khó khăn cho bot Google lập chỉ mục.
Chính lý do này thì website bắt buộc phải có Sitemap để đảm bảo Google có thể thu thập dữ liệu một cách nhanh nhất. Dưới đây là Sitemap XML chứa tất cả các trang của website SEO Nam Nguyễn để giúp Google xác định cấu trúc:
Ở đây có thể thấy rõ SEO Nam Nguyễn đang sử dụng Plugin Yoast SEO để hiển thị Sitemap của website. Và ở bài viết này chúng tôi cũng sẽ hướng dẫn bạn cách sử dụng Yoast để tối ưu Sitemap một cách tốt nhất.
Theo như hình ảnh trên thì Yoast hiển thị một số Sitemap XML:… / post-sitemap.xml,… / page-sitemap.xml,… / category-sitemap.xml… Việc phân loại này làm cho cấu trúc website sẽ tốt hơn bao giờ hết. Nếu bạn nhấp vào một link của Sitemap XML thì sẽ thấy tất cả các URL trong Sitemap trong đó (tìm hiểu thêm: Friendly url là gì?):
Và ở mỗi dòng của các URL đều cho thấy thời điểm cập nhật lần mới nhất, điều này rất tốt trong SEO vì Google sẽ cập nhật nội dung một cách nhanh chóng. Do đó chỉ cần sitemap thay đổi thì Google sẽ nhanh chóng biết có nội dung mới để thu thập thông tin và tiến hành lập chỉ mục.
Và với một website lớn thì tốt nhất là nên tách ra nhiều Sitemap khác nhau và đặt giới hạn URL trong mỗi sitemap riêng (thường sẽ có giới hạn là 50.000 URL). Ở Yoast SEO nên đặt giới hạn là 1.000 URL để đảm bảo website được load nhanh.
Những trang nào phải có trong Sitemap XML của bạn?
Chúng ta cần phải có sự chủ động để quyết định URL nào sẽ có trong sitemap và URL nào thì không. Vì có những URL thực sự chúng ta không bao giờ muốn bot Google ghé vào và lập chỉ mục.
Nhưng có một vấn đề mặc dù loại bỏ các URL không muốn ra khỏi sitemap nhưng Google vẫn có thể lập chỉ mục, nếu thực không muốn Google lập chỉ mục các nội dung này (thường là nội dung liên quan tới chính sách bảo hành, chính sách vận chuyển…) thì chúng ta phải thêm thẻ ‘noindex’ vào các bài viết này.
Cách làm cho Google tìm thấy Sitemap XML
Google sẽ tìm nhanh Sitemap XML của website nếu như chúng ta thêm nó vào tài khoản Google Search Console. Rất dễ dàng, chỉ cần vào Search Console đến mục ‘thu thập dữ liệu’ sau đó nhấp vào sơ đồ trang website. Và Search Console cho thấy Sitemap đã được thêm vào hay chưa, nếu chưa có thì chỉ cần click vào ‘Thêm/kiểm tra sơ đồ trang web’ như hình dưới:
Như hình ảnh trên, thì việc thêm site map cho thấy website có được Google lập chỉ mục hay không. Nếu như số liệu đã gửi và được lập chỉ mục chênh nhau quá lớn, thì 1 nguyên tắc trong SEO Onpage là bắt buộc phải tìm ra nguyên nhân và giải quyết triệt để vấn đề nội dung không được lập chỉ mục.
Tối ưu Sitemap XML bằng Yoast SEO cho website wordpress
Do tầm quan trọng của Sitemap XML, thì ở các website wordpress có plugin Yoast SEO có chức năng hỗ trợ sitemap dành cho phiên bản miễn phí và cả trả phí.
Yoast SEO sẽ tạo một Sitemap XML cho website một cách tự động. Chúng ta có thể dễ thấy nó bằng cách vào Yoast SEO – sau đó chọn chức năng General –> Features thì sẽ thấy sitemap của website:
Ở chức năng này chúng ta có thể bật hoặc tắt Sitemap của website. Nếu bạn không hiểu có thể click và dấu chấm ? để gợi ý thêm các thông tin, như kiểm tra sitemap trong trình duyệt:
Nếu như muốn loại bỏ những nội dung không muốn Google lập chỉ mục và có trong sitemap, thì có vào chức năng ‘Search Appearance’ –> Content Types, nếu như chọn ‘No’ thì những nội dung này sẽ bị loại ra khỏi sitemap và gắn thẻ ‘noindex’. Hoặc có thể tùy chỉnh ở từng nội dung ở chức năng tùy chỉnh của Yoast.
Kiểm tra Sitemap XML!
Trong SEO (Tìm hiểu: SEO là gì?) thì có rất nhiều yếu tố thành công quan trọng trong đó là phải có một Sitemap XML, bởi vì Google có thể dễ dàng truy cập vào các bài viết nếu như các URL này có trong sitemap. Ngoài ra còn giúp Google có thể dễ dàng tìm ra những nội dung mới cập nhật, từ đó thu thập dữ liệu lại những nội dung này. Cuối cùng, phải kiểm tra Sitemap XML của website trong Google Search Console ngoài việc giúp Google tìm thấy Sitemap nhanh chóng thì nó còn cho phép chúng ta kiểm tra các lỗi lập chỉ mục.
Tìm hiểu thêm: