Làm thế nào để Google index bài viết nhanh? Làm theo 10 cách này
Sau một thời gian, bài viết của bạn vẫn chưa được lập chỉ mục trên trang công cụ tìm kiếm. Vậy làm thế nào để Google index bài viết nhanh nhất? Mời bạn tham khảo bài hướng dẫn bên dưới đây.
Xóa mã Crawl Block trong tệp robots.txt
Google index không index toàn bộ trang Web của bạn? Đó có thể là do trong tệp robots.txt của bạn có chứa đoạn mã chặn Google gây nên.
Để kiểm tra, bạn hãy áp dụng cách Index Google nhanh nhất này: Truy cập yourdomain.com/robots.txt và tìm một trong hai đoạn mã sau:
1. User-agent: Googlebot2. Disallow: / 1. User-agent: *2. Disallow: /
Cả hai đoạn mã này đều báo Googlebot biết rằng chúng không được phép thu thập dữ liệu bất kỳ trang nào trên Web của bạn. Thế nên để khắc phục sự cố, bạn chỉ cần xóa chúng đi là xong, easy.
Hơn thế nữa, Crawl Block trong robots.txt cũng có thể là thủ phạm khiến Google không index những trang lẻ trên Web. Để kiểm tra thì bạn dán URL vào Công cụ URL Inspection Tool trong Google Search Console. Nhấp vào Coverage Block để hiển thị thêm chi tiết, sau đó tìm kiếm “Crawl Allowed? No: Blocked by robots.txt”.
Nếu có thì chắc rằng trang bị chặn trong robots.txt.
Trong trường hợp đó, hãy kiểm lại tệp robots.txt để xem có lệnh “Disallow” nào liên quan đến trang hoặc tiểu mục liên quan không nhé!
Xóa thẻ Noindex giả
Google sẽ không index trang nếu bạn đã yêu cầu Noindex. Cái này chỉ có ích khi bạn muốn giữ một số trang Web ở chế độ riêng tư.
Có hai cách để làm thực hiện tìm xóa thẻ Noindex như sau.
Phương pháp 1: Thẻ Meta
Những trang có một trong các thẻ Meta này trong phần <head> của chúng sẽ không được Google index:
Những trang có thẻ Meta này trong sẽ không được index
Để tìm tất cả trang có thẻ Meta ngăn index trên trang. Bạn có thể dùng Ahrefs’ Site Audit để thu thông tin rồi đến Indexability, tìm “Noindex page”.
Nhấp xem tất cả trang bị ảnh hưởng và xóa thẻ Meta noindex khỏi những trang có thẻ ngoài ý muốn.
Phương pháp 2: X ‑ Robots-Tag
Công cụ kiểm tra URL trong Search Console sẽ cho chúng ta biết liệu Google có bị chặn thu thập thông tin trang do Header này hay không.
Bạn chỉ cần nhập URL, sau đó tìm kiếm “Indexing allowed? No: ‘noindex’ detected in ‘X‑Robots-Tag’ http header”
Bạn cũng có thể rà soát vấn đề này bằng Ahrefs. Cụ thể, hãy cào thông tin trong công cụ Ahrefs’ Site Audit. Sau đó sử dụng bộ lọc “Robots Information in HTTP header” trong Page Explorer:
Yêu cầu loại trừ trang bạn muốn index
Sau đó yêu cầu Team Developer loại trừ trang bạn muốn index bằng cách trả lại Header này.
Đưa trang vào Sitemap
Sitemap là gì?
Sitemap (sơ đồ trang Web) cho Google biết trang nào trên Website bạn là quan trọng và trang nào thì không. Nó cũng có thể cung cấp một số hướng dẫn về tần suất bao lâu thì nên cào thông tin 1 lần.
Google có thể tìm thấy các Page Website bạn bất kể chúng có trong Sitemap hay không, nhưng bạn vẫn nên đưa chúng vào nhé!
Để xem một Page bất kỳ có trong Sitemap hay chưa thì chúng ta sử dụng công cụ kiểm tra URL trong Search Console. Nếu bạn thấy lỗi “URL không có trên Google” và “Sitemap: N/A”, thì “chắc kèo” là không có trong Sitemap hoặc đã được index Google.
Còn trong trường hợp bạn không sử dụng Search Console thì áp dụng cú pháp: yourdomain/sitemap.xml—và tìm kiếm trên Google.
Dùng Ahrefs’ Site Audit để kiểm tra
Nếu có kết quả tương ứng trả về thì trang này đã được Google index và ngược lại. Hoặc nếu bạn muốn tìm tất cả trang đã cào và index mà không có trong Sitemap. Thì lại dùng Ahrefs’ Site Audit, tới Page Explorer và áp dụng các bộ lọc sau:
Sau khi hoàn tất thì cho Google biết bạn đã cập nhật Sitemap của mình bằng cách ping URL
Sẽ lọc được các trang nên Index Google nhưng chưa được thêm vào Sitemap, vì vậy hãy thêm chúng vào Sitemap nhé! Sau khi hoàn tất thì cho Google biết rằng bạn đã cập nhật Sitemap của mình bằng cách Ping URL này:
http://www.google.com/ping?sitemap=http://yourwebsite.com/sitemap_url.xml
Thay thế phần cuối cùng đó bằng URL Sitemap của bạn. Sau đó bạn sẽ thấy một đoạn văn bản:
Giúp tăng tốc độ index trang của Google, đơn giản vậy thôi.
Xóa các Canonical Tag giả mạo
Cách index Google nhanh nhất đó là xóa các Canonical Tag giả mạo. Canonical cho Google biết đâu là phiên bản tối ưu hơn của trang, trông giống như sau:
<link rel = “canonical” href = “/ page.html /”>
Hầu hết trang hoặc không có Canonical Tag hoặc sẽ có cái gọi là Canonical Tag tự tham chiếu – Cho Google biết rằng chính trang này là phiên bản duy nhất được ưa thích.
Nói cách khác, đây là trang bạn muốn được index Google.
Nhưng nếu trang của bạn có Canonical Tag giả mạo. Thì Google sẽ không biết về phiên bản ưu tiên ấy và chắc chắn, trang của bạn sẽ không được Google index.
Để Check Canonical, hãy sử dụng công cụ kiểm tra URL của Google. Bạn sẽ thấy cảnh báo “Trang thay thế có Canonical Tag” nếu Canonical trỏ đến một trang khác.
Sử dụng công cụ kiểm tra URL của Google để kiểm tra Canonical
Để làm nhanh hơn trên Ahrefs, bạn có thể vào Ahrefs’ Site Audit để cào thông tin rồi đến Page Explorer, áp dụng các cài đặt sau:
Làm nhanh hơn trên Ahrefs
Thao tác này giúp tìm kiếm các Page trong sitemap có các Canonical Tag không tự tham chiếu (Non-self-referencing canonical tags). Những kết quả trả về là những trang có thẻ Canonical không hợp lệ. Hoặc không nên có trong Sitemap của bạn ngay từ đầu.
Đảm bảo không tồn tại trang không có link nội
Làm cách nào để index bài viết nhanh trên Google? Hãy chắc chắn rằng không tồn tại các trang mồ côi trang không có Internal Link trỏ đến chúng. Vì Google phát hiện ra nội dung mới bằng cách thu giữ thông tin trên Web nên họ không thể khám phá trang mồ côi trong quá trình đó.
Khách truy cập trang Web cũng sẽ không thể tìm thấy chúng nếu bạn không dẫn dắt họ. Để kiểm tra trang mồ côi, tiếp tục thu thập dữ liệu Web bằng Ahrefs’ Site Audit. Tiếp theo, nhấp xem báo cáo Links để tìm lỗi “Orphan Page (has no incoming internal links)”:
Kiểm tra các trang mồ côi, thu thập dữ liệu web bằng Ahrefs’ Site Audit
Cách này hiển thị tất cả trang có thể index Google và hiển thị trong Sitemap nhưng không có Internal Link nào trỏ đến chúng cả.
Lưu ý
Quá trình này chỉ hoạt động khi có hai điều sau:
- Tất cả trang bạn muốn Google index đều có trong Sitemap rồi - Bạn đã cho phép sử dụng trang trong Sitemap của mình làm điểm bắt đầu để thu giữ thông tin khi thiết lập trong Ahrefs’s Site Audit. Còn nếu bạn không chắc rằng tất cả trang bạn muốn được index đều đã có trong Sitemap thì thử 3 bước này, cũng đơn giản thôi:
- Tải xuống danh sách đầy đủ các trang trên Web thông qua CMS - Thu thập thông tin trang trên Web của bạn (sử dụng công cụ Ahrefs’ Site Audit) - Tham chiếu chéo hai danh sách URL trên. - Bất kỳ URL nào không được tìm thấy trong danh sách của Ahrefs đều là những trang mồ côi.
Bạn có thể sửa những trang mồ côi theo một trong hai cách:
- Nếu trang không quan trọng: xóa trang và xóa khỏi Sitemap. - Nếu trang quan trọng: kết hợp nó vào cấu trúc Internal Link của Website.
Sửa các Internal Link Nofollow
Link Nofollow là những Link có thẻ rel = “nofollow”,ngăn chặn việc chuyển PageRank đến URL đích. Google cũng không thu thập thông tin các Link Nofollow.
Google đã nói rằng:
Về cơ bản, việc sử dụng Nofollow khiến bọn tui loại bỏ các liên kết mục tiêu khỏi biểu đồ tổng thể của Web. Tuy nhiên, những trang mục tiêu vẫn có thể xuất hiện trong chỉ mục của tụi tui nếu các trang Web khác liên kết đến chúng mà không sử dụng Nofollow hoặc nếu URL được gửi đến Google trong Sitemap.
Tóm lại, để dễ hiểu thì bạn cần đảm bảo rằng tất cả các Internal Link đến những trang có thể Index Google theo dõi. Để thực hiện việc này, hãy sử dụng công cụ Ahrefs’ Site Audit để thu thập dữ liệu trang Web rồi đi tới báo cáo Link để biết các trang có thể index có lỗi “Page has nofollow incoming internal links only” như hình dưới hay không
Nếu có thì chỉ cần xóa thẻ Nofollow khỏi các Internal link này nếu bạn muốn Google index trang.
Thêm Internal Link “mạnh”
Như mình đã nói ở trên:
Google phát hiện ra nội dung mới bằng cách thu thập dữ liệu Website.
Nên nếu bạn sơ ý không Internal Link đến trang được đề cập thì họ có thể không tìm thấy trang được. Và giải pháp dễ nhất là thêm một số Internal Link vào trang bạn muốn Google Index.
Tuy nhiên, nếu bạn muốn Google index trang nhanh nhất có thể, bạn nên đi link từ những trang “mạnh”, những trang quan trọng trên Web. Tại sao? Bởi vì khả năng cao là Google thu giữ thông tin trang này nhanh hơn so với trang ít quan trọng hơn.
Dựa vào Ahrefs Site Explorer. Bạn chỉ cần nhập tên miền sau đó truy cập báo cáo Best by links như ảnh dưới là xong.
Báo cáo Best by links trên Ahrefs Site Explorer
Tất cả trang trên Web sẽ được hiển thị và sắp xếp theo Xếp hạng URL (UR). Nói cách khác, nó hiển thị các trang có thẩm quyền nhất từ trên xuống. Đọc lướt danh sách này và tìm trang có liên quan để thêm Internal Link vào trang được đề cập là được.
Đảm bảo nội dung là duy nhất
Google sẽ “chần chừ” không index Google các trang chất lượng thấp vì chúng không có giá trị gì đối với người dùng, theo như những gì John Mueller của Google nói về index vào năm 2018:
Anh ấy ngụ ý rằng nếu bạn muốn Google index trang hoặc trang Web của mình, trang Web đó cần phải “tuyệt vời và đầy cảm hứng”, tốt cho người dùng.
Nếu bạn đã loại trừ các vấn đề kỹ thuật do thiếu index mà vẫn không tìm ra nguyên nhân thì khả năng cao là do trang bạn thiếu giá trị. Vì lý do đó, bạn nên xem lại trang và tự hỏi bản thân: Trang này có giá trị thực sự không? Người dùng có tìm thấy giá trị trong trang này nếu họ nhấp vào nó từ kết quả tìm kiếm không?
Nếu câu trả lời là không cho một trong hai câu hỏi đó, thì bạn cần phải cải thiện nội dung của mình về khía cạnh cung cấp giá trị. Để tìm những trang có chất lượng thấp chưa được Google index, bạn có thể sử dụng công cụ Ahrefs Site Audit và URL Profiler bằng cách truy cập Page Explorer, áp dụng các cài đặt sau:
Tìm các trang có chất lượng thấp và chưa được index
Kết quả sẽ trả về các trang Thin Content có thể index và hiện không nhận được Organic Traffic nào (đồng nghĩa với việc không được Google index)..
Xuất báo cáo, sau đó dán tất cả các URL vào URL Profiler và chạy kiểm tra Google Indexation như ảnh dưới.
Chạy kiểm tra Google Indexation
Lưu ý:
Bạn nên sử dụng Proxy nếu bạn đang làm thao tác này cho nhiều trang (tức là hơn 100 trang). Nếu không thì có nguy cơ IP của bạn sẽ bị Google cấm. Hoặc không bạn có thể dùng thử “free Google indexation checker” – các trình lập chỉ mục miễn phí. Vài trong số những công cụ này dùng tốt, nhưng hầu hết chúng được giới hạn khoảng <25 trang cùng lúc.
Sau khi Check trang chưa được Google index vì chất lượng Content thì lên kế hoạch cải thiện Content nhé! Rồi yêu cầu index lại trong Google Search Console.
Bạn cũng nên cố gắng khắc phục sự cố với Duplicate Content. Google không có khả năng index Google trang trùng lặp hoặc gần trùng lặp nội dung. Để Check cái này thì bạn chỉ cần dùng báo cáo Duplicate Content trong Ahrefs Site Audit như ảnh sau.
Báo cáo Duplicate Content trong Ahrefs Site Audit
Xóa những trang có chất lượng thấp
Có thể bạn chưa biết: Có quá nhiều trang chất lượng thấp trên trang Web sẽ làm lãng phí ngân sách và giảm tốc độ thu thập thông tin.
Google nói rằng:
Việc lãng phí tài nguyên máy chủ trên [trang có giá trị gia tăng thấp] sẽ làm tiêu hao hoạt động thu giữ thông tin từ trang thực sự có giá trị, điều này có thể gây ra sự chậm trễ đáng kể trong việc khám phá nội dung tuyệt vời trên trang Web.
Ví dụ như giáo viên trên lớp chấm bài bạn, thì tất nhiên chấm điểm 10 bài sẽ nhanh hơn chấm điểm cả trăm bài, đúng chứ? Google tuyên bố rằng “phần lớn các trang Web có ít hơn vài nghìn URL sẽ được thu thập thông tin một cách hiệu quả hơn.”
Tuy nhiên, xóa trang chất lượng thấp khỏi trang Web không phải hành động thừa mà còn có thể có tác động tích cực đến hiệu quả thu thông tin.
Xây dựng Backlink chất lượng cao để Google index nhanh
Trong cách index Google nhanh nhất cần biết đó là Backlink. Các Backlinnk cho Google biết rằng một trang Web của bạn quan trọng hay không, có thẩm quyền hay không. Cơ bản, nếu ai đó đang liên kết với Web, thì Web này phải có một số giá trị. Và đấy chính xác là loại trang mà Google muốn index.
Để hoàn toàn minh bạch, Google không chỉ index các trang Web có Backlink. Có rất nhiều (hàng tỷ) trang được index không có Backlink.
Tuy nhiên, vì Google coi trang có liên kết chất lượng cao quan trọng hơn, nên chúng có khả năng thu thập thông tin — Và thu thập lại thông tin — Những trang như vậy nhanh hơn những trang không có. Tức là được Google index nhanh hơn.
Lưu ý: Lập chỉ mục ≠ xếp hạng
Việc trang hoặc trang Web của bạn được index trong Google không có nghĩa là xếp hạng hoặc giúp tăng Traffic tự nhiên ngay nhé.
Đây là hai thứ khác nhau. Lập chỉ mục có nghĩa là Google biết trang Web của bạn. Nó không có nghĩa là họ sẽ xếp hạng nó cho bất kỳ truy vấn phù hợp và đáng giá nào.
Hãy tạo ra nội dung sáng tạo theo nhu cầu tìm kiếm của người dùng, update thường xuyên, viết bài xoay quanh chủ đề đó, thi thoảng xây dựng backlink.... để Google nhanh chóng lập chỉ mục. Nếu bác Gồ vẫn không có động tĩnh gì thì bạn hãy thử làm theo các cách trên đây nhé. Mong rằng bạn đọc đã có đáp án cho câu hỏi làm thế nào để Google index bài viết nhanh rồi.
Nguồn bài tham khảo: gtvseo.com