Htaccess là gì? Tối ưu hoá SEO website đơn giản mà hiệu quả cao

 Htaccess là gì? Tối ưu hoá SEO website đơn giản mà hiệu quả cao

Trong cuộc đua khốc liệt để chiếm vị trí hàng đầu trên các công cụ tìm kiếm, việc tối ưu hóa SEO là chìa khóa không thể bỏ qua. Điều này đồng nghĩa với việc phải sử dụng các công cụ bổ trợ và giải pháp đặc thù, một lãnh vực đầy rẫy những thuật ngữ mà mọi chuyên gia tiếp thị đều cần phải nắm rõ. Trong số đó, file .htaccess hay htaccess xuất hiện như một công cụ quan trọng.

Tìm hiểu về .htaccess trong SEO

Htaccess là gì?

Về phía kỹ thuật, htaccess là một tệp tin được ứng dụng để định cấu hình thư mục trong các trang web chạy trên máy chủ Apache. Trong trường hợp không thể chỉnh sửa trực tiếp, bạn có thể dễ dàng tạo một tệp tin mới và ghi đè các tham số từ tệp htaccess của mình.

Đặc biệt, nếu bạn đặt tệp htaccess tại thư mục gốc của máy chủ web, các thay đổi sẽ áp dụng cho toàn bộ trang web của bạn.

Kiểm soát htaccess tốt hơn với Directives

Các chỉ thị (directives) là công cụ mạnh mẽ giúp bạn quản lý htaccess một cách linh hoạt hơn, sử dụng các hướng dẫn ngắn gọn. Nhờ vào những chỉ thị này, bạn có khả năng bảo vệ tệp tin với mật khẩu, kiểm soát quá trình thu thập thông tin, cũng như quản lý quyền truy cập cho địa chỉ IP theo ý muốn.

Kiểm soát htaccess tốt hơn với Directives

Tại sao cần tối ưu hóa SEO trong các tệp .htaccess?

Htaccess mang đến nhiều ưu điểm quan trọng cho chiến lược SEO:

  • Công cụ tìm kiếm sẽ tiếp cận cách mà .htaccess xử lý chức năng trang web, và khi được triển khai đúng cách, điều này góp phần nâng cao xếp hạng của trang web.

  • .htaccess cho phép bạn tạo ra các URL mà công cụ tìm kiếm ưa thích, giúp tối ưu hóa cấu trúc liên kết.

  • Nó giải quyết vấn đề lỗi 404 HTTPS và quản lý điều hướng 301, tăng trải nghiệm người dùng và tối ưu hóa SEO.

  • .htaccess cũng được sử dụng để chặn người dùng có địa chỉ IP hoặc domain cụ thể, giúp ngăn chặn các spy solution của công cụ tìm kiếm.

htaccess có thể giải quyết lỗi 404

Trước khi chỉnh sửa .htaccess phải thực hiện backup

Việc chỉnh sửa .htaccess là một nhiệm vụ đề xuất đầy phức tạp. Mặc dù có thể mang lại cải thiện cho trang web, nhưng cũng tiềm ẩn nguy cơ gặp lỗi máy chủ nội bộ 500 và làm cho trang web trở nên không hoạt động nếu thực hiện không đúng.

Để tránh những rủi ro này, quy trình sao lưu hoặc backup file .htaccess trước khi thực hiện bất kỳ sửa đổi nào là biện pháp an toàn và khôn ngoan nhất.

Làm sao để tìm được file .htaccess?

Địa điểm của tệp .htaccess thường phụ thuộc vào nền tảng mà bạn đang sử dụng. Thông thường, nó được đặt trong thư mục gốc của trang web. Ví dụ, nếu bạn là người sử dụng WordPress, bạn có thể tìm thấy nó trong thư mục cài đặt WordPress.

Đối với những người sử dụng cPanel, bạn có thể truy cập File Manager và điều hướng đến thư mục gốc, sau đó kích hoạt tùy chọn "Hiển thị Tệp Ẩn" để tiếp cận tệp .htaccess.

Friendly URLs trong SEO 

URL đóng một vai trò quan trọng trong chiến lược SEO, theo lời khuyên của Matt Cutts. Sự xuất hiện của từ khóa trong URL được coi là một yếu tố có thể giúp tăng cơ hội xếp hạng cao hơn trên các công cụ tìm kiếm.

Đối với những người quản lý blog, ông cũng khuyến cáo về độ dài của URL, nhấn mạnh rằng nó nên ngắn gọn và sạch sẽ. Điều này không chỉ tạo thuận lợi cho công cụ tìm kiếm mà còn gửi đi thông điệp rằng bạn quan tâm đến trải nghiệm đọc của người đọc.

Friendly URLs trong SEO 

Tối ưu hóa URL cho trang web

Để giải quyết vấn đề này, bạn có thể tối ưu hóa tệp .htaccess bằng cách ghi đè các URL hiện tại và đảm bảo chúng được xử lý một cách chính xác. Sử dụng đoạn mã dưới đây trong tệp .htaccess để thực hiện điều này:

RewriteEngine On

RewriteRule ^topicname/([a-zA-Z0-9]+)$ index.php?topic=$1

Với đoạn mã này, tất cả các URL trang web sẽ được chuyển đổi thành dạng như:

www.yoursite.com/therulesyouchoosed/article

Điều này giúp cải thiện định dạng URL và có thể giúp tối ưu hóa trang web của bạn từ góc độ SEO.

Tối ưu CMS URLs

Nếu bạn đang sử dụng WordPress, Joomla hoặc bất kỳ CMS nào, việc tùy chỉnh các URL có thể được thực hiện theo nhiều phương pháp khác nhau. Bạn có thể thực hiện điều này bằng cách thêm đoạn mã sau vào tệp .htaccess:

RewriteEngine On

RewriteRule (.*)/$load_page.php?&page_id=$1

Sau khi cập nhật tệp tin, các URL trang web của bạn sẽ được chuẩn bị để tối ưu hóa SEO một cách hiệu quả hơn.

Xóa .php và .html

Để tối ưu hóa trải nghiệm người đọc và làm cho các URL dễ nhớ hơn, bạn có thể xem xét việc loại bỏ các extension như .html và .php. Để thực hiện điều này, bạn chỉ cần sao chép đoạn mã dưới đây và thêm vào tệp .htaccess của bạn.

RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_FILENAME}.php -f
RewriteCond %{REQUEST_FILENAME}.html -f
RewriteRule ^(.*)$ $1.html [L]

Đoạn mã này giúp xóa bỏ extension và cải thiện tính thẩm mỹ của URL trang web, giúp người đọc dễ nhớ hơn.

Canonical robots.txt

Mặc dù các file robot.txt thường được đặt ở thư mục gốc, tuy nhiên, các robot hay mã độc hại có thể quét toàn bộ trang web để tìm tệp robot.txt và tiêu thụ tài nguyên của bạn. Điều này là một vấn đề mà bạn không muốn xảy ra, và có thể được giải quyết thông qua sử dụng khái niệm canonical.

Giải pháp canonical

Để hướng dẫn người dùng đến tệp robot.txt một cách hiệu quả và giảm áp lực lên server, bạn có thể sử dụng .htaccess. Điều này không chỉ giải quyết vấn đề liên tục yêu cầu truy cập mà còn cải thiện SEO của trang web bằng cách cung cấp nhanh chóng thông tin mà người dùng đang tìm kiếm.

Dưới đây là đoạn mã bạn có thể sử dụng:

RewriteEngine On
RewriteBase /

# Chỉ áp dụng nếu không phải là yêu cầu đến robots.txt
RewriteCond %{REQUEST_URI} !^/robots.txt$ [NC]

# Nếu yêu cầu chứa "robots.txt"
RewriteCond %{REQUEST_URI} robots\.txt [NC]

# Chuyển hướng đến đường dẫn đúng của robots.txt
RewriteRule .* http://yourmotocmswebsite.com/robots.txt [R=301,L]

Trong đoạn mã trên, thay thế "yourwebsite.com" bằng URL thư mục gốc của trang web của bạn. Đoạn mã này sử dụng module rewrite của Apache để giải quyết vấn đề. Tuy nhiên, nếu bạn muốn một giải pháp gọn gàng hơn, bạn có thể sử dụng mod_alias như sau:

RedirectMatch 301 ^/(.*)/robots\.txt http://yourmotocmswebsite.com/robots.txt

Cả hai đoạn mã đều giúp điều hướng yêu cầu không mong muốn trực tiếp đến tệp robots.txt, giảm áp lực lên server và cải thiện trải nghiệm người dùng.

Non-www redirect

Một trong những thách thức cơ bản mà nhiều trang web đối mặt là việc quản lý chuyển hướng giữa phiên bản có và phiên bản không có www.

Khi kiểm tra trang web, quan tâm đến vấn đề chuyển hướng non-www cũng là quan trọng. May mắn là, thẻ Canonical có thể giải quyết vấn đề này, đồng thời giúp khắc phục vấn đề URL trùng lặp và cải thiện cấu trúc URL tổng thể của trang web.

Dưới đây là cách sử dụng .htaccess để thực hiện chuyển hướng từ non-www sang www bằng một trong hai đoạn mã sau:

RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.yourwebsite\.com
RewriteRule (.*) http://www.yourwebsite.com/$1 [R=301,L]

hoặc

RewriteEngine On
RewriteCond %{HTTP_HOST} ^yourwebsite\.com [NC]
RewriteRule (.*) http://www.yourwebsite.com/$1 [R=301,L]

Hãy thay thế "yourwebsite" bằng tên miền của bạn. Cả hai đoạn mã đều giúp đảm bảo rằng người dùng sẽ được chuyển hướng đến phiên bản có www, giúp giải quyết vấn đề không chỉ là chuyển hướng mà còn cấu trúc URL của trang web.

Sử dụng canonical tags cho header tags và tệp PDF

Việc sử dụng rel="canonical" trong header tags cũng như tệp PDF có thể là một cách hiệu quả để chỉ định các URL và tệp canonical.

Ví dụ, bạn có thể sử dụng các thẻ canonical để hướng dẫn liên kết đến tệp PDF trỏ đến bản HTML tương ứng, giúp người dùng xem nội dung mà không cần tải tệp xuống. Để kích hoạt tính năng này, bạn có thể sử dụng mã sau:

Header and Link “; rel=”canonical””

Redirect bằng cách sử dụng .htaccess cho SEO

Trong phần này, chúng ta sẽ xem xét cách thực hiện chuyển hướng thông qua việc chỉnh sửa file .htaccess để tránh lỗi 301 và 404. Điều này giúp đảm bảo rằng người dùng sẽ không gặp phải các liên kết hỏng, đồng thời tạo điều kiện cho trang web đáp ứng các tiêu chuẩn được đặt ra bởi thuật toán của Google.

Với vai trò là chủ website, bạn có khả năng tùy chỉnh xử lý của trang 404 bad request, có thể chuyển hướng người dùng đến trang chủ hoặc cung cấp một trang tìm kiếm hoặc liên kết liên quan. Thực hiện đúng cách, các điều chỉnh trong htaccess có thể giúp giảm tỷ lệ thoát và cải thiện hiệu suất SEO của trang web.

Thực hiện chuyển hướng cho tất cả các lỗi bao gồm:

  • 400: yêu cầu không hợp lệ
  • 401: yêu cầu ủy quyền
  • 403: nội dung bị cấm
  • 500: lỗi máy chủ

Để thực hiện điều này, bạn chỉ cần thay đổi mã lỗi và chỉnh sửa trang chuyển hướng liên quan bằng đoạn mã dưới đây:

ErrorDocument 402 /temp/page-unavailable-temporarily402

Chặn bots xấu

Không phải mọi bot đều có ý định tích cực. Một số có thể muốn thu thập dữ liệu từ trang web của bạn mà không mang lại giá trị. Điều này làm cho việc chặn những bot không mong muốn trở nên quan trọng. Trong tệp htaccess, bạn có thể sử dụng đoạn mã dưới đây để tạo các điều kiện ngăn chặn bot:

RewriteCond%{HTTP_USER_AGENT} ^BOTNAME [OR]
RewriteCond%{HTTP_USER_AGENT} ^BOTNAME1 [OR]
RewriteCond%{HTTP_USER_AGENT} ^BOTNAME3
RewriteRule ^.*-[F,L]

Sửa lỗi 301 redirects and 404 errors

Khi trang web của bạn đang trong quá trình bảo trì hàng ngày, "404 Not Found" có thể là vấn đề phổ biến. Một giải pháp hiệu quả để giải quyết vấn đề này là sử dụng chuyển hướng 301, giúp chuyển hướng từ trang cũ sang trang mới. Điều này mang lại hai lợi ích chính:

  1. Chuyển hướng thành công các trang web liên kết đến trang cũ của bạn.
  2. Chuyển hướng 301 hoạt động cho tất cả các công cụ tìm kiếm, bao gồm cả Google.

Để thực hiện điều này, bạn có thể sử dụng đoạn mã dưới đây và thêm vào tệp .htaccess của mình:

Redirect 301/information/old-article
http://www.yourmotocmssite.com/articles/new-article

Chuyển hướng sang trang web mới nhất

Khi các công cụ tìm kiếm thu thập dữ liệu từ nhiều địa chỉ trên trang chủ của bạn, quá trình index này diễn ra thường xuyên. Tự nhiên, bạn không muốn khách hàng truy cập vào phiên bản cũ của trang web.

Điều này làm cho việc thực hiện chuyển hướng đến phiên bản trang web mới là cực kỳ quan trọng. Để thực hiện điều này, bạn có thể sử dụng đoạn mã sau trong tệp .htaccess:

RewriteCond %{HTTP_Host} ^yoursite.com$ [NC]
RewriteCond ^(.*)$ http://www.yourmotocmssite.com/$1[R+301,L]
RewriteCond %{THE_REQUEST} ^.*/index
Rewriter ^(.*)index$ http://www.site.com/$1 [R=301, L]

Lưu ý: Đừng quên thay thế “yourmotocmssite” thành tên miền của bạn.

Chuyển hướng Sitemaps

Để bảo vệ sitemaps khỏi các bot xấu và đồng thời đảm bảo rằng máy chủ của bạn có thể giúp crawler tìm thấy chúng, bạn có thể sử dụng mã sau trong tệp .htaccess:

RedirectMatch 301 /sitemap\.xml$ http://yourmotocmssite.com/sitemap.xml
RedirectMatch 301 /sitemap\.xml\.gz$ http://yourmotocmssite.com/sitemap.xml.gz

Hãy thay thế "yourmotocmssite.com" bằng tên miền của trang web của bạn. Đoạn mã này giúp chuyển hướng yêu cầu đến sitemaps thông thường và phiên bản nén của chúng.

Điều này không chỉ giúp bảo vệ sitemaps khỏi các bot xấu mà còn giúp tối ưu hóa tài nguyên hệ thống và tiết kiệm băng thông.

Cải thiện .htaccess cho SEO với Site Speed Caching

Mọi người đều đánh giá tốc độ, bao gồm cả người dùng và các công cụ tìm kiếm. Để đạt được xếp hạng cao hơn, website của bạn cần có tốc độ tải nhanh. Caching là một giải pháp hiệu quả để cải thiện điều này.

Caching là phương pháp lưu trữ tài nguyên trang web trong trình duyệt, giúp tránh việc tải lại khi người dùng yêu cầu. Bằng cách kích hoạt bộ nhớ đệm, bạn không chỉ tăng tốc độ trang web mà còn giảm áp lực lên máy chủ.

Để sử dụng bộ nhớ đệm, bạn có thể kích hoạt mod_headers và mod_expires như sau:

ExpiresActive In
ExpiresDefault A259200

Đoạn mã này giúp đặt thời gian hết hạn cho nội dung, được tính bằng giây, để giữ tài nguyên trong bộ nhớ đệm và cải thiện hiệu suất tải trang.

Đọc thêm: Hướng dẫn cách chặn địa chỉ IP bằng IP Blocker & .htaccess

Robot Directives

Nếu trang web của bạn chứa các trang hoặc bài đăng mà bạn muốn hạn chế quyền truy cập, bạn có thể sử dụng .htaccess để thực hiện điều này.

Đoạn mã dưới đây giúp bạn ẩn các tệp PHP và đồng thời có thể cấu hình máy chủ web để ngăn chặn quyền truy cập:

Header (“X-Robots-Tag: no index”, true);

Nếu bạn muốn đặt các trang thành "no follow" để ngăn chúng được theo dõi bởi các công cụ tìm kiếm, bạn có thể sử dụng:

Header set X-Robots-Tag “no index”

Những đoạn mã này giúp bạn kiểm soát quyền truy cập và cấu hình của trang web một cách linh hoạt và an toàn.

Header (“X-Robots-Tag: no index, no follow”, true);

Chuyển hướng nguồn cấp dữ liệu sang FeedBurner

Để tăng cường SEO trang web thông qua việc chuyển hướng nguồn cấp dữ liệu đến Feedburner, bạn có thể sử dụng .htaccess để tự động hóa quá trình. Dưới đây là một cách để thực hiện điều này:

# Feedburner redirection
RewriteCond %{REQUEST_URI} ^/feed/ [NC]
RewriteCond %{HTTP_USER_AGENT} !(FeedBurner|FeedValidator) [NC]
RewriteRule .* http://feeds.feedburner.com/mainContentFeed [L,R=302]
RewriteCond %{REQUEST_URI} ^/comments/feed/ [NC]
RewriteCond %{HTTP_USER_AGENT} !(FeedBurner|FeedValidator) [NC]
 RewriteRule .* http://feeds.feedburner.com/allCommentsFeed [L,R=302]

Để tùy chỉnh mã trên với giá trị FeedBurner của bạn, bạn cần thay thế "allCommentsFeed" và "mainContentFeed" bằng tên của nguồn cấp dữ liệu cụ thể của bạn trên FeedBurner.

Cải thiện Crawl Mobile Content bằng Vary Header

Để cải thiện mobile serving và thông báo cho Google rằng bạn có một trang khác để phục vụ người dùng di động, bạn có thể sử dụng Vary Header.

Điều này giúp Google xác định các trang một cách chính xác và thu thập dữ liệu phù hợp hơn, từ đó cải thiện trải nghiệm người dùng và ảnh hưởng đến thứ hạng SEO của trang web.

Để kích hoạt tính năng này, bạn chỉ cần thêm đoạn mã sau vào tệp .htaccess:

Header append Vary User-Agent

Ngăn việc ăn cấp hình ảnh

Để ngăn chặn các trang lấy hình ảnh từ website của bạn và cải thiện việc sử dụng băng thông máy chủ, bạn có thể định cấu hình .htaccess với đoạn mã sau:

OnRewriteCond% {HTTP_REFERER}! ^ Http: //www.yourmotocmssite.com [NC]
RewriteCond% {HTTP_REFERER}! ^ Http: //yourmotocmssite.com [NC]
RewriteRule [^ /] +. (Gifljpg) – [F]

Htaccess là công cụ mạnh mẽ giúp bạn tối ưu hóa SEO trang web của mình theo nhiều cách khác nhau. Trong bài viết hôm nay, chúng ta đã thảo luận về nhiều phương pháp như chuyển hướng, bộ nhớ đệm, canonical và URL thân thiện với SEO.

.Htaccess có thể giải quyết các vấn đề liên quan đến hình ảnh, redirection, lỗi HTTP, và nhiều vấn đề khác, tất cả đều ảnh hưởng đến trải nghiệm người dùng và có liên quan trực tiếp đến SEO. Do đó, việc thiết lập .htaccess sớm có thể mang lại lợi ích to lớn cho trang web của bạn.

Một số câu hỏi thường gặp

Có những rủi ro nào khi sử dụng Htaccess?

Mặc dù Htaccess là một công cụ mạnh mẽ, nhưng việc sử dụng nó cần phải cẩn thận. Sai sót trong cấu hình có thể dẫn đến lỗi trang web, mất dữ liệu, hoặc thậm chí là vấn đề bảo mật. Do đó, luôn nên sao lưu tệp Htaccess trước khi thực hiện bất kỳ thay đổi nào và kiểm tra kỹ lưỡng trước khi đưa chúng vào hoạt động.

Làm thế nào để kiểm tra xem Htaccess đã hoạt động đúng cách hay không?

Để kiểm tra xem Htaccess đã hoạt động đúng cách hay không, bạn có thể thử truy cập vào các URL đã chuyển hướng, kiểm tra tốc độ tải trang bằng công cụ như Google PageSpeed Insights, và theo dõi các lỗi trang web thông qua Google Search Console hoặc các công cụ giám sát trang web.

Làm thế nào để tạo và sử dụng Htaccess?

Để tạo và sử dụng Htaccess, bạn cần tạo một tệp văn bản mới có tên là ".htaccess" và đặt nó trong thư mục gốc của trang web của bạn. Sau đó, bạn có thể thêm các tùy chọn cấu hình vào tệp này bằng cú pháp Apache.

Với giá cực tốt, bạn sẽ sở hữu dịch vụ Cloud Hosting ổ SSD tốc độ cao, an toàn và bảo mật. Đặc biệt, chúng tôi cung cấp bảng điều khiển cPanel dễ sử dụng và băng thông không giới hạn. Hãy trải nghiệm sự khác biệt với KDATA ngay hôm nay!

https://kdata.vn/cloud-hosting

👉 Liên hệ ngay KDATA hỗ trợ tận tình, support tối đa, giúp bạn trải nghiệm dịch vụ giá hời chất lượng tốt nhất

Bài viết liên quan