Những lỗi thường gặp của website

Về mặt kỹ thuật có rất nhiều lỗi mà một website có thể mắc. Để học hết về những lỗi này cần một thời gian đủ dài. Bài học này chỉ giới thiệu với bạn những lỗi phổ biến nhất để bạn có thể tránh chúng ngay từ đầu.

1. Chặn site do Robots.txt

Việc chặn toàn bộ website bằng robots.txt dễ một cách đáng ngạc nhiên. Nếu website của bạn mãi mà không thấy xuất hiện trên bảng kết quả tìm kiếm, việc đầu tiên phải làm là kiểm tra xem trong file robots.txt (nếu có) của website có câu lệnh sau đây không:

Disallow: /

Nếu có câu lệnh này thì toàn bộ website của bạn đã bị chặn. Bọ tìm kiếm không thể ghé thăm bất kỳ vị trí nào trên website của bạn.

2. Chặn site do Meta Robots

Bạn cũng có thể chặn một trang web rất dễ dàng nhờ thẻ meta robots. Nếu trang web của bạn mãi không xuất hiện trong bảng kết quả tìm kiếm hoặc biến mất sau một thời gian xuất hiện trên bảng kết quả tìm kiếm, kiểm tra trong thẻ meta robots của trang web đó có dòng lệnh sau đây không?

<meta name=”robots” content=”noindex,nofollow” />

3. Lỗi thẻ Canonical

Thẻ canonical bắt đầu được đưa vào sử dụng từ năm 2009. Đây là cách mà máy tìm kiếm sử dụng để giải quyết các nội dung trùng lặp.

Thẻ này rất được máy tìm kiếm coi trọng, chỉ cần sử dụng sai một chút có thể ảnh hưởng nghiêm trọng đến thứ hạng website, hoặc tồi tệ hơn làm website biến mất hoàn toàn khỏi bảng kết quả tìm kiếm.

Lỗi thẻ canonical thường gặp là:

1. Có nhiều hơn một thẻ canonical trên một trang web

2. Thẻ canonical của tất cả các trang đều trỏ về trang chủ

Kiểm tra thẻ canonical bằng cách:  Xem mã nguồn của trang (CTRL+U trong Chrome, CMD+U trên máy Mac)

4. Điều hướng trang chủ

Khi tạo website mới thay thế 1 website cũ, nhiều người có thói quen redirect tất cả các trang web của website cũ sang trang chủ của website mới. Là một người làm SEO, bạn cần khuyên khách hàng không nên làm như vậy.

Thay vào đó, redirect lần lượt từng trang con trên website cũ sang từng trang trên website mới. Việc này sẽ đảm bảo các trang con trên website mới sẽ nhận được giá trị link và lưu lượng từ website cũ. Điều rất hữu ích cho thứ hạng của các website mới này.

Chuỗi chuyển hướng 301

Chuỗi chuyển hướng 301 cũng có thể làm cho bạn mất thứ hạng. Chuỗi chuyển hướng là: Một địa chỉ URL1 (START) được chuyển hướng đến URL2 (OLD), sau đó URL2 này lại được chuyển hướng đến URL3 (NEW). Như hình minh họa dưới đây:

Kỹ thuật đúng phải là: Vẫn giữ nguyên chuyển hướng 301 từ OLD sang NEW. Tuy nhiên, Start cũng nên được chuyển hướng đến NEW để đảm bảo giá trị của link không bị mất mát. Tóm lại, bạn nên làm như hình dưới đây:

Moving URLs (302s vs 301s)

Khi di chuyển một website đến một domain mới, hoặc 1 địa chỉ URL mới, người thiết kế web đôi khi sử dụng chuyển hướng 302 thay vì 301. Như bạn đã biết, 302 có nghĩa là “di chuyển tạm thời”, còn 301 là “Di chuyển vĩnh viễn”

Với chuyển hướng 302, site mới sẽ không nhận được giá trị link từ site cũ (link equity). Thứ hạng và lưu lượng truy cập website sẽ tụt giảm nếu bạn sử dụng 302 thay vì 301.

Non-static URLs

Non-static URLs (URLs động), đặc biệt trong trường hợp URL sử dụng tham số để phân biệt người dùng, hoặc phiên), có thể gây ra trùn lặp nội dung. Điều này rất hay xuất hiện ở những website lớn. Do đó, bạn nên sử dụng URL tĩnh, cố định cho tất cả các trang web bất cứ khi nào có thể. Tránh sử dụng mọi loại tham số.

Nếu bạn không thể không sử dụng tham số, bạn nên sử dụng tag canonical để chỉ ra địa chỉ URL nào bạn muốn máy tìm kiếm index.

Không có sitemap

Nhiều website cũng mắc phải lỗi không có sitemap XML. Bạn đã được học về cách tạo và gửi sitemap đến máy tìm kiếm nên tôi không nhắc lại ở đây.

2 cách kiểm tra để biết sitemap có tồn tại hay không?

1. Kiểm tra file robots.txt (đặt tại http://domain.com/robots.txt)

2. Tìm kiếm trên Google với câu lệnh site:domain.com inurl:sitemap.xml. Nếu không có kết quả trả về, chứng tỏ website đó không có sitemap

Trả lời