Bài trước SEO không phải trò chơi
CHƯƠNG 2: BỘ MÁY TÌM KIẾM XẾP HẠNG NHƯ THẾ NÀO?
Một Search Engine Optimizer (viết tắt là SEOer) thông minh nên bắt đầu sự nghiệp của mình bằng cách nhìn những trang web như cách nhìn của các spider, và nếu làm được điều này bạn đã thành công một nửa.
- Điều đầu tiên, luôn nhớ rằng các bộ máy tìm kiếm xếp hạng các trang web (webpage) chứ không phải xếp hạng website.
- Thứ hai, đến thời điểm hiện tại thì các spider của các bộ máy tìm kiếm gặp giới hạn khi duyệt qua hình ảnh và Javascript, dẫu biết rằng các hình ảnh, Javascript sẽ làm cho các trang web lôi cuốn hơn, sống động hơn. Một bức ảnh với nội dung nào đó có thể rất rõ ràng với người duyệt web nhưng với spider thì không có ý nghĩa gì trừ khi sử dụng thuộc tính Alt.
Với hình ảnh trên, người duyệt web sẽ hiểu nội dung của bức ảnh đề cập đến SEO nhưng với các bộ máy tìm kiếm nó sẽ thấy như sau:
<img src="images/ch2-vd1.jpg">
Như các bạn thấy, không có bất kỳ thứ gì trong đoạn mã trên đề cập đến nội dung của trang web này là SEO. Nhưng nếu chúng ta hiệu chỉnh lại thì kết quả hoàn toàn khác!
<img alt="SEO" src="images/ch2-vd1.jpg">
Chúng ta vừa thêm thuộc tính ALT với nội dung là SEO, điều này có giá trị tương đương với nội dung của bức ảnh trên dành cho người duyệt web. Mục đích của thuộc tính ALT là cung cấp một đoạn văn mô tả cho hình ảnh trong trường hợp vì 1 lý do nào đó mà trình duyệt không thể hiển thị hình ảnh đó. Và giờ đây, thẻ ALT có thêm chức năng là cung cấp thông điệp về nội dung bức ảnh cho các bộ máy tìm kiếm.
Với Javascript, hãy xem 2 ví dụ sau đây:
Trung tâm Đào tạo SEO
<script type="text/javascript" src="js/center.js"></script>
Với ví dụ đầu tiên, người duyệt web thấy rất rõ nội dung được đề cập đến Trung tâm Đào tạo SEO nhưng với ví dụ thứ 2 thì cho dù các spider thông minh cũng không thể nào hiểu nội dung muốn đề cập đến vấn đề gì trong câu lệnh Javascript.
Thêm một vấn đề khác liên quan đến đến Javascript hoặc CSS là một trong những quy tắc của đa số các spider là giới hạn trong việc đọc nội dung trang web. Ví dụ spider của Google (Googlebot) sẽ không đọc nhiều hơn 100KB trong 1 trang cho dù thuật toán của nó có quy định phải tìm từ khóa ở cuối trang. Nếu bạn sử dụng từ khóa trong nội dung vượt qua giới hạn này thì nỗ lực tối ưu của bạn đã bị hủy bỏ. Chính vì thế, hãy xem xét cẩn thận nội dung của phần HEAD khi có quá nhiều script hay css được chèn vào và lời khuyên cho việc này là hãy dùng các tập tin script/css thay vì chèn trực tiếp những dòng lệnh của chúng.
Có rất nhiều ví dụ liên quan đến việc spider xem xét một trang web chẳng hạn như sự tiệm cận của những từ quan trọng ở phần đầu trang. Ở đây có 1 vấn đề cần lưu ý, những gì spider thấy chưa chắc tương tự những gì chúng ta thấy! Điều này thể hiện rõ qua việc khi chúng ta xem 1 trang web, chúng ta sẽ tập trung vào nội dung của trang hơn menu bên trái, còn spider sẽ làm ngược lại, thay vì tập trung vào nội dung, chúng sẽ ưu tiên xem xét menu rồi sau đó mới chuyển qua nội dung vì đơn giản menu thường nằm ở phần khởi đầu của trang (xét theo mã HTML).
Hãy nhớ rằng trong lần ghé thăm đầu tiên 1 trang web nào đó, các spider chưa biết trang web đó liên quan đến nội dung gì! Bằng cách đọc mã HTML của trang đó, các spider mới có thể phán đoán được nội dung của trang web đó.
Sau đó, các spider sẽ nén trang web lại và tạo ra 1 bảng chỉ mục liên quan đến nó. Bạn có thể hình dùng việc spider làm là nó lưu lại tất cả các từ tìm thấy trên trang web, cùng với một số yếu tố quan trọng khác có liên quan đến các từ như sự tiệm cận, tần suất, …
Những từ được đánh giá cao là những từ đáp ứng được các tiêu chuẩn quy định của spider và những từ này sẽ trở thành từ khóa. Thực tế thì có rất nhiều yếu tố để xác định việc này bao gồm cả những yếu tố ngoài trang (off-page) bởi vì spider có thể xác định được tất cả các từ xuất phát từ những những trang khác có liên kết trỏ về trang của bạn.
Khi người duyệt web truy vấn các bộ máy tìm kiếm, chúng sẽ xem xét toàn bộ các trang có nội dung liên quan đến câu truy vấn trong cơ sở dữ liệu và từ đây sự xếp hạng được bắt đầu. Mỗi 1 trang đều có các chỉ số trong trang (on-page), chỉ số độc lập của trang (với Google là PageRank) cùng với các chỉ số ngoài trang (off-page), kết hợp các chỉ số lại sẽ xác định được thứ hạng của 1 trang cụ thể.
Những điểm cần lưu ý
• Các bộ máy tìm kiếm xếp hạng trang web (webpage), không phải xếp hạng website.
• Khi spider ghé thăm trang web của bạn lần đầu tiên, chúng không biết bất kỳ vấn đề gì ngoại trừ URL.
• Trang web của bạn có thể rất lôi cuốn đối với người duyệt web, nhưng hãy luôn đặt câu hỏi là trang web của bạn có dễ dàng đọc được đối với các spider hay không.
Bài tiếp theo Chương3: Quy trình thực hiện một chiến dịch SEO
Xem toàn bộ: Tự học nghề SEO tại nhà