Mục đích lớn nhất của website bạn là gì? Mỗi khi bạn tạo mới 1 website, 1 blog hay đơn giản là viết mới 1 bài, 1 post… thì chắc chắn sẽ muốn nhiều người biết đến nó. Và trên thế giới Internet rộng lớn này, với sự thống trị của Google thì việc đó chỉ có thể được thực hiện qua cơ chế Search – tìm kiếm của Google. Và về mặt kỹ thuật, bạn phải chờ để cho các con Googlebot tiến hành – craw, đọc và lọc nội dung website, sau đó thêm vào danh sách Google Index.
Câu hỏi được đặt ra ở đây là làm thế nào để việc Google lập Index những gì bạn tạo mới theo cách nhanh nhất? Hay nói ngắn gọn là làm sao để Google nhanh chóng biết những gì bạn mới viết và đẩy nó lên kết quả tìm kiếm nhanh hơn những người khác, những website khác?
Đây là thuật ngữ quen thuộc với những người làm SEO. Tuy nhiên nhiều người mới vào nghề chưa hiểu Index là gì và cơ chế hoạt động của nó như thế nào. Về bản chất bạn đã biết rằng: Khi một website chính thức đăng ký với Google, các post của nó xuất hiện trên kết quả tìm kiếm khi người dùng gõ từ khóa liên quan.
Tuy nhiên điều này không diễn ra 1 cách tự nhiên. Các con bọ của Google (crawl) đã phải trải qua quá trình thu thập dữ liệu về máy chủ, toàn bộ các thông tin của website bao gồm bài viết, hình ảnh…lập chỉ mục cho website trên cơ sở dữ liệu của Google, từ đó mới có thể xuất hiện trên kết quả tìm kiếm.
Vì sao cần kiểm tra index của website?
Kiểm tra index sẽ giúp các Seoers đánh giá chính xác tình trạng của website, mức độ “hợp cạ” của website với Google để có những giải pháp điều chỉnh phù hợp. Nếu bạn không tìm thấy kết quả nào được index thì hãy xem xét lại chất lượng của website, và liệu rằng nó có vi phạm các thuật toán của Google hay không? Nếu bạn Google vẫn index bài viết cho bạn, nhưng với một tốc độ “rùa bò” thì thử xem website của bạn có chỗ nào bị Google “chê”, hay tốc độ load chậm, hosting “dởm” khiến việc thu thập thông tin của các con bọ Google bị gián đoạn.
Một lưu ý nhỏ cho các bạn Seoers trong trường hợp muốn “giữ bí mật” một số nội dung chưa xuất bản với Google, bạn có thể làm bằng cách cấu hình trong file robot.txt đặt trong website. Nhưng nhớ là khi đã cài đặt ngăn chặn các công cụ tìm kiếm đánh chỉ mục website này, thì các bài viết đó không được index, nên nếu bạn có đặt link ở đấy thì cũng chẳng ích gì đâu nhé.
Ảnh hưởng đến hiệu quả SEO website
Tốc độ index bài viết tác động trực tiếp đến việc website có thể xuất hiện trên thanh tìm kiếm hay không, tiếp cận đến người dùng hay không. Vì thế khi kiểm tra index website Google bị chậm trễ sẽ khiến tốc độ SEO website giảm xuống đáng kể.
Bị trở thành copier bất đắc dĩ
Khi bài viết của bạn bị index chậm, rất có thể sẽ rơi vào tầm ngắm của các website chuyên copy nội dung, biến phiên bản copy của họ trở thành bài viết chính chủ, còn bạn – người sản xuất nội dung chính thức lại biến thành bản copy. Thật là nguy hại với những người làm nội dung chất lượng!
Quá trình index website Google
Bản chất cơ chế index dữ liệu của Google là quá trình hoạt động của các con bọ tìm kiếm. Bước đầu tiên: Thông tin trên website sẽ được các bot tìm kiếm, thu thập và lưu trữ trên cơ sở dữ liệu của Google. Sau đó Google sẽ tiến hành kiểm tra chất lượng, đánh giá và so sánh nội dung giữa các website – lập chỉ mục cho các web. Bước cuối cùng là kết quả mà chúng ta nhìn thấy khi tìm kiếm từ khóa liên quan trên Google. Khi chất lượng nội dung càng hữu ích, thứ hạng website trên kết quả tìm kiếm càng cao và ngược lại.
Tốc độ index website Google
Các website mới thường sẽ có thời gian index lâu hơn. Ngoài ra thời gian để Google index các bài viết mới của website cũng phụ thuộc vào tốc độ load trang, uy tín của website, chất lượng nội dung các bài viết trước đó, chất lượng của hosting…
Ví dụ đơn giản như 1 website có tốc độ load không ổn định, ảnh hưởng đến việc thu thập dữ liệu của các con bọ Google, bị gián đoạn giữa chừng thì chắc chắn rằng việc index sẽ diễn ra lâu hơn.
Một trang web đã có uy tín (ví dụ các trang báo lớn dantri.com.vn, vnexpress.vn…) thì thời gian index bài rất nhanh. Thậm chí thi thoảng họ đi copy bài, dẫn nguồn ở nơi khác về nhưng Google vẫn cho index. Đó là quyền lợi của các “ông lớn” trong làng SEO rồi, nên nếu muốn đạt đến đẳng cấp đó thì chúng ta vẫn phải cặm cụi cố gắng để Google cho index những bài viết đầu tiên trước đã bạn nhé.
Google cũng thường xuyên thay đổi các thuật toán tìm kiếm và thay đổi dữ liệu. Vì vậy để đảm bảo cho thứ hạng của website trên thanh tìm kiếm, các Seoers cần hiểu được cơ chế Google index làm việc, những yếu tố ảnh hưởng đến tốc độ index và cập nhật liên tục những tin tức mới nhất từ Google.
Một điều thú vị là dường như các con bot Google cũng có “giờ nghỉ tạm” của nó, nên tốc độ index nhanh hay chậm còn phụ thuộc vào lúc bạn đăng bài, bot có đang làm việc hay không. Theo kinh nghiệm của các Seoers kỳ cựu thì khoảng thời gian từ 2h-5h chiều (giờ Việt Nam) thường bot lặn mất tăm. Post bài trong khoảng này thì cứ mặc định là sau 5h mới thấy. Bot tụ hội đông nhất vào khoảng 1-2h sáng, 4-5h sáng và 8h sáng. Nếu bài viết ok, web uy tín thì post bài trong những “giờ hoàng đạo” đó đảm bảo được index rất nhanh.
Cách kiểm tra index của website
Một website mới được thành lập cũng như một đứa bé mới được sinh ra, bạn phải đi làm “giấy khai sinh” cho nó ở đơn vị chịu trách nhiệm trực tiếp là Google. Bạn phải thông báo đầy đủ các thông tin “tên, tuổi, thành phần…” để Google lưu lại trong cơ sở dữ liệu. Hệ thống thông tin đó được gọi là Sitemap – bao gồm các đường dẫn liên kết, bài viết trên website.
Sau một thời gian xét duyệt, nếu không vi phạm các chính sách và thuật toán của Google, website của bạn sẽ được index.
Cú pháp kiểm tra index website
Để kiểm tra xem website của bạn đã được index hay chưa, bạn có thể thực hiện các thao tác sau:
- Mở trang tìm kiếm Google.com.vn
- Gõ cụm từ: “site:Domain”
- Dữ liệu trả về là tổng số kết quả trên website đã được index
Như vậy website khanhduc.net đã có 36.600 liên kết đã được index.
Kiểm tra thời gian index Google
Để kiểm tra xem bot Google vào lúc nào, vào liên kết nào trên website, bạn có thể check plugin Crawl Rate Tracker nếu dùng WordPress.
Còn nếu không dùng WordPress thì vào tạm Google Webmaster Tools để kiểm tra vậy, công cụ này không được cụ thể như plugin bên WordPress nhưng bạn vẫn có thể theo dõi xem có bao nhiêu bot vào website của mình trong thời gian nào.
Cách giúp index website Google nhanh chóng
Sử dụng Google WebmasterTool
Thay vì chờ đợi bot tìm đến thì hãy chủ động khai báo sơ đồ trang trên Google Webmaster Tool để rút ngắn thời gian index, sớm đưa website lên top. Một mẹo nhỏ là bạn có thể submit liên tục 3 lần để “thúc giục” Google index liên kết nhanh chóng.
Vì Google sẽ giới hạn số lần submit với 1 địa chỉ mail nhất định, nên nếu mỗi ngày bạn có rất nhiều liên kết cần index thì hãy chuẩn bị sẵn sàng một danh sách email để tiện cho việc khai báo index nhé.
Đặt link website trên các trang uy tín
Đây là cách khá hiệu quả để Google index website nhanh chóng. Vì tốc độ index cũng phụ thuộc vào chất lượng nội dung và uy tín của website, nên khi liên kết của bạn xuất hiện trên những trang có độ trust cao thì Google sẽ “tin tưởng” bạn hơn, rút ngắn thời gian index. Tuy nhiên hãy lưu ý để liên kết đến những nơi có nội dung liên quan đến website của bạn và có uy tín, tương tác tốt bạn nhé, chứ “đặt bừa” vào các trang không liên quan, kém chất lượng có khi còn kéo tụt hạng website của bạn xuống đó.
Chia sẻ mạng xã hội
Hãy thu hút sự chú ý của các con bot Google bằng các gia tăng độ phủ sóng của website trên mạng xã hội bằng các nút chia sẻ. Thử nghĩ mà xem, lên Google Plus bot “tình cờ” gặp bạn, ra Instagram cũng thấy bạn xuất hiện ở đó, vào Facebook đã thấy bạn rồi… Tần suất gặp càng nhiều, Google chắc chắn sẽ phải ấn tượng với bạn hơn thôi, và lúc đó các liên kết của bạn sẽ được “ưu ái” để index trước.
Cải thiện tốc độ load của website
Các con bot Google sẽ chỉ dừng lại ở website trong một khoảng thời gian nhất định, vì vậy nếu website của bạn có tốc độ load “rùa bò” thì bot sẽ mất kiên nhẫn và rời khỏi, khi đó Google không index website của bạn. Hãy quan tâm đến việc tối ưu tốc độ load của website nếu bạn muốn index website Google nhanh hơn.
Bộ code website chuẩn SEO
Trước khi index hãy kiểm tra thật kỹ xem bộ code của bạn đã chuẩn SEO hay chưa, có chứa mã độc hay các thành phần khả nghi nào hay không. Nếu bạn không có chuyên môn về mảng này thì hãy nhờ những coder chuyên nghiệp kiểm tra giùm nhé.
Một bộ code “sạch”, chuẩn SEO sẽ giúp thời gian index website của bạn nhanh hơn.
Cập nhật nội dung chất, mới và thường xuyên
Chất lượng nội dung là yếu tố mà Google quan tâm hàng đầu. Bạn có đạt điểm tối đa các tiêu chí về kỹ thuật SEO nhưng nội dung trùng lặp, chỉ là những thứ xào đi nấu lại từ những website khác thì hãy cẩn thận kẻo bị Google cho vào “sổ đen” đó. Tập trung xây dựng nội dung hữu ích với người dùng, tham khảo từ các bên khác nhưng phải “sáng tạo” nó thành của mình, đừng dại bê nguyên về để rồi dính chưởng phạt từ Google nhé.
Bên cạnh tiêu chí chất lượng thì tần suất đăng nội dung cũng ảnh hưởng đến tốc độ index website Google của bạn. Nếu bạn cập nhật bài viết đều đặn mỗi ngày hoặc vào những thời điểm cố định trong tuần, con bot Google sẽ có “thói quen” ghé qua website của bạn để xem nội dung mới, vì vậy tốc độ index nhanh hơn. Ngược lại, có những ngày bạn đăng hàng trăm bài khí bot ngợp, nhưng sau đó có khi vài tháng bạn chẳng đăng bài nào, Google cũng quên mất bạn là ai luôn, quá trình index phải lặp lại từ đầu, thời gian chậm hơn là đúng rồi.
Bên cạnh đó, còn một số phương án bạn có thể tham khảo thêm:
- Thiết lập RSS với FeedBurner: đây là công cụ quản lý RSS chính của Google, tất cả những gì bạn cần làm là đăng nhập bằng tài khoản Google, submit phần feed website của bạn với Feedburner bằng cách copy URL của website, blog hoặc đường dẫn RSS vào phần Burn a feed.
- Submit đến Blog Directories: TopRank có 1 số lượng danh sách website khổng lồ mà bạn hoàn toàn có thể dùng để submit RSS feed và blog đến đó. Bên cạnh đó là Technorati hoặc Alltop.
Nhìn chung việc index website Google không phải quá khó, chỉ cần bạn hiểu rõ bản chất và làm theo các nguyên tắc “ưa thích” của Google thì chắc chắn bài viết sẽ được index nhanh chóng. Hy vọng qua bài viết này, bạn đã có thêm những kiến thức tổng quan về index website. Chúc bạn thành công!