Cached Page là gì?

Cached Page là gì?

Cached Page là một bản sao của một trang web được lưu trữ trong bộ nhớ tạm thời được gọi là “bộ nhớ cache”.

Mục đích của việc lưu trữ (lưu trữ và truy cập dữ liệu từ bộ nhớ cache) là để lưu trữ các tệp tin nhằm cải thiện hiệu suất truy xuất dữ liệu. Nói một cách ngắn gọn, việc lưu trữ đảm bảo rằng các yêu cầu trong tương lai cho cùng một dữ liệu sẽ được phục vụ nhanh hơn.

Cần lưu ý rằng có nhiều loại bộ nhớ cache – hai loại chính là lưu trữ bộ nhớ cache của máy chủ và trình duyệt.

Ở phía người dùng, trình duyệt sẽ lưu trữ một trang web để đảm bảo nó có thể hiển thị một trang web nhanh hơn mà không cần tải lại nội dung từ máy chủ mỗi khi người dùng truy cập lại trang web hoặc tài nguyên cụ thể.

Sau đó, có một khái niệm gọi là bộ nhớ cache của máy chủ. Các mạng phân phối nội dung (CDN) sẽ lưu trữ nội dung web (hình ảnh, video và trang web) trong các “máy chủ proxy” được đặt gần người dùng cuối hơn so với các máy chủ trang web.

Ngoài ra, các công cụ tìm kiếm như Google cũng có thể lưu trữ các trang web:

Các trình thu thập web của Google thường xuyên quét web và chỉ mục các trang web mới. Trong quá trình thu thập web, công cụ tìm kiếm cũng tạo bản sao lưu của các trang web để vẫn có thể hiển thị chúng cho người dùng khi được yêu cầu – ngay cả khi trang web thực tế không khả dụng.

page-caching-1

Tại sao các trang Cached Page quan trọng?

Trong trình duyệt web

Khi người dùng tải một trang web cụ thể, trình duyệt của họ phải tải xuống khá nhiều dữ liệu để có thể hiển thị trang web một cách chính xác. Tuy nhiên, khi kích hoạt việc lưu trữ, máy chủ sẽ lưu trữ các tệp HTML, JavaScript và hình ảnh – nói cách khác, là một bản sao của nội dung trang web đó – trên ổ cứng của người dùng.

Xem thêm:  Deep Web là gì? Những rủi ro tiềm ẩn khi khám phá Deep Web

Như vậy, khi người dùng tải cùng một trang web, không cần thiết phải tải xuống lại tài liệu web; tệp HTML đã được chuẩn bị và sẵn sàng được gửi đến trình duyệt. Điều này có thể rút ngắn thời gian tải và giảm việc sử dụng băng thông và tải của máy chủ.

Nói cách khác, việc lưu trữ cho phép trình duyệt hiển thị trang web nhanh hơn.

Trong mạng phân phối nội dung (CDN)

Một mạng phân phối nội dung (CDN) – ví dụ như CloudFlare – sẽ lưu trữ các bản sao của trang web trên nhiều máy chủ khác nhau (còn được gọi là “máy chủ proxy”) được đặt trên toàn cầu. Như vậy, CDN có thể cung cấp nội dung được yêu cầu cho người dùng từ máy chủ proxy gần nhất, làm tăng tốc độ quá trình.

Dưới đây là một ví dụ:

Giả sử bạn đang ở Pháp và truy cập vào một trang web mà máy chủ của nó đặt tại Úc. Tải một trang từ một máy chủ ở Pháp sẽ nhanh hơn so với gửi yêu cầu đến máy chủ ở Úc – đó chính là lúc mà việc lưu trữ có tác dụng.

Nếu CDN có một bản sao (hoặc trang Cached Page) của trang web mà bạn yêu cầu trên máy chủ proxy ở Pháp, thì bản sao đó sẽ được sử dụng để xử lý yêu cầu của người dùng và tải trang web.

page-caching-2

Trong các công cụ tìm kiếm

Khi Google xử lý trang web mà nó vừa thu thập, nó tạo ra một “ảnh chụp màn hình” để làm bản sao lưu của trang web cụ thể đó. Như vậy, người dùng vẫn có thể truy cập trang Cached Page trong trường hợp trang web thực tế mà họ đang cố truy cập tạm thời không khả dụng hoặc chậm chạp.

Những trang này là một phần của bộ nhớ cache của Google, có nghĩa là bạn có thể xem phiên bản Cached Page của một trang trực tiếp từ kết quả tìm kiếm.

Xem thêm:  Sitewide Link là gì? Tác động của Sitewide Link đến SEO

Nhấp vào ba chấm (hoặc mũi tên xuống) bên cạnh URL của trang web trong kết quả tìm ki

ếm và chọn nút “Cached” trong cửa sổ pop-up “Về kết quả này”, như hình dưới đây:

Cached search results on Google

Nếu bạn không muốn Google hiển thị phiên bản Cached Page của các trang web của bạn trong kết quả tìm kiếm, bạn có thể sử dụng các thẻ meta Robots – và cụ thể là thẻ Noarchive – để ngăn công cụ tìm kiếm lưu trữ nội dung của bạn.

Bạn có thể sử dụng đoạn mã sau để thêm thẻ Noarchive vào trang web của bạn:

<Meta name=”Robots” Content=”Noarchive”>

Tuy nhiên, nếu bạn đang nhắm mục tiêu vào trình thu thập web của Google, hãy sử dụng phương pháp này:

<Meta Name=”GoogleBot” Content=”Noarchive”>

Tóm lại, Cached Page là một bản sao của trang web được lưu trữ trong bộ nhớ cache, giúp cải thiện hiệu suất truy xuất dữ liệu. Trình duyệt và mạng phân phối nội dung (CDN) lưu trữ Cached Page để tăng tốc độ hiển thị trang web và giảm tải cho máy chủ. Các công cụ tìm kiếm cũng lưu trữ Cached Page để người dùng có thể truy cập vào phiên bản sao lưu của trang web khi trang web thực tế không khả dụng. Cached Page đóng vai trò quan trọng trong việc cải thiện trải nghiệm người dùng và tăng tốc độ truy cập trang web.

avata-web

Tốt nghiệp CNTT và bắt đầu công việc Thiết kế web, SEO, Adwords,… từ 2008, với hơn 15 năm kinh nghiệm của mình, tôi thành lập BALICO với mục tiêu mang đến những giải pháp chuyển đổi số trong kinh doanh dành cho doanh nghiệp vừa và nhỏ (SME), nâng cao năng lực cạnh tranh, đồng hành cùng khách hàng tự tin bước vào kỷ nguyên công nghệ 4.0

Kết nối với tôi:  Facebook | Tiktok | Twitter | Linkedin | Youtube | Blog

Hotline
Telegram
Messenger
Chỉ đường