Những Nhà Lưu Trữ Số đang Cố Gắng Bảo Vệ Dữ Liệu Công Cộng Khỏi Sự Biến Mất

Image by Bernard Goldbach, from Flickr

Những Nhà Lưu Trữ Số đang Cố Gắng Bảo Vệ Dữ Liệu Công Cộng Khỏi Sự Biến Mất

Thời gian đọc: 3 phút

Trong hơn 30 năm qua, Wayback Machine của Internet Archive đã bảo tồn các trang web chính phủ và các bộ dữ liệu quan trọng cho nghiên cứu, như được chi tiết trong một báo cáo mới của Spectrum.

Bạn đang vội? Dưới đây là những thông tin nhanh:

  • Máy Thời Gian Wayback duy trì dữ liệu chính phủ quan trọng phục vụ như tư liệu thiết yếu cho nghiên cứu khoa học và kỹ thuật.
  • Trong nhiệm kỳ tổng thống thứ hai của Trump, hơn 8,000 trang web và cơ sở dữ liệu của chính phủ đã biến mất khỏi quyền truy cập công chúng.
  • Phòng Thí Nghiệm Đổi Mới Thư Viện tại Đại học Harvard đã thành công trong việc bảo tồn 311,000 bộ dữ liệu, là một phần của bộ sưu tập Data.gov.

Những hồ sơ này, từ các cơ quan như NASA và Quỹ Khoa học Quốc gia, cung cấp dữ liệu thiết yếu cho các nhà khoa học và kỹ sư. Nếu chúng biến mất, tính hợp lệ của nghiên cứu và độ chính xác lịch sử đều có nguy cơ bị ảnh hưởng, như đã được Spectrum ghi nhận.

Việc chính phủ loại bỏ dữ liệu không phải là một hiện tượng mới. Sau 9/11, chính quyền Bush đã xóa hàng triệu byte thông tin vì lý do an ninh. Chính quyền Obama lại có cách tiếp cận khác, khởi xướng Data.gov vào năm 2009 để mở rộng quyền truy cập công khai, theo như được báo cáo bởi Spectrum.

Trong nhiệm kỳ đầu tiên của Trump, các nhà nghiên cứu tại Sáng kiến Quản lý và Bảo vệ Dữ liệu Môi trường phát hiện một số trang web của chính phủ không thể truy cập, và các từ ngữ liên quan đến “biến đổi khí hậu” đã bị xóa khỏi nhiều trang, Spectrum cho biết.

Trong nhiệm kỳ thứ hai của Trump, những mối lo ngại về việc bảo tồn dữ liệu đã tăng lên. Vào tháng 2, The New York Times đã đưa tin rằng hơn 8,000 trang web và cơ sở dữ liệu của chính phủ đã bị gỡ bỏ.

Một số đã xuất hiện trở lại, nhưng Grist đã phát hiện ra những thay đổi, bao gồm việc loại bỏ các thuật ngữ như “biến đổi khí hậu” và “năng lượng sạch.” Vào ngày 11 tháng 2, các thách thức pháp lý tiếp theo, một thẩm phán liên bang đã ra lệnh khôi phục một số cơ sở dữ liệu của CDC và FDA, như được báo cáo bởi Spectrum.

Để chống lại sự mất mát này, các nhà lưu trữ số đã hành động. Phòng Thí Nghiệm Đổi Mới Thư Viện tại Trường Luật Harvard đã sao chép toàn bộ kho lưu trữ 16 terabyte của Data.gov – chứa hơn 311,000 bộ dữ liệu. Họ sử dụng các truy vấn tự động thông qua các API để cập nhật hàng ngày.

Các nhà lưu trữ đóng một vai trò quan trọng trong việc bảo vệ tri thức bằng cách duy trì những hồ sơ lịch sử cho các thế hệ tương lai. Sự mất mát thông tin quan trọng do vắng mặt của họ sẽ dẫn đến việc viết lại hồ sơ công khai, điều này sẽ hạn chế khả năng nghiên cứu trong tương lai.

Bạn có thích bài viết này không?
Hãy để lại đánh giá nhé!
Tôi không thích Tôi thực sự rất thích Cũng ổn đấy Khá tốt! Thích lắm!

Chúng tôi rất vui khi bạn thích sản phẩm của chúng tôi!

Với tư cách là một độc giả quý giá, bạn có thể vui lòng đánh giá về chúng tôi trên Trustpilot không? Việc này rất nhanh và có ý nghĩa vô cùng to lớn đối với chúng tôi. Xin cảm ơn vì bạn thật tuyệt vời!

Đánh giá chúng tôi trên Trustpilot
0 Được bình chọn bởi 0 người dùng
Tiêu đề
Bình luận
Cảm ơn bạn đã phản hồi
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Để lại bình luận

Loader
Loader Hiển thị thêm...