QUY TRÌNH
số hóa tài liệu lưu trữ giấy
(Theo Luật Lưu trữ 2024 và Thông tư 05/2025/TT-BNV)
(Theo Luật Lưu trữ 2024 và Thông tư 05/2025/TT-BNV)
Bước đi tất yếu trong thời đại số
Số hóa tài liệu lưu trữ giấy là bước quan trọng trong việc bảo tồn, khai thác và chia sẻ thông tin. Quy trình này đòi hỏi sự phối hợp chặt chẽ giữa các khâu khảo sát, làm sạch, số hóa, kiểm tra và bàn giao. Bài báo trình bày chi tiết các bước triển khai, đảm bảo chất lượng sản phẩm và tính toàn vẹn của tư liệu gốc.
a) Khảo sát, thống kê và lập kế hoạch
Mục đích: Xác định phạm vi, khối lượng, tình trạng tài liệu để lập kế hoạch và triển khai phương án số hóa phù hợp.
Căn cứ pháp lý: Điều 27, 28 Luật Lưu trữ 33/2024/QH15; Điều 9 Chương II Thông tư 05/2025/TT-BNV.
NGHIỆP VỤ:
1. Khảo sát tình trạng kho lưu trữ:
Kiểm kê toàn bộ số lượng tài liệu (ví dụ: 50.000 hồ sơ giấy, 200 cuộn phim, 300 băng ghi âm).
Đánh giá loại hình tài liệu (giấy A4, sổ tay, bản đồ khổ lớn, băng cassette…).
Phân tích giá trị:
Hồ sơ hành chính thường.
Hồ sơ nhân sự.
Hồ sơ có giá trị lịch sử (ví dụ: biên bản họp UBND tỉnh năm 1945).
Xác định mức độ hư hỏng (ẩm mốc, rách, phai mực).
Ví dụ: Khảo sát kho lưu trữ UBND tỉnh Y cho thấy: tổng cộng 1.500 hộp tài liệu; trong đó 300 hộp bị ẩm mốc cần xử lý bảo quản trước khi đưa vào số hóa.
2. Lập kế hoạch chi tiết:
Mục tiêu: số hóa toàn bộ tài liệu từ 1945–1975 để phục vụ nghiên cứu.
Tiến độ: 2 năm, chia thành 4 đợt.
Nhân lực: 10 cán bộ, trong đó 4 cán bộ quét tài liệu, 3 cán bộ nhập dữ liệu, 3 cán bộ kiểm tra.
Công nghệ: máy quét A3, máy ảnh DSLR, phần mềm OCR, phần mềm quản lý dữ liệu số.
Kinh phí và vật tư: Dự toán chi tiết chi phí thiết bị, phần mềm, vật tư bảo quản và chi phí vận hành.
3. Đánh giá hiện trạng vật lý tài liệu
Phân loại tài liệu theo tình trạng: tốt, hư hỏng nhẹ, hư hỏng nặng.
Hồ sơ hư hỏng nặng (ẩm, mốc, giòn vụn) phải xử lý tu bổ, khử trùng trước khi số hóa.
Tài liệu đặc thù (bản đồ, bản vẽ kỹ thuật) phải xác định phương pháp số hóa chuyên dụng.
4. Xây dựng kế hoạch số hóa:
Nội dung kế hoạch phải bao gồm:
Phạm vi và khối lượng số hóa.
Tiến độ và các giai đoạn triển khai.
Nhân lực, kinh phí, phương tiện kỹ thuật.
Phương án xử lý dữ liệu chủ (metadata).
Giải pháp bảo mật và sao lưu dữ liệu số.
5. Trình lãnh đạo cơ quan phê duyệt kế hoạch.
Kế hoạch số hóa phải được lãnh đạo cơ quan phê duyệt trước khi triển khai.
Việc giao nhận tài liệu từ kho sang bộ phận số hóa phải:
Có biên bản bàn giao.
Kiểm đếm chính xác số hộp, hồ sơ, tờ tài liệu.
Chụp ảnh hiện trạng tài liệu (nếu cần).
Vận chuyển bằng phương tiện chuyên dụng, bảo đảm:
An toàn, không làm xáo trộn thứ tự lưu trữ.
Đáp ứng yêu cầu phòng cháy chữa cháy (PCCC).
Ví dụ: Cơ quan X có 10 phông tài liệu, tổng cộng 1.500 hộp. Kế hoạch chia làm 2 giai đoạn: giai đoạn 1 số hóa 750 hộp (ưu tiên hồ sơ hành chính, nhân sự); giai đoạn 2 số hóa 750 hộp còn lại (tài liệu lịch sử).
Khi lấy tài liệu từ giá xuống phải giữ nguyên trật tự sắp xếp, tránh lẫn lộn.
Tài liệu được chuyển đến khu vực bàn giao để đối chiếu, kiểm đếm.
Sau khi kiểm đếm và bàn giao, tài liệu mới được chuyển đến bộ phận số hóa.
Việc giao nhận tài liệu cho bộ phận số hóa phải có biên bản, kiểm đếm hộp, hồ sơ, tờ tài liệu và chụp ảnh hiện trạng nếu cần. Phương tiện vận chuyển đảm bảo an toàn, không làm xáo trộn thứ tự lưu trữ và đáp ứng yêu cầu phòng cháy chữa cháy.
Ví dụ: Cơ quan X có 10 phông tài liệu, 1.500 hộp. Khảo sát cho thấy 300 hộp cần xử lý chống ẩm trước khi số hóa. Kế hoạch chia làm 2 giai đoạn (mỗi giai đoạn 750 hộp).
b) Lấy tài liệu từ giá và chuyển đến nơi bàn giao
Nguyên tắc:
Giữ nguyên trật tự sắp xếp ban đầu trên giá để tránh thất lạc, sai lệch.
Không tự ý tách tài liệu ra khỏi hộp, cặp.
Phương tiện:
Sử dụng xe đẩy chuyên dụng có bánh cao su, mặt phẳng rộng, có chặn chống rơi.
Tuyệt đối không bưng bê, xách tay từng tập tài liệu để tránh va đập, làm rơi rớt.
Khu vực bàn giao:
Phải bố trí đủ diện tích, bàn rộng, ánh sáng tốt.
Thuận tiện cho việc kiểm đếm, đối chiếu trước khi bàn giao.
Ví dụ: Tài liệu của phòng A có 20 hộp, được đưa xuống bằng xe đẩy chuyên dụng. Tại khu bàn giao, cán bộ lưu trữ xếp theo thứ tự số hộp từ 01 đến 20 để thuận tiện kiểm tra.
c) Giao tài liệu cho bộ phận số hóa
Kiểm đếm:
Ghi rõ số lượng từng hộp, hồ sơ, tờ tài liệu.
Kiểm tra tình trạng vật lý:
Đối chiếu từng tập, kiểm tra hiện trạng (rách, ẩm mốc, giòn vụn).
Lập biên bản bàn giao:
Biên bản phải có chữ ký của bên giao và bên nhận.
Kèm danh sách tài liệu bàn giao.
Trường hợp cần thiết, chụp ảnh hiện trạng để lưu làm căn cứ khi nhận lại.
Ví dụ: Khi bàn giao 5 hộp tài liệu (hồ sơ nhân sự), phát hiện hộp số 3 có 2 hồ sơ bị ẩm mốc nhẹ, đã ghi chú tình trạng này vào biên bản bàn giao.
d) Vận chuyển tài liệu đến nơi số hóa
Yêu cầu an toàn:
Sử dụng phương tiện vận chuyển chuyên dụng, có che chắn, chống ẩm, chống bụi.
Trang bị phương tiện phòng cháy chữa cháy đi kèm (bình CO₂ nhỏ, túi chống cháy).
Nguyên tắc:
Đảm bảo không xáo trộn trật tự tài liệu.
Không để lẫn với tài liệu khác ngoài danh mục bàn giao.
Trường hợp vận chuyển ra ngoài cơ quan:
Hồ sơ phải được niêm phong.
Có cán bộ đi kèm giám sát toàn bộ quá trình vận chuyển.
Ví dụ: UBND tỉnh B thuê đơn vị chuyên nghiệp số hóa ngoài cơ quan. Toàn bộ 50 hộp tài liệu được niêm phong bằng dây đai và dán nhãn bảo mật. Một cán bộ lưu trữ đi cùng để giám sát từ khâu vận chuyển đến khi tài liệu được giao tại địa điểm số hóa.
👉 Như vậy, các bước lấy – giao – vận chuyển tài liệu là mắt xích quan trọng, đảm bảo tính an toàn, nguyên vẹn, đúng trật tự của hồ sơ trước khi bước vào khâu số hóa.
Mục đích
Đảm bảo dữ liệu tài liệu lưu trữ số hóa có định dạng thống nhất, dễ quản lý và khai thác lâu dài.
Tránh tình trạng mỗi đơn vị lưu trữ một kiểu file, một kiểu metadata, gây khó khăn trong tích hợp hệ thống.
Căn cứ pháp lý
Điều 25, 26 Luật Lưu trữ 33/2024/QH15.
Điều 9 và Điều 10 Thông tư 05/2025/TT-BNV (chuẩn hóa định dạng file, dữ liệu chủ, cấu trúc dữ liệu).
NGHIỆP VỤ:
a) Xây dựng tài liệu hướng dẫn chuẩn hóa và chuyển đổi dữ liệu
Cơ quan cần ban hành “Quy định kỹ thuật chuẩn hóa dữ liệu số hóa” áp dụng nội bộ.
Tài liệu này phải quy định rõ:
Định dạng tệp tin (master, khai thác).
Tiêu chuẩn metadata (dữ liệu mô tả tài liệu).
Mã ký tự, chuẩn Unicode (TCVN 6909:2001).
Quy tắc đặt tên file và thư mục.
Cấu trúc dữ liệu chủ (XML/JSON/CSV).
Ví dụ: file master quét ở định dạng TIFF không nén; file khai thác định dạng PDF/A-1b; metadata quản lý bằng XML chuẩn Dublin Core.
b) Thực hiện chuẩn hóa và chuyển đổi dữ liệu
1. Chuẩn hóa định dạng tệp tin
Master file: TIFF (không nén, 300–600 dpi).
File khai thác: PDF/A-1b, JPEG (tùy nhu cầu).
Âm thanh (nếu có): WAV (không nén).
Video (nếu có): MP4 (H.264).
2. Chuẩn hóa định dạng dữ liệu chủ (metadata)
Metadata tối thiểu gồm:
Mã phông lưu trữ.
Số hộp, số hồ sơ.
Tiêu đề hồ sơ.
Thời gian (ngày, tháng, năm).
Số tờ.
Ghi chú tình trạng.
Các dữ liệu này phải thống nhất theo một bảng chuẩn (ISO 15489, Dublin Core hoặc chuẩn quốc gia).
3. Chuyển đổi mã ký tự
Tất cả dữ liệu chữ số phải chuẩn hóa về Unicode UTF-8.
Tránh các lỗi hiển thị do mã cũ (TCVN3, VNI).
4. Chuyển đổi cấu trúc dữ liệu chủ
Nếu metadata ban đầu ở dạng Excel hoặc Access → chuyển đổi sang XML/JSON để tích hợp hệ thống.
Cấu trúc metadata phải có khả năng nhập vào phần mềm lưu trữ điện tử.
5. Đóng gói tài liệu số hóa
Mỗi phông → thư mục riêng.
Trong thư mục: chia theo hộp, hồ sơ.
Cấu trúc thư mục phải khớp với metadata.
c) Thực hiện sửa lỗi theo báo cáo kiểm tra
Sau khi chuẩn hóa xong, tiến hành kiểm tra:
Có file bị lỗi không mở được không?
Metadata có bị sai chính tả, sai mã ký tự không?
Các file ảnh có đúng định dạng, đúng độ phân giải không?
Lập báo cáo lỗi và tiến hành sửa ngay trước khi bàn giao.
d) Bàn giao dữ liệu chủ cho bộ phận số hóa
Sau khi chuẩn hóa, dữ liệu chủ (metadata) được bàn giao lại cho đơn vị thực hiện số hóa.
Bàn giao phải kèm biên bản ghi rõ: số lượng bản ghi metadata, định dạng file, cấu trúc dữ liệu.
Bộ phận số hóa sẽ sử dụng metadata này để gắn vào từng tài liệu đã quét.
✅ Kết quả đầu ra:
Tài liệu số hóa đã chuẩn hóa định dạng file.
Metadata (dữ liệu chủ) thống nhất, đúng chuẩn.
Dữ liệu đã sẵn sàng để tích hợp vào hệ thống lưu trữ điện tử.
Đối với tài liệu đã có dữ liệu chủ (metadata), cần đồng bộ hóa trước khi số hóa nhằm đảm bảo tính nhất quán và dễ khai thác.
Xây dựng tài liệu hướng dẫn chuẩn hóa định dạng tệp và dữ liệu chủ
Thực hiện chuẩn hóa mã ký tự, cấu trúc dữ liệu, đóng gói tài liệu số hóa
Sửa lỗi theo báo cáo kiểm tra và bàn giao metadata cho bộ phận số hóa
Giai đoạn chính của quy trình, trong đó cần tuân thủ thông số kỹ thuật và quy cách đặt tên tệp.
a) Bóc tách, làm phẳng tài liệu
Mục đích: chuẩn bị tài liệu ở trạng thái tốt nhất để đưa vào máy quét/chụp.
Thao tác:
Tháo bỏ ghim sắt, kẹp giấy, bìa nhựa không đạt chuẩn (dễ phản sáng, dễ làm hỏng máy).
Làm phẳng giấy gấp, giấy nhàu bằng dụng cụ ép phẳng chuyên dụng hoặc dùng nẹp ép.
Đối với tài liệu giòn, rách: đặt vào túi nhựa trong suốt (PET/Melinex) và quét trực tiếp.
Lưu ý: Không dùng bàn là, hơi nước hay hóa chất để làm phẳng giấy.
b) Kiểm tra đối chiếu tài liệu với danh mục, dữ liệu chủ
Đối chiếu giữa hồ sơ thực tế và danh mục đã lập trước khi số hóa.
Đảm bảo không bị thiếu hồ sơ, không bị đảo lộn trật tự.
Nếu có metadata (dữ liệu chủ) đã chuẩn hóa ở Bước 3 → đối chiếu để gắn chính xác.
c) Thực hiện số hóa (quét/chụp)
Thiết bị
Máy quét phẳng (Flatbed scanner) → dùng cho giấy rời, khổ A4–A3.
Máy quét nạp tay (ADF scanner) → dùng cho tài liệu khối lượng lớn, không quá giòn.
Máy chụp ảnh chuyên dụng (Book Scanner, Planetary Scanner) → dùng cho sổ sách, tài liệu khổ lớn.
Thông số kỹ thuật đầu ra (tham chiếu Thông tư 05/2025/TT-BNV và chuẩn quốc tế ISO 19264-1:2017):
Độ phân giải:
300 dpi (tài liệu hành chính thông thường).
400–600 dpi (bản đồ, bản vẽ, tài liệu quý hiếm).
Định dạng file:
Master: TIFF không nén.
Khai thác: PDF/A-1b (ưu tiên), JPEG.
Màu sắc:
Đen trắng: 1 bit (Binary).
Thang xám: 8 bit (Grayscale).
Màu: 24 bit (True Color).
Chế độ nén:
Không nén (master).
JPEG 80–90% (bản khai thác).
Kiểm tra chất lượng ảnh
Sau khi quét/chụp, phải so sánh với bản gốc để đảm bảo:
Đầy đủ trang, không mất góc.
Chữ rõ ràng, không nhòe, không lệch.
Màu sắc trung thực.
Nếu không đạt → hiệu chỉnh cấu hình và quét lại.
d) Tạo lập dữ liệu chủ (nếu chưa có)
Metadata phải tối thiểu có: mã phông, số hộp, số hồ sơ, tiêu đề, ngày tháng, số tờ.
Các trường dữ liệu khác có thể mở rộng: tác giả, nơi ban hành, tình trạng vật lý.
Lưu metadata ở định dạng XML hoặc JSON để dễ tích hợp vào hệ thống.
đ) Kết nối dữ liệu chủ với tài liệu số hóa
Mỗi file số hóa phải được gắn metadata tương ứng.
Phần mềm quản lý lưu trữ phải cho phép tra cứu tài liệu theo metadata.
Kiểm tra sự khớp nối bằng cách: nhập mã hồ sơ → hệ thống hiển thị đúng file scan.
e) Trả tài liệu gốc về kho sau khi số hóa
Kiểm đếm lại số lượng hồ sơ, tài liệu.
Kiểm tra tình trạng vật lý (đảm bảo không hư hỏng thêm sau khi số hóa).
Lập biên bản bàn giao trả: ghi số lượng, tình trạng, ngày trả.
Lưu hồ sơ bàn giao kèm hình ảnh minh chứng (nếu có).
g) Vận chuyển và sắp xếp lại lên giá
Sử dụng xe đẩy chuyên dụng, hộp lưu trữ đạt chuẩn.
Sắp xếp tài liệu về đúng vị trí ban đầu trong kho.
Cập nhật nhật ký kho: ngày nhập lại, tình trạng, số lượng.
✅ Kết quả đầu ra:
Tài liệu được số hóa thành file chuẩn (master + khai thác).
Metadata được gắn khớp với từng tài liệu.
Hồ sơ gốc được trả lại kho trong tình trạng nguyên vẹn.
Mục đích
Đảm bảo file số hóa và metadata đạt chuẩn kỹ thuật, đúng nội dung, không thiếu sót.
Loại bỏ lỗi phát sinh trong quá trình quét/chụp và nhập dữ liệu.
Tạo cơ sở cho nghiệm thu, bàn giao sau này.
Căn cứ pháp lý
Điều 11 Thông tư 05/2025/TT-BNV (quy định kiểm tra chất lượng số hóa).
TCVN 9250:2012 (nguyên tắc bảo đảm chất lượng lưu trữ).
a) Xây dựng tài liệu hướng dẫn kiểm tra sản phẩm
Trước khi kiểm tra, cơ quan phải ban hành “Hướng dẫn kiểm tra sản phẩm số hóa”, trong đó nêu rõ:
+ Nhóm lỗi ảnh quét (Image Errors):
Mờ, nhòe, mất nét.
Lệch trang, mất góc, mất chi tiết.
Màu sắc sai lệch (ngả vàng, quá sáng/tối).
File bị thiếu trang hoặc trùng trang.
Định dạng, độ phân giải sai so với chuẩn.
+ Nhóm lỗi biên mục (Metadata Errors):
Sai số hộp, số hồ sơ, số tờ.
Sai chính tả trong tiêu đề, cơ quan ban hành.
Không đồng nhất định dạng ngày tháng.
Thiếu trường dữ liệu chủ (ví dụ: bỏ sót thời gian ban hành).
Lỗi mã ký tự (Unicode hiển thị sai).
+ Nguyên tắc kiểm tra:
Kiểm tra 100% đối với tài liệu quý hiếm, tài liệu vĩnh viễn.
Kiểm tra tối thiểu 10% mẫu đối với tài liệu hành chính số lượng lớn, kèm cơ chế lấy mẫu ngẫu nhiên.
Phải có checklist kiểm tra chuẩn, phát cho từng nhân sự.
+ Trách nhiệm:
Bộ phận kỹ thuật: kiểm tra lỗi ảnh.
Bộ phận nghiệp vụ lưu trữ: kiểm tra lỗi biên mục, metadata.
b) Thực hiện kiểm tra, báo cáo và sửa lỗi
Quy trình kiểm tra:
Mở file số hóa, đối chiếu trực tiếp với tài liệu gốc (hoặc metadata).
Đối chiếu số lượng trang/file với danh mục bàn giao.
So sánh thông tin metadata với thông tin trong hồ sơ gốc.
Ghi nhận lỗi phát hiện vào phiếu kiểm tra sản phẩm.
Lập báo cáo kiểm tra:
Báo cáo gồm: tỷ lệ lỗi, loại lỗi, mức độ ảnh hưởng.
Phân loại lỗi:
Lỗi nghiêm trọng (mất trang, sai metadata chính) → bắt buộc sửa ngay.
Lỗi nhẹ (chính tả metadata) → có thể sửa trực tiếp.
Sửa lỗi theo báo cáo:
Lỗi ảnh: quét lại trang sai.
Lỗi metadata: chỉnh sửa trong cơ sở dữ liệu.
Sau khi sửa → kiểm tra lại lần cuối để xác nhận đã khắc phục.
✅ Kết quả đầu ra:
Bộ hồ sơ số hóa không còn lỗi ảnh, lỗi metadata.
Có Báo cáo kiểm tra sản phẩm và phiếu sửa lỗi kèm theo.
Mục đích
Bảo đảm tài liệu lưu trữ số hóa có giá trị pháp lý tương đương bản gốc.
Xác minh tính xác thực (authenticity) và toàn vẹn (integrity) của tài liệu.
Là cơ sở pháp lý để cơ quan, tổ chức sử dụng, khai thác và chứng minh trong trường hợp cần thiết.
Căn cứ pháp lý
Điểm c khoản 1 và điểm a khoản 2 Điều 8, Thông tư 05/2025/TT-BNV: yêu cầu tài liệu số hóa phải được ký số theo chuẩn.
Luật Giao dịch điện tử 2023 (có hiệu lực 01/7/2024): chữ ký số hợp lệ có giá trị như chữ ký tay, con dấu.
Luật Lưu trữ 33/2024/QH15 (Điều 27): dữ liệu lưu trữ điện tử phải đảm bảo tính xác thực, toàn vẹn và khả năng truy cập.
+ Chuẩn bị ký số :
Lựa chọn chứng thư số hợp lệ (của tổ chức cung cấp dịch vụ chứng thực chữ ký số công cộng hoặc chuyên dùng của Chính phủ).
Xác định phạm vi: ký số từng tài liệu (file), ký số theo hồ sơ, hoặc ký số theo lô (batch signing).
Cài đặt phần mềm hỗ trợ ký số tích hợp với hệ thống quản lý tài liệu điện tử.
+ Thực hiện ký số:
Người có thẩm quyền (theo phân công của cơ quan) sử dụng khóa bí mật để ký số.
Chữ ký số phải gắn liền với file số hóa (PDF/A, TIFF).
Hệ thống tự động ghi nhận: tên đơn vị, mã định danh chữ ký, thời gian ký.
+ Kiểm tra tính hợp lệ chữ ký số :
Mở file đã ký trên phần mềm đọc tài liệu (Adobe Acrobat, phần mềm chuyên dụng).
Kiểm tra trạng thái chữ ký: valid – hợp lệ, chứng thư số còn hiệu lực, không bị thu hồi.
Nếu báo lỗi (invalid) → phải ký lại hoặc đổi chứng thư số.
+ Lưu trữ và ghi nhận nhật ký
Lập biên bản xác nhận số lượng tài liệu đã ký số.
Lưu log hệ thống: ngày, giờ, người ký, nội dung ký.
Sao lưu bản tài liệu đã ký số ra 2 thiết bị lưu trữ dự phòng.
Yêu cầu kỹ thuật
Chữ ký số phải sử dụng thuật toán SHA-256 hoặc cao hơn.
Định dạng file ký số: PKCS#7/CAdES đối với TIFF, PAdES đối với PDF/A.
Bản tài liệu sau khi ký không được phép chỉnh sửa; nếu cần thay đổi → phải ký lại.
✅ Kết quả đầu ra:
100% tài liệu số hóa có chữ ký số hợp lệ.
Có biên bản và nhật ký ký số để đối chiếu.
Mục đích
Tạo gói dữ liệu lưu trữ chuẩn (Archival Information Package – AIP) gồm:
Tài liệu lưu trữ số hóa (file master, file khai thác).
Dữ liệu chủ (metadata mô tả, kỹ thuật, quản lý).
Bảo đảm tài liệu số hóa và metadata đồng bộ, toàn vẹn, có thể tích hợp vào hệ thống quản lý lưu trữ điện tử.
Căn cứ pháp lý
Điều 12, Thông tư 05/2025/TT-BNV: quy định về đóng gói và chuyển dữ liệu số hóa.
Điều 27 Luật Lưu trữ 33/2024/QH15: yêu cầu lưu trữ điện tử phải đảm bảo tính xác thực, toàn vẹn và khả năng truy cập lâu dài.
Tiêu chuẩn METS (Metadata Encoding & Transmission Standard) và PREMIS (Preservation Metadata).
NGHIỆP VỤ:
+ Chuẩn bị dữ liệu
Gom nhóm file số hóa đã ký số theo từng phông, hộp, hồ sơ.
Chuẩn bị metadata (dữ liệu chủ) đã chuẩn hóa ở Bước 3 và Bước 4.
Tạo file checksum (SHA-256) cho từng file để phục vụ kiểm tra toàn vẹn.
+ Tổ chức cấu trúc gói dữ liệu
Mỗi phông tài liệu = 1 gói dữ liệu (AIP).
Trong mỗi gói: chia theo hộp, hồ sơ.
Cấu trúc thư mục ví dụ:
/Phông_A
/Hộp_001
/HS_01
001_master.tif
001_access.pdfa
metadata.xml
checksum.sha256
/HS_02
002_master.tif
002_access.pdfa
metadata.xml
/Hộp_002
...
+ Đóng gói
Sử dụng định dạng ZIP/AIP hoặc BagIt (chuẩn OAIS).
Đảm bảo file metadata (XML/JSON) đi kèm trong mỗi gói.
Gói dữ liệu có danh sách kiểm kê (manifest file).
+ Nhập vào hệ thống
Upload gói dữ liệu vào Hệ thống quản lý lưu trữ điện tử (e-Archive System).
Hệ thống tự động đọc metadata, kết nối với file số hóa.
Kiểm tra lại:
Có thể tra cứu bằng metadata.
Mở được file gốc (TIFF) và file khai thác (PDF/A).
Checksum trùng khớp (không mất mát dữ liệu).
+ Ghi nhận và báo cáo
Lập biên bản bàn giao dữ liệu vào hệ thống: ghi rõ số lượng gói dữ liệu, dung lượng, số lượng file.
Lưu log hệ thống: thời gian nhập, người thực hiện.
Yêu cầu kỹ thuật
Định dạng đóng gói phải không độc quyền (open standard).
Metadata phải dùng Unicode UTF-8, tránh lỗi hiển thị.
Tối thiểu có 02 bản lưu: 01 bản trên hệ thống chính, 01 bản sao lưu tại máy chủ dự phòng.
✅ Kết quả đầu ra:
Tài liệu lưu trữ số hóa và dữ liệu chủ đã được đóng gói chuẩn.
Gói dữ liệu đã nhập vào Hệ thống, tra cứu được, toàn vẹn và bảo mật.
Có biên bản bàn giao và log hệ thống đầy đủ.
Mục đích
Xác nhận chất lượng và khối lượng sản phẩm số hóa trước khi đưa vào khai thác.
Đảm bảo dữ liệu số hóa an toàn, toàn vẹn, đồng bộ với dữ liệu chủ.
Hoàn tất thủ tục pháp lý để bàn giao sản phẩm cho đơn vị quản lý lưu trữ.
Căn cứ pháp lý
Điều 13 Thông tư 05/2025/TT-BNV.
Luật Lưu trữ số 33/2024/QH15 (Điều 27 – bảo đảm giá trị pháp lý của tài liệu số hóa).
Tiêu chuẩn quốc tế OAIS (ISO 14721) về lưu trữ lâu dài dữ liệu điện tử.
NGHIỆP VỤ:
a) Sao chép sản phẩm vào thiết bị lưu trữ
Xây dựng hướng dẫn sao chép dữ liệu:
Yêu cầu về an ninh, an toàn, bảo mật.
Định dạng file, cấu trúc thư mục, dung lượng tối đa.
Trước khi sử dụng, thiết bị lưu trữ (ổ cứng, NAS, băng từ LTO…) phải được kiểm tra an toàn thông tin.
Thực hiện sao chép:
Có thể bàn giao theo nhiều đợt (sau mỗi giai đoạn số hóa) hoặc một lần (sau khi kết thúc toàn bộ).
Mỗi lần sao chép/bàn giao → phải có biên bản xác nhận giữa các bên liên quan.
b) Kiểm tra số lượng, chất lượng và cấu trúc dữ liệu
Kiểm tra toàn bộ hoặc lấy mẫu (tùy loại tài liệu):
Số lượng: đối chiếu giữa file số hóa và danh mục gốc.
Chất lượng: kiểm tra độ rõ, màu sắc, độ phân giải.
Cấu trúc dữ liệu: metadata khớp với file ảnh, không thiếu hoặc sai trường.
Kết quả kiểm tra phải được lập thành Báo cáo nghiệm thu kỹ thuật.
c) Sao lưu dự phòng
Tạo ít nhất 02 bản sao lưu:
01 bản lưu trên hệ thống chính.
01 bản lưu dự phòng tại máy chủ/thiết bị khác, đặt ở địa điểm an toàn khác.
Sao lưu phải đảm bảo chế độ bảo mật: phân quyền truy cập, chống ghi đè, chống xóa ngoài ý muốn.
Có thể sử dụng thêm lưu trữ đám mây (cloud storage) đạt chuẩn bảo mật ISO/IEC 27001.
d) Nghiệm thu và bàn giao sản phẩm
Căn cứ:
Biên bản bàn giao tài liệu gốc.
Biên bản bàn giao dữ liệu chủ.
Báo cáo kiểm tra chất lượng.
Tiêu chuẩn kỹ thuật đầu ra.
Quy trình:
Hội đồng nghiệm thu (gồm đại diện cơ quan quản lý, đơn vị thực hiện số hóa, bộ phận lưu trữ) tiến hành đánh giá.
Nếu đạt yêu cầu → lập Biên bản nghiệm thu và bàn giao sản phẩm.
Hồ sơ nghiệm thu gồm: toàn bộ biên bản bàn giao, báo cáo kỹ thuật, báo cáo kiểm tra, nhật ký hệ thống.
Sau nghiệm thu, sản phẩm chính thức được đưa vào khai thác và lưu trữ lâu dài.
Yêu cầu kỹ thuật bổ sung
File bàn giao phải kèm checksum (SHA-256) để kiểm tra toàn vẹn.
Thiết bị lưu trữ bàn giao phải có nhãn nhận diện (tên dự án, dung lượng, ngày bàn giao).
Các tài liệu có ký số → chữ ký số phải còn hiệu lực tại thời điểm nghiệm thu.
✅ Kết quả đầu ra:
Có đầy đủ biên bản nghiệm thu và bàn giao.
Sản phẩm số hóa đã được sao lưu ít nhất 02 bản.
Tài liệu số hóa và dữ liệu chủ đã sẵn sàng để quản lý, khai thác chính thức trong hệ thống lưu trữ điện tử.
Một quy trình số hóa tài liệu lưu trữ giấy bài bản không chỉ bảo đảm lưu giữ lâu dài tư liệu gốc mà còn nâng cao hiệu quả khai thác thông tin. Việc chuẩn hóa từng bước, tuân thủ kỹ thuật và quy định pháp lý đóng vai trò quyết định trong thành công của dự án chuyển đổi số lưu trữ.
Mục đích
Loại bỏ bụi bẩn, nấm mốc nhẹ, tạp chất bám trên bề mặt tài liệu trước khi số hóa.
Bảo vệ thiết bị quét/chụp ảnh (tránh hỏng kính quét, trầy xước cảm biến do bụi).
Giữ nguyên trạng tài liệu, không làm hư hỏng, không đảo lộn trật tự.
Căn cứ pháp lý
Điều 20 Luật Lưu trữ số 33/2024/QH15.
Điều 7 Thông tư 05/2025/TT-BNV về quy trình số hóa tài liệu lưu trữ.
Quy chuẩn kỹ thuật TCVN 9250:2012 về bảo quản tài liệu.
NGHIỆP VỤ:
a) Vệ sinh sơ bộ
Chuẩn bị dụng cụ:
Chổi lông mềm chuyên dụng (chổi lông dê, lông ngựa).
Máy hút bụi nhỏ có đầu lọc HEPA (nếu có).
Khăn vải khô, găng tay cotton sạch.
Thao tác:
Đặt tài liệu trên bàn phẳng, khô, sạch.
Dùng chổi lông quét nhẹ nhàng từ giữa trang ra mép để loại bỏ bụi.
Quét lần lượt từng tờ, tránh bỏ sót góc mép.
Đối với hộp tài liệu: vệ sinh ngoài bìa, nắp, gáy trước khi mở hộp.
Sau khi vệ sinh xong một hộp → tiến hành kiểm đếm hồ sơ, tài liệu để đối chiếu danh mục.
b) Yêu cầu kỹ thuật và lưu ý
Không xáo trộn trật tự gốc của hồ sơ, tài liệu trong hộp.
Không dùng lực mạnh gây rách, gãy mép giấy.
Không dùng khăn ướt, cồn, dung dịch tẩy rửa.
Với tài liệu có mốc:
cần Tách riêng ra khỏi hồ sơ khác.
Chuyển xử lý bằng dung dịch chuyên dụng, khí Ozon nồng độ thấp hoặc phòng khử mốc trước khi số hóa.
Nếu phát hiện tài liệu bị mối mọt, côn trùng cắn, rách nặng → báo cáo để đưa vào diện tu bổ, phục chế trước khi quét.
Ví dụ minh họa: Trong một hộp hồ sơ hành chính năm 1995, khi mở ra thấy bụi phủ dày trên bìa.
Cán bộ lưu trữ thực hiện:
Dùng chổi lông mềm quét sạch mặt ngoài hộp.
Lấy từng tập hồ sơ đặt lên bàn, quét nhẹ từng tờ giấy.
Hồ sơ sau khi vệ sinh được đặt lại đúng vị trí ban đầu, không đảo lộn trật tự.
Kết thúc, tiến hành kiểm đếm 120 hồ sơ trong hộp và ghi vào bảng kiểm đếm vệ sinh.
Kết quả đầu ra
Tài liệu được làm sạch bụi, loại bỏ nấm mốc nhẹ.
Giữ nguyên trạng thái ban đầu, không thay đổi trật tự.
Có bảng kiểm đếm số lượng hồ sơ sau khi vệ sinh.
Tài liệu đủ điều kiện để chuyển sang bước số hóa (quét/chụp ảnh).
👉 Mục tiêu của bước vệ sinh là là làm sạch mà còn là khâu “lọc an toàn”, giúp tài liệu vừa bền hơn, vừa bảo đảm chất lượng ảnh số hóa, đồng thời kéo dài tuổi thọ cho thiết bị quét/chụp.