3.8. Unicode đủ mã cho bộ chữ toàn cầu. Tại sao người ta lại dùng UTF?

Câu hỏi:

3.8. Unicode đủ mã cho bộ chữ toàn cầu. Tại sao người ta lại dùng UTF?

Câu trả lời:
Người trả lời: GV. Đỗ Đăng Vương
Có nhiều cách để trả lời câu hỏi trên:

Cách 1:
- Bước 1: Unicode là một bộ mã hóa đa ngôn ngữ nhằm giải quyết việc mã hóa các ký tự từ các ngôn ngữ khác nhau.
- Bước 2: UTF (Unicode Transformation Format) là một hệ thống mã hóa kí tự của Unicode, dùng để biểu diễn và mã hóa các ký tự.
- Trả lời câu hỏi: Người ta lại dùng UTF vì trong quá trình chuyển từ các bảng mã khác sang Unicode, việc sử dụng UTF giúp hỗ trợ việc thay đổi mà không phải tốn quá nhiều công sức để cập nhật và bảo quản dữ liệu.

Cách 2:
- Bước 1: Unicode đủ mã cho bộ chữ toàn cầu, nhưng vẫn còn sử dụng các bảng mã khác như ASCII 8 bit trong một số ứng dụng.
- Bước 2: UTF là một chuẩn mã hóa kí tự của Unicode, cho phép biểu diễn các ký tự từ bảng mã khác thông qua mã hóa đa byte.
- Trả lời câu hỏi: Người ta lại dùng UTF vì nó giúp hỗ trợ việc sử dụng các dữ liệu từ các bảng mã khác mà không cần thay đổi quá nhiều mã nguồn, và cũng tiết kiệm không gian lưu trữ so với việc sử dụng mã Unicode đơn thuần.

Câu trả lời đầy đủ và chi tiết hơn:
Khi có Unicode, đã có rất nhiều ứng dụng sử dụng các loại mã khác, đặc biệt là ASCII 8 bit. Các ứng dụng xử lí văn bản như thư điện tử, soạn thảo, cơ sở dữ liệu dùng với ASCII và một số bảng mã khác đã tổn tại từ trước đó để lại một khối lượng dữ liệu khổng lồ, không thể vứt bỏ. Việc sửa các phần mềm chỉ sử dụng Unicode có nghĩa là sẽ mất rất nhiều dữ liệu. Mặt khác, khi dùng Unicode thì khối lượng lưu trữ cho dữ liệu văn bản sẽ tăng hơn hai lần. Vì thế cần có một cách mã hoá đồng thời Unicode và một số bảng mã khác, đặc biệt là ASCII để có thể sử dụng được các dữ liệu cũ và không nhất thiết phải dùng mã nhiều byte trong các ứng dụng phổ biến để tiết kiệm lưu trữ. UTF là cách giải quyết các yêu cầu trên. Vì thế UTF cũng được coi là đối tượng của Unicode (Unicode Transformation Format).
Bình luận (0)
Nhấn vào đây để đánh giá
Thông tin người gửi
0.10432 sec| 2198.609 kb