3.8. Unicode đủ mã cho bộ chữ toàn cầu. Tại sao người ta lại dùng UTF?
Câu hỏi:
3.8. Unicode đủ mã cho bộ chữ toàn cầu. Tại sao người ta lại dùng UTF?
Câu trả lời:
Người trả lời: GV. Đỗ Đăng Vương
Có nhiều cách để trả lời câu hỏi trên:Cách 1:- Bước 1: Unicode là một bộ mã hóa đa ngôn ngữ nhằm giải quyết việc mã hóa các ký tự từ các ngôn ngữ khác nhau.- Bước 2: UTF (Unicode Transformation Format) là một hệ thống mã hóa kí tự của Unicode, dùng để biểu diễn và mã hóa các ký tự.- Trả lời câu hỏi: Người ta lại dùng UTF vì trong quá trình chuyển từ các bảng mã khác sang Unicode, việc sử dụng UTF giúp hỗ trợ việc thay đổi mà không phải tốn quá nhiều công sức để cập nhật và bảo quản dữ liệu.Cách 2:- Bước 1: Unicode đủ mã cho bộ chữ toàn cầu, nhưng vẫn còn sử dụng các bảng mã khác như ASCII 8 bit trong một số ứng dụng.- Bước 2: UTF là một chuẩn mã hóa kí tự của Unicode, cho phép biểu diễn các ký tự từ bảng mã khác thông qua mã hóa đa byte.- Trả lời câu hỏi: Người ta lại dùng UTF vì nó giúp hỗ trợ việc sử dụng các dữ liệu từ các bảng mã khác mà không cần thay đổi quá nhiều mã nguồn, và cũng tiết kiệm không gian lưu trữ so với việc sử dụng mã Unicode đơn thuần. Câu trả lời đầy đủ và chi tiết hơn:Khi có Unicode, đã có rất nhiều ứng dụng sử dụng các loại mã khác, đặc biệt là ASCII 8 bit. Các ứng dụng xử lí văn bản như thư điện tử, soạn thảo, cơ sở dữ liệu dùng với ASCII và một số bảng mã khác đã tổn tại từ trước đó để lại một khối lượng dữ liệu khổng lồ, không thể vứt bỏ. Việc sửa các phần mềm chỉ sử dụng Unicode có nghĩa là sẽ mất rất nhiều dữ liệu. Mặt khác, khi dùng Unicode thì khối lượng lưu trữ cho dữ liệu văn bản sẽ tăng hơn hai lần. Vì thế cần có một cách mã hoá đồng thời Unicode và một số bảng mã khác, đặc biệt là ASCII để có thể sử dụng được các dữ liệu cũ và không nhất thiết phải dùng mã nhiều byte trong các ứng dụng phổ biến để tiết kiệm lưu trữ. UTF là cách giải quyết các yêu cầu trên. Vì thế UTF cũng được coi là đối tượng của Unicode (Unicode Transformation Format).
Câu hỏi liên quan:
- 3.1. Việc phân loại các kiểu dữ liệu căn cứ chủ yếu vào tiêu chí nào?A. Cách mã hoá.B. Cùng chung...
- 3.2. Kể ra 10 tên dữ liệu có trong học bạ có các kiểu văn bản, hình ảnh, số nguyên và số thập phân....
- 3.3. Ngày nay mã QR (QR code) được sử dụng rất rộng rãi. Đây là mã hoá của xâu kí tự, có thẻ giải...
- 3.4. Em hãy tìm mã nhị phân và mã thập phân (số thứ tự của kí tự trong bảng mã ASCII) của các kí tự...
- 3.5. (*) Tìm hiểu 32 kí tự đầu tiên của bảng mã ASCII theo những gợi ý sau:Chúng được sử dụng với...
- 3.6. Với 134 kí tự riêng phát sinh so với bảng chữ cái tiếng Anh, hoàn toàn có khả năng sắp xếp...
- 3.7. Unicode mã hoá mỗi kí tự bởiA. 1byte. B. 2bVte.C....
Bình luận (0)