UTF là gì? UTF8 là gì? UTF16, UTF32 là gì?

UTF là gì? UTF8 là gì? UTF16, UTF32 là gì?
5/5 - (4 bình chọn)

UTF là gì? UTF8 là gì? UTF16, UTF32 là gì?

UTF là gì?

UTF là viết tắt của Unicode Transformation Format – Định dạng chuyển đổi Unicode. UTF là một tiêu chuẩn chung để ánh xạ các bảng mã Unicode. Nó xác định cách viết từ mọi nơi trên thế giới, được lưu trữ ở bất kỳ định dạng mã hóa Unicode nào, nên được biểu diễn trên các hệ thống máy tính khác nhau. Bao gồm UTF-7, UTF-8, UTF-16 và UTF-32.

Danh sách các định dạng UTF

UTF-7 (UTF7)

UTF-7 – sử dụng 7 bit cho mỗi ký tự. Nó được thiết kế để đại diện cho các ký tự ASCII trong các thư email yêu cầu mã hóa Unicode.

UTF-8 (UTF8)

UTF-8 (UTF8) là loại mã hóa Unicode phổ biến nhất. Nó sử dụng một byte cho các ký tự và ký hiệu tiếng Anh chuẩn, hai byte cho các ký tự Latinh và Trung Đông bổ sung, và ba byte cho các ký tự châu Á. Các ký tự bổ sung có thể được biểu diễn bằng bốn byte. UTF-8 tương thích ngược với ASCII, vì 128 ký tự đầu tiên được ánh xạ tới các giá trị giống nhau.

UTF-16 (UTF16)

UTF-16 – một phần mở rộng của bảng mã Unicode “UCS-2”, sử dụng hai byte để đại diện cho 65.536 ký tự. Tuy nhiên, UTF-16 cũng hỗ trợ bốn byte cho các ký tự bổ sung lên đến một triệu.

UTF-32 (UTF32)

UTF-32 – mã hóa đa byte đại diện cho mỗi ký tự có 4 byte.

UTF được sử dụng ở đâu?

Hầu hết văn bản trong tài liệu và trang web được mã hóa bằng một trong các mã UTF ở trên.

Nhiều chương trình xử lý văn bản không cho phép bạn xem mã hóa ký tự của các tài liệu đang mở, mặc dù một số hiển thị mã hóa ở cuối cửa sổ tài liệu hoặc trong thuộc tính tệp.

Kiểm tra kiểu mã hóa UTF như thế nào?

Nếu bạn muốn xem kiểu mã hóa ký tự được sử dụng bởi một trang web, tại trình duyệt web bạn có thể chọn menu View/Xem → Xem Nguồn để xem HTML của trang. Mã hóa ký tự, nếu được xác định, sẽ nằm trong phần tiêu đề, gần đầu HTML.

Kiểm tra kiểu mã hóa UTF

Một trang sử dụng mã hóa UTF-8 có thể bao gồm một trong các đoạn văn bản dưới đây, tùy thuộc vào phiên bản HTML.

Ví dụ về mã hóa UTF8

Nguồn: UTF là gì? UTF8 là gì? UTF16, UTF32 là gì?

Bài viết này có hữu ích với bạn không?
Không