Unicode là gì? Bảng mã Unicode gồm những font chữ nào?

Unicode là gì? Bảng mã Unicode gồm những font chữ nào?
4.9/5 - (19 bình chọn)

Unicode là gì? Bảng mã Unicode gồm những font chữ nào?

Unicode là gì?

Unicode là một tiêu chuẩn mã hóa ký tự phổ biến. Nó xác định cách các ký tự riêng lẻ được biểu diễn trong các file văn bản, trang web và các loại tài liệu khác.

Unicode (hay gọi là mã thống nhất; mã đơn nhất) là bộ mã chuẩn quốc tế được thiết kế để dùng làm bộ mã duy nhất cho tất cả các ngôn ngữ khác nhau trên thế giới, kể cả các ngôn ngữ sử dụng ký tự tượng hình phức tạp như chữ Hán của tiếng Trung Quốc, tiếng Nhật, chữ Nôm của tiếng Việt, v.v. Vì những điểm ưu việt đó, Unicode đã và đang từng bước thay thế các bộ mã truyền thống, kể cả bộ mã tiêu chuẩn ISO 8859. Unicode đang được sử dụng trên rất nhiều phần mềm cũng như các trình ứng dụng, chẳng hạn Windows (theo wikipedia).

Phiên bản mới nhất là Unicode® 13.0.0 công bố ngày 10 tháng 3 năm 2020.

Đặc điểm của Unicode

Một tiêu chuẩn trên toàn thế giới được phát triển để giúp khắc phục những hạn chế của ASCII đã được phát hành lần đầu tiên như một tiêu chuẩn vào tháng 10 năm 1991.

Không giống như ASCII, được thiết kế để chỉ đại diện cho các ký tự tiếng Anh cơ bản, Unicode được thiết kế để hỗ trợ các ký tự từ tất cả các ngôn ngữ trên thế giới. Bộ ký tự ASCII tiêu chuẩn chỉ hỗ trợ 128 ký tự, trong khi Unicode có thể hỗ trợ khoảng 1.000.000 ký tự. Trong khi ASCII chỉ sử dụng một byte để đại diện cho mỗi ký tự, Unicode hỗ trợ tối đa 4 byte cho mỗi ký tự.

Unicode thường sử dụng nhất là gì?

Một loại Unicode phổ biến là UTF-8, sử dụng mã hóa ký tự 8 bit. Nó thường được sử dụng trong môi trường Linux, để mã hóa các ký tự nước ngoài để chúng hiển thị đúng khi xuất ra tệp văn bản.

Với Unicode, mỗi ký tự sử dụng một số duy nhất từ ​​U+0000 đến U+10FFFF, Unicode có thể là 8-bit, 16-bit hoặc 32-bit. Các số, ký hiệu toán học, các ký hiệu và ký tự phổ biến từ tất cả các ngôn ngữ đều được gán một điểm mã, ví dụ: U+0041 là một chữ cái tiếng Anh “A.”

Bảng mã Unicode là gì?

Unicode là một bảng mã, nó ánh xạ một số duy nhất đến một ký tự (ký tự này có thể là chữ cái tiếng Anh như “a”, “b” hoặc tiếng Việt “á”, “ớ”, tiếng Nhật hoặc là các ký tự đặc biệt như “$”, “%”, dấu chấm câu “.”, “,”…)

Unicode là gì? Bảng mã Unicode gồm những font chữ nào?
Unicode là gì? Bảng mã Unicode gồm những font chữ nào?

Mỗi số như vậy được gọi là một điểm mã (code point), một khái niệm mang tính lý thuyết. Còn việc điểm mã được biểu diễn trong bộ nhớ hay ổ đĩa là một câu chuyện hoàn toàn khác. Mỗi điểm mã được biểu diễn dưới dạng U+0639. “U+” tượng trưng cho “Unicode”, còn phần hệ số là hệ hexa. Ví dụ, điểm mã U+0041 là số hexa 0041 (tương đương số thập phân 65). Nó biểu diễn ký tự “A” trong chuẩn Unicode.

Mỗi ký tự được gán một tên duy nhất để phân biệt nó với ký tự khác. Chẳng hạn, U+0041 được gán tên là “LATIN CAPITAL LETTER A”. U+0A1B được gán với tên “GURMUKHI LETTER CHA”.

Lấy ví dụ một xâu ký tự:

Hello

trong Unicode, xâu ký tự này tương ứng với 5 điểm mã (lưu ý là 5 điểm mã chứ không phải 5 byte)

U+0048 U+0065 U+006C U+006C U+006F

Số chữ cái mà Unicode có thể định nghĩa là không giới hạn, trên thực tế nó vượt xa con số 65536. Phiên bản Unicode mới nhất là 9.0.0, biểu diễn tổng số 128172 ký tự.

Một số thuật ngữ thường dùng trong Unicode như: không gian mã (code space), plane, code unit, block…

Không gian mã là không gian chứa tất cả các điểm mã của Unicode. Một thuật ngữ khác là plane. Unicode chia thành 17 plane, mỗi plane chứa 65,536 ký tự (tương đương 16 bit), bởi vậy tổng kích thước không gian mã của Unicode là 17 × 65,536 = 1,114,112.

Bảng mã Unicode gồm những font chữ nào?

Bảng mã Unicode có rất nhiều font chữ, một số font chữ phổ biến thường dùng như: Times New Roman, Tahoma, Arial,…

Danh sách bảng mã Unicode đầy đủ gồm 172 font dưới đây:

 1. Arial
 2. Comic Sans
 3. Courier New
 4. Palatino
 5. Tahoma
 6. Times New Roman
 7. Trebuchet
 8. Verdana
 9. Aachen
 10. AGOldFace
 11. Algerian
 12. Allegie
 13. Amazone
 14. AmericanUnc
 15. Amherst
 16. Arabia
 17. Architecture
 18. Arial-Rounded
 19. Ariston
 20. Arrus
 21. Arrus-Black
 22. AvantGarde
 23. AvantGarde-Demi
 24. Aztek
 25. Bandit
 26. BankGothic
 27. Barmeno-ExtraBold
 28. Bauhaus-Heavy
 29. Bauhaus-Light
 30. Bauhaus-Medium
 31. Bedrock
 32. Bellevue
 33. Benguiat
 34. BertholdScript I
 35. Bodoni
 36. Bodoni BC
 37. Bodoni EB
 38. Bodoni-PosterCompressed
 39. Bookman
 40. Bookman-Demi
 41. Boton
 42. Boulevard
 43. Braggadocio
 44. Broad
 45. BrushScript
 46. Casablanca
 47. Casper OpenFace
 48. Centurion Old
 49. Chaucer
 50. Chelthm
 51. Clarendon
 52. Clearface Gothic
 53. Colonna
 54. Commerce Cond
 55. Commerce C
 56. Commercial Script
 57. Compacta
 58. Cooper
 59. Coporate
 60. CopperplateGothic
 61. Corsiva
 62. Courier
 63. Coutdown
 64. Dauphin Desdemona
 65. Digital
 66. Domcasual
 67. Dur
 68. Elephant
 69. ErasContour
 70. Erie-Black
 71. Exotic
 72. FetteFraktur
 73. Fillmore
 74. Frankfurter
 75. Frankfurt Gothic
 76. Freeform
 77. Freehand
 78. FreeStyle
 79. Frutiger
 80. Frutiger-Light
 81. Fujiyama
 82. Fujiyama-LightCondensed
 83. Futura
 84. Futura-Black
 85. Galleria
 86. Garamond
 87. Gatineau
 88. GeoSlab703 C
 89. GeoSlab703 E
 90. GillSans
 91. GillSans-Condensed
 92. GoudyOld
 93. GoudyText
 94. Harpoon
 95. Harrington
 96. Helvetica C
 97. Helvetica N
 98. Hobo
 99. Imago-ExtraBold
 100. Impact
 101. Isadora
 102. Jamai
 103. Joanna
 104. Jupiter
 105. Kaufmann
 106. Kids
 107. Korinna
 108. Kun Medium
 109. LatinWide
 110. LinoScript
 111. Linotext
 112. Lithosgraph
 113. Lucida HandWriting
 114. Lydian
 115. Memorandum
 116. Murray
 117. Mystical Nebraska
 118. New Century
 119. NewCentury-Narrow
 120. News Gothic
 121. Nueva
 122. Nueva-BoldExtended
 123. NuptialScript
 124. Officina Sans
 125. Officina Serif
 126. Onyx
 127. Optima
 128. Oranda
 129. Palatino
 130. Park Avenue
 131. Pepita
 132. Perpetua
 133. Post Antiqua
 134. President
 135. Revue
 136. Rockwell-ExtraBold
 137. Russell Square
 138. Salina Display
 139. Sans Serif
 140. Scribble
 141. Script
 142. Serpentine
 143. Serpentine Sans
 144. SerpentineSans L
 145. Shelley Allegro
 146. Signature Light
 147. Slogan
 148. Snell
 149. Souvenir
 150. Staccato
 151. Standout
 152. Stencil
 153. Stop
 154. Switzerland
 155. SwitzerlandCondensed
 156. Tekton
 157. Tiffany
 158. Tiffany Heavy
 159. Times
 160. Times-Narrow
 161. Tubes
 162. Umbra
 163. University
 164. Utopia
 165. Viva
 166. Viva B
 167. Vivienne
 168. Vogue-ExtraBold
 169. Walbaum
 170. Windsor
 171. WoodType Demi
 172. ZapfChancery

Nguồn: Unicode là gì? Bảng mã Unicode gồm những font chữ nào?

Bài viết này có hữu ích với bạn không?
Không