Unicode
MIME / IANAUnicode
AliasUniversal Coded Character Set (UCS)
BahasaInternasional
StandarUnicode Standard
Status terkiniversi 14.0
Format encodingUTF-8, UTF-16, GB18030
Jarang dipakai: UTF-32, BOCU, SCSU, UTF-7
Didahului olehISO 8859, lainnya

Unicode adalah suatu standar teknis yang dirancang untuk mengizinkan teks dan simbol dari semua sistem tulisan di dunia untuk ditampilkan dan dimanipulasi secara konsisten oleh komputer. Dikembangkan secara tandem dengan standar Universal Character Set dan dipublikasikan dalam bentuk buku The Unicode Standard. Unicode mengandung suatu kumpulan karakter, suatu metodologi pengkodean dan kumpulan standar penyandian karakter, suatu kumpulan bagan kode untuk referensi visual, deskripsi sifat karakter seperti huruf besar dan huruf kecil, suatu kumpulan data referensi berkas komputer, serta aturan normalisasi, dekomposisi, pembandingan (collation), serta penggambaran (rendering).

Unicode Consortium, suatu organisasi nirlaba yang mengkoordinasikan pengembangan Unicode memiliki tujuan ambisius untuk dapat, pada akhirnya, menggantikan skema pengkodean karakter yang ada dengan Unicode dan skema Unicode Transformation Format (UTF) nya, karena banyak skema yang ada sekarang memiliki keterbatasan ukuran dan lingkup dan takserasi dengan lingkungan multibahasa. Kesuksesan Unicode menyatukan set karakter telah membawa pada penggunaannya yang luas dan pradominan dalam internasionalisasi dan lokalisasi perangkat lunak komputer. Standar ini telah diterapkan pada teknologi-teknologi terkini, termasuk XML, bahasa pemrograman Java, dan sistem operasi modern.

Aksara Nusantara dalam Unicode

sunting

Aksara-aksara Nusantara yang telah memiliki register Unicode adalah:

Aksara-aksara Nusantara dalam proses pengesahan untuk memiliki register Unicode adalah:

Tabel Unicode pada Basic Multilingual Plane (BMP)

sunting
U+ 0 1 2 3 4 5 6 7 8 9 A B C D E F
0040 @ A B C D E F G H I J K L M N O
0050 P Q R S T U V W X Y Z [ \ ] ^ _
0060 ` a b c d e f g h i j k l m n o
0070 p q r s t u v w x y z { | } ~ DEL
00C0 À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
00D0 Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß
00E0 à á â ã ä å æ ç è é ê ë ì í î ï
00F0 ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ
0100 Ā ā Ă ă Ą ą Ć ć Ĉ ĉ Ċ ċ Č č Ď ď
0110 Đ đ Ē ē Ĕ ĕ Ė ė Ę ę Ě ě Ĝ ĝ Ğ ğ
0120 Ġ ġ Ģ ģ Ĥ ĥ Ħ ħ Ĩ ĩ Ī ī Ĭ ĭ Į į
0130 İ ı IJ ij Ĵ ĵ Ķ ķ ĸ Ĺ ĺ Ļ ļ Ľ ľ Ŀ
0140 ŀ Ł ł Ń ń Ņ ņ Ň ň ʼn Ŋ ŋ Ō ō Ŏ ŏ
0150 Ő ő Œ œ Ŕ ŕ Ŗ ŗ Ř ř Ś ś Ŝ ŝ Ş ş
0160 Š š Ţ ţ Ť ť Ŧ ŧ Ũ ũ Ū ū Ŭ ŭ Ů ů
0170 Ű ű Ų ų Ŵ ŵ Ŷ ŷ Ÿ Ź ź Ż ż Ž ž ſ
0180 ƀ Ɓ Ƃ ƃ Ƅ ƅ Ɔ Ƈ ƈ Ɖ Ɗ Ƌ ƌ ƍ Ǝ Ə
0190 Ɛ Ƒ ƒ Ɠ Ɣ ƕ Ɩ Ɨ Ƙ ƙ ƚ ƛ Ɯ Ɲ ƞ Ɵ
01A0 Ơ ơ Ƣ ƣ Ƥ ƥ Ʀ Ƨ ƨ Ʃ ƪ ƫ Ƭ ƭ Ʈ Ư
01B0 ư Ʊ Ʋ Ƴ ƴ Ƶ ƶ Ʒ Ƹ ƹ ƺ ƻ Ƽ ƽ ƾ ƿ
01C0 ǀ ǁ ǂ ǃ DŽ Dž dž LJ Lj lj NJ Nj nj Ǎ ǎ Ǐ
01D0 ǐ Ǒ ǒ Ǔ ǔ Ǖ ǖ Ǘ ǘ Ǚ ǚ Ǜ ǜ ǝ Ǟ ǟ
01E0 Ǡ ǡ Ǣ ǣ Ǥ ǥ Ǧ ǧ Ǩ ǩ Ǫ ǫ Ǭ ǭ Ǯ ǯ
01F0 ǰ DZ Dz dz Ǵ ǵ Ƕ Ƿ Ǹ ǹ Ǻ ǻ Ǽ ǽ Ǿ ǿ
0200 Ȁ ȁ Ȃ ȃ Ȅ ȅ Ȇ ȇ Ȉ ȉ Ȋ ȋ Ȍ ȍ Ȏ ȏ
0210 Ȑ ȑ Ȓ ȓ Ȕ ȕ Ȗ ȗ Ș ș Ț ț Ȝ ȝ Ȟ ȟ
0220 Ƞ ȡ Ȣ ȣ Ȥ ȥ Ȧ ȧ Ȩ ȩ Ȫ ȫ Ȭ ȭ Ȯ ȯ
0230 Ȱ ȱ Ȳ ȳ ȴ ȵ ȶ ȷ ȸ ȹ Ⱥ Ȼ ȼ Ƚ Ⱦ ȿ
0240 ɀ Ɂ ɂ Ƀ Ʉ Ʌ Ɇ ɇ Ɉ ɉ Ɋ ɋ Ɍ ɍ Ɏ ɏ
0250 ɐ ɑ ɒ ɓ ɔ ɕ ɖ ɗ ɘ ə ɚ ɛ ɜ ɝ ɞ ɟ
0260 ɠ ɡ ɢ ɣ ɤ ɥ ɦ ɧ ɨ ɩ ɪ ɫ ɬ ɭ ɮ ɯ
0270 ɰ ɱ ɲ ɳ ɴ ɵ ɶ ɷ ɸ ɹ ɺ ɻ ɼ ɽ ɾ ɿ
0280 ʀ ʁ ʂ ʃ ʄ ʅ ʆ ʇ ʈ ʉ ʊ ʋ ʌ ʍ ʎ ʏ
0290 ʐ ʑ ʒ ʓ ʔ ʕ ʖ ʗ ʘ ʙ ʚ ʛ ʜ ʝ ʞ ʟ
02A0 ʠ ʡ ʢ ʣ ʤ ʥ ʦ ʧ ʨ ʩ ʪ ʫ ʬ ʭ ʮ ʯ
1D00
1D10
1D20
1D30 ᴿ
1D40
1D50
1D60
1D70 ᵿ
1D80
1D90
1DA0
1DB0 ᶿ
1E00
1E10
1E20
1E30 ḿ
1E40
1E50
1E60
1E70 ṿ
1E80
1E90
1EA0
1EB0 ế
1EC0
1ED0
1EE0
1EF0 ỿ
2100
2110
2120 Ω K Å
2130
2140
2490
24A0
24B0
24C0
24D0
24E0
2C60
2C70      
A720
A730
A740
A750
A760
fff
fff      
fff                      
U+ 0 1 2 3 4 5 6 7 8 9 A B C D E F
fff
fff
fff  ꤦ  ꤧ  ꤨ  ꤩ  ꤪ  ꤫  ꤬  ꤭
fff ꤿ
fff  ꥇ  ꥈ  ꥉ  ꥊ  ꥋ  ꥌ  ꥍ  ꥎ  ꥏ
fff  ꥐ  ꥑ  ꥓                      
fff                                
fff                                
fff                                
fff                                
fff                                
ffff                                
fff                                
fff                                
fff                                
fff                                
fff                  
FFff
FFff _
FFff

Unicode dan huruf komputer

sunting

Fon (huruf komputer) bebas maupun berbayar yang berdasarkan Unicode telah tersedia bebas, sejak fon TrueType dan OpenType mendukung Unicode. Informasi setiap bentuk huruf disimpan dengan menggunakan substitusi karakter universal.

Lihat pula

sunting

Pustaka

sunting
  • The Complete Manual of Typography, James Felici, Adobe Press; 1st edition, 2002
  • Unicode Demystified: A Practical Programmer's Guide to the Encoding Standard, Richard Gillam, Addison-Wesley Professional; 1st edition, 2002
  • Unicode Explained, Jukka K. Korpela, O'Reilly; 1st edition, 2006
  • The Unicode Standard, Version 5.0, Fifth Edition, The Unicode Consortium, Addison-Wesley Professional, Oct. 27, 2006. ISBN 0-321-48091-0
  • The Unicode Standard, Version 4.0, The Unicode Consortium, Addison-Wesley Professional, Aug. 27, 2003. ISBN 0-321-18578-1

Pranala luar

sunting

📚 Artikel Terkait di Wikipedia

Aksara Jawa

Proposal Unicode untuk aksara Jawa Dokumentasi Unicode mengenai diakritik KERET Dokumentasi Unicode mengenai diakritik CAKRA Dokumentasi Unicode mengenai

Aksara Sunda Baku

dihilangkan. Aksara Sunda ditambahkan ke dalam standar Unicode pada April 2008 melalui perilisan Unicode versi 5.1. Penambahan ini memungkinkan Aksara Sunda

Basmalah

maka kalian akan diberi berkah padanya.'" — Hadis riwayat Abu Dawud Dalam Unicode, kalimat Basmalah ini didaftarkan sebagai satu karakter dalam U+FDFD ﷽

Alfabet Fonetik Internasional

dari konsonan. Unicode meletakkan pengkodean superskrip baru ("modifier") dalam blok Ekstensi Latin-F baru. Pengkodean karakter Unicode untuk superskrip

Aksara Kawi

Script" (PDF). Unicode Document Registry. Unicode. "Unicode® 15.0.0". Unicode Consortium. 2022-09-13. Diakses tanggal 2022-09-13. Unicode Technical Committee

Aksara Lontara

proyek no. EAP365 Proposal Unicode untuk Aksara Lontara Proposal Unicode untuk VIRAMA (diakritik pemati) Lontara Proposal Unicode untuk karakter tambahan

Aksara Bali

Proposal Unicode untuk aksara Bali Proposal Unicode untuk JNYA ARKAIS Bali Proposal Unicode untuk PANTI LANTANG dan PAMADA LANTANG Bali Dokumentasi Unicode mengenai

Arabic (blok Unicode)

Unicode yang mengandung huruf-huruf standar dan diakritik paling lazim dalam abjad Arab dan numeralia Arab-India. Abjad Arab dalam Unicode "Unicode character