Chappe Tower,salah satu Telegraf optikal.

Pengodean karakter atau penyandian huruf (bahasa Inggris: character encoding, character set) terdiri dari sandi atau kode yang memasangkan serangkaian aksara berurutan dari suatu kumpulan dengan sesuatu yang lain, seperti urutan bilangan asli (natural numbers), perlapanan (octet) atau denyut listrik, untuk mempermudah penyimpanan naskah pada komputer dan pengalirhantaran naskah melalui jaringan telekomunikasi. Misalnya sandi Morse, yang menyandikan huruf alfabet Latin ke dalam rangkaian tekanan panjang dan pendek dari kunci telegraf; serta ASCII, yang menyandikan huruf, bilangan, dan simbol-simbol lain, sebagai bilangan bulat dan versi perduaan (binary) 7-bita dari bilangan bulat tersebut; umumnya ditambahkan nol-bita untuk mempermudah penyimpanan dalam bita perlapanan.

Pada masa-masa awal komputer, pengenalan penyandiaksaraan seperti ASCII (1963) dan EBCDIC (1964) mengawali proses pembakuan. Keterbatasan kumpulan tersebut mulai tampak, dan beberapa metode seterjadinya (ad hoc) dikembangkan untuk memperluaskannya. Kebutuhan untuk mendukung berbagai macam tata tulisan, termasuk rumpun aksara CJK dari tulisan Asia Timur, membutuhkan dukungan untuk jauh lebih banyak aksara dan menuntut pendekatan yang tersusun rapi untuk penyandiaksaraan, dan bukan pendekatan seterjadinya seperti sebelumnya.

Acuan pengodean karakter

sunting

Unicode dan bakuan serupa lainnya, Universal Character Set (ISO/IEC 10646), bersama-sama merumuskan penyandiaksaraan seragam. Ada empat tingkat acuan penyandiaksaraan Unicode:[1]

  • Khasanah Aksara Mujarad (Abstract Character Repertoire)
  • Serangkaian Aksara Tersandikan (Coded Character Set)
  • Borang Penyandiaksaraan (Character Encoding Form)
  • Pola Rencana Penyandiaksaraan (Character Encoding Scheme)

Catatan kaki

sunting
  1. ^ "Unicode Technical Report #17: Unicode Character Encoding Model". 2008-11-11. Diakses tanggal 2012-10-28.

Pranala luar

sunting

📚 Artikel Terkait di Wikipedia

Daftar algoritme

PPM compression algorithm Shannon-Fano coding Truncated binary encoding Run-length encoding: pemadatan data yang menggunakan deretan huruf yang berulang

UTF-8

biner (binary) 0010000010101100. Dua angka nol di depan ditambahkan karena, seperti dalam tabel, suatu pengkodean tiga-bita (three-byte encoding) membutuhkan

Pi

G. (2009). "A slice of pi: An exploratory neuroimaging study of digit encoding and retrieval in a superior memorist". Neurocase. 15: 361–372. doi:10

Protokol Transfer Berkas

(MODE C): Memperluas MODE B dengan kompresi data menggunakan run-length encoding. Sebagian besar klien dan peladen FTP kontemporer tidak mengimplementasikan

Berkas biner

kumparan. Diakses tanggal 2024-12-14. "7.7 Binary files". statmath.wu.ac.at. Diakses tanggal 2024-12-14. "Encoding and Decoding Base64 Strings in Python"

Base32

Ascii85 (biasa dipanggil Base85) Base64 Base58 Base36 Base16 Binary-to-text encoding untuk perbandingan berbagai algoritma pengodean Geohash http://sourceforge

GNOME

yang dapat mencakup perubahan besar seperti kerusakan ABI(Application binary interface/Antarmuka biner aplikasi); Ini tidak memiliki jadwal reguler dan

Enkripsi ujung ke ujung

pemeriksaan manusia, sidik jari biasanya menggunakan beberapa bentuk Binary-to-text encoding[butuh rujukan]. String ini kemudian diformat ke dalam kelompok