Unicode

Vikipedi, özgür ansiklopedi
Atla: kullan, ara

Unicode (Evrensel Kod) Unicode Consortium organizasyonu tarafından geliştirilen ve her karaktere bir sayı değeri karşılığı atayan bir standarttır. Evrensel Karakter Seti (UCS) olarak bilinen ISO/IEC 10646 standardı ise, her iki organizasyonun işbirliği ile aynı sayısal karşılıkları taşımaktadır. Bu set,

  • Yeryüzündeki tüm karakterlere bir sayı değeri atamayı amaçlamaktadır.
  • Zaman içinde yeni karakterler eklenebilir ama eski karakterlerin sayı değerleri aynı kalır.
  • Sayı değerleri UCS-4 adlı 32 bitlik set üzerinden verilir. İlk 7 bit Group, sonraki 8 bit Plane, sonraki 8 bit Row, en son 8 bit Cell olarak gruplanır. İlk Plane (group = 0, plane = 0) Basic Multilingual Plane (BMP) olarak adlandırılır. BMP, UCS-2 adı verilen 16 bitlik sete karşılık gelmektedir.
  • UCS üzerindeki karakter kod noktaları genellikle u+0a31 biçiminde onaltılık sistemde sayılar olarak gösterilir.
  • u+0021 - u+007e arasındaki kodlar ASCII ile, u+00a0 - u+00ff arasındaki kodlar ISO-8859-9 ile aynı tutulmuştur.

Unicode kodlarından oluşan karakter dizilerini (metinleri) bilgisayarda verimli bir biçimde saklayabilmek amacıyla çeşitli karakter kodlamaları (encoding) geliştirilmiştir.

Türkçe karakterlerin unicode karşılıkları şunlardır;

  • ğ - \u011f
  • Ğ - \u011e
  • ı - \u0131
  • İ - \u0130
  • ö - \u00f6
  • Ö - \u00d6
  • ü - \u00fc
  • Ü - \u00dc
  • ş - \u015f
  • Ş - \u015e
  • ç - \u00e7
  • Ç - \u00c7

Dış bağlantılar[değiştir | kaynağı değiştir]

Standardlar

Ayrıca bakınız[değiştir | kaynağı değiştir]