Memahami char, Unicode dan ASCII Pada Program Java

Tipe data character atau char digunakan untuk merepresentasikan karakter tunggal. Literal character diapit oleh tanda kutip tunggal. Perhatikan contoh berikut ini:

char huruf = 'z';
char angka = '9';

Pernyataan pertama menetapkan karakter z pada variabel huruf, sedangkan pernyataan kedua menetapkan karakter 9 pada variabel angka.

Hati-hati jangan tertukar dengan tipe data String, karena tipe data String diapit oleh tanda kutip ganda "  ". Jadi "A" adalah tipe data String, sedangkan 'A' adalah tipe data character.


car_unicode_ascii_java


Seperti sudah diketahui sebelumnya, komputer hanya mengetahui angka binary dalam pengoperasian internalnya. Character ini disimpan dalam komputer dengan rangkaian angka 0 dan 1. Proses untuk mapping character dan direpresentasikan sebagai bilangan binary disebut dengan encoding.

Unicode dan ASCII

Java mendukung unicode, yaitu sebuah skema encoding yang ditetapkan oleh Konsorsium  Unicode untuk mendukung perubahan, pemrosesan dan penampilan teks yang ditulis dalam berbagai bahasa yang berbeda di seluruh dunia.

Unicode ini secara original didesain sebagai sebuah encoding character 16-bit.

char termasuk kedalam tipe data primitif yang dapat menyediakan tipe data sederhana yang dapat memegang karakter apapun.

Bagaimanapun, ternyata 65,535 karakter yang mungkin dari 16-bit encoding tidak mencukupi untuk merepresentasikan seluruh karakter yang ada di dunia, oleh karena itu standar Unicode telah menambahkan sampai dengan 1,112,064 karakter.

Karakter-karakter yang melebihi batas 16-bit ini disebut juga dengan supplementary characters, dan program Java mendukung untuk karakter tambahan tersebut.

Sebuah Unicode 16-bit mengambil ruang sebesar 2 bit, diawali dengan \u dan diekspresikan dengan empat digit heksadesimal, yang dimulai dari \u0000 samapai dengan \uFFFF.

Baca juga cara konversi hexadesimal ke desimal.

Kebanyakan komputer saat ini menggunakan ASCII (American Standard Code For Information Interchange), skema encoding 8-bit untuk merepresentasikan huruf besar dan kecil, digit, tanda baca dan kontrol karakter.

Unicode memasukkan kode ASCII dengan \u0000 sampai \u007F yang berkorespondensi dengan karakter-karakter 128 ASCII.

Anda dapat menggunakan karakter-karakter ASCII seperti 'A', '$' atau '8' dalam java, ataupun anda dapat menggunakan karakter Unicode-nya. Anda bisa mengetahui karakter Unicode dari karakter ASCII-nya di sini.

Misalnya:

char huruf = 'B'; bisa juga ditulis dengan char huruf = '\u0042';.

Catatan penting:

Variabel pada tipe data char juga dapat digunakan dengan operator incerement dan decrement, untuk memperoleh karakter Unicode sebelum atau sesudahnya :

Contoh:

1:  public class Karakter {  
2:         
3:       public static void main (String [] args) {  
4:              
5:            char huruf = 'e';  
6:            System.out.println(++huruf);  
7:       }  
8:    
9:  }  

Hasil:
f

Tidak ada komentar

Bahasa Java. Diberdayakan oleh Blogger.