Set UTF-8 |
Jika sobat ngoding sering atau mungkin pernah bergelut atau berpapasan dengan syntax HTML pasti sobat banyak menemukan tag-tag Meta. Ya kali ini kita akan membahas tentang tag <meta charset="utf-8">. Kenapa saya lebih memilih untuk membahas ini, ya karena selain sering digunakan, ternyata ini punya fungsi yang gak main-main loh.
Tentunya bagi para web developer segala syntax harus sangat-sangat diperhatikan agar tidak terjadi bug saat dijalankan di web browser. Jika kita menilik tentang "meta tag" kita harus mengetahui bahwa meta tag bukan ditujukan kepada user-nya tapi melainkan kepada web browsernya atau lebih tepatnya robot programnya.
Nah lantas apa itu <meta charset="utf-8">? Pada dasarnya charset merupakan instruksi yang digunakan untuk menerjemahkan bit-bit didalam HTML menjadi karakter. Jadi charset UTF-8 ini memberi instruksi kepada web browser untuk menerjemahkan karakter-karakter di dalam halaman HTML sebagai UTF-8.
Baca Juga :
Pada awal mulanya charset yang digunakan ialah karakter set ASCII (charset="us-ascii") namun charset ini terbatas pada karakternya yaitu hanya berjumlah 128 karakter saja. Lalu set ASCII di kembangkan menjadi karakter ANSI atau dalam penulisannya charset="ISO-8859-1" . Karakter ANSI mendukung hingga 256 karakter dan umumnya digunakan pada HTML versi 2.0 sampai versi 4.01. Permasalahannya pada karakter ASCII maupun ANSI tidak menyertakan karakter non-latin seperti huruf Arab,China,Jepang dll, sehingga untuk keperluan ini dikembangkanlah set untuk masing-masing bahasa seperti big5 untuk karakter China , x-euc-jp untuk karakter jepang, iso-8859-7 untuk karakter yunani dll. Sehingga hal ini menimbulkan perbedaan pada penulisan karakter set tergantung bahasa apa yang akan digunakan untuk menulis halaman HTML.
Tentu hal tersebut lumayan merepotkan programing dalam menulis syntax HTML, alangkah lebih praktisnya jika seluruh karakter ini disatukan kedalam satu karakter set. Hingga pada awal pengembangan XHTML, diperkenalkan set Unicode Transformation Format-8 atau disingkat UTF-8 yang mendukung hampir 10.000 lebih karakter yang ada di dunia dan menjadi standarisasi karakter set dunia.
Sebenarnya penulisan meta tag charset ini sangat diajurkan meskipun sepenuhnya opsional (meskipun dalam tutorial saya jarang juga menuliskannya hehehe). Karena jika tidak maka web browser akan mencoba “menebak” karakter yang digunakan dan proses “menebak” karakter set ini bisa menjadi masalah serius. Hal ini pernah terjadi pada tahun 2005, pada saat itu terdapat sebuah bug yang dinamakan “Google XSS” pada Internet Explorer Hal ini terjadi karena situs google tidak menuliskan karakter set sehingga bisa digunakan untuk menyisipkan kode javascript. Oleh karena itu, sebaiknya kita selalu menambahkan meta tag charset pada setiap halaman HTML.
No comments:
Post a Comment