Meta Charset Tag dalam HTML5

Mengatur Encoding Karakter di HTML5

Sebelum pengenalan HTML5, pengaturan pengkodean karakter pada dokumen dengan elemenmeminta Anda untuk menulis baris yang agak verbose yang terlihat di bawah ini. Ini adalah elemen Meta Charset jika Anda menggunakan HTML4 di halaman web Anda:

Yang penting untuk diperhatikan dalam kode ini adalah tanda kutip yang Anda lihat di sekitar atribut konten : content = " text / html; charset = iso-8859-1 " . Seperti semua atribut HTML, tanda kutip ini menentukan nilai atribut, menunjukkan bahwa seluruh teks string / html; charset = iso-8959-1 adalah isi dari elemen ini. Ini adalah HTML yang tepat dan bagaimana string ini dimaksudkan untuk ditulis. Ini juga berat dan panjang jelek! Ini juga bukan sesuatu yang mungkin Anda ingat dari atas kepala Anda! Dalam kebanyakan kasus, pengembang web harus menyalin dan menempelkan kode ini dari satu situs ke situs baru yang mereka kembangkan karena menulis ini dari awal sangat banyak ditanyakan.

HTML5 Memotong Extra & # 34; Stuff & # 34;

HTML5 tidak hanya menambahkan sejumlah elemen baru ke bahasa, tetapi juga sangat menyederhanakan banyak sintaks HTML, termasuk elemen Meta Charset. Dengan HTML5, Anda dapat menambahkan pengkodean karakter dengan sintaks yang jauh lebih mudah diingat untuk elemen META yang Anda lihat di bawah ini:

Bandingkan sintaks yang disederhanakan itu dengan apa yang kami tulis di awal artikel ini, sintaks lama yang digunakan untuk HTML4, dan Anda akan melihat betapa mudahnya menulis dan mengingat versi HTML5 sebenarnya. Daripada perlu menyalin dan menempelkan ini dari situs yang sudah ada ke situs baru yang sedang Anda kerjakan, ini benar-benar sesuatu yang, sebagai pengembang web front-end, Anda bisa ingat. Penghematan waktu ini banyak tidak banyak, tetapi ketika Anda mempertimbangkan area sintaksis lain yang disederhanakan HTML5, penghematan memang bertambah!

Selalu Sertakan Pengkodean Karakter

Anda harus selalu menyertakan pengkodean karakter untuk halaman web Anda, bahkan jika Anda tidak pernah bermaksud untuk menggunakan karakter khusus . Jika Anda tidak menyertakan pengkodean karakter, situs Anda menjadi rentan terhadap serangan scripting lintas situs menggunakan UTF-7.

Dalam skenario ini, anattacker melihat bahwa situs Anda tidak memiliki pengkodean karakter yang ditentukan, sehingga menipu peramban untuk berpikir bahwa pengkodean karakter laman sebenarnya adalah UTF-7. Selanjutnya, penyerang menyuntikkan skrip yang dikodekan UTF-7 ke dalam halaman web dan situs Anda diretas. Ini jelas bermasalah bagi semua orang yang terlibat, dari perusahaan Anda hingga pengunjung Anda. Kabar baiknya adalah bahwa ini adalah masalah sederhana yang harus dihindari - pastikan untuk menambahkan pengkodean karakter ke semua halaman web Anda.

Di mana Tambahkan Encoding Karakter

Pengkodean karakter untuk halaman web harus menjadi baris pertama dari elemen HTML Anda. Ini memastikan bahwa peramban mengetahui apa pengkodean karakter sebelum melakukan hal lain di laman selain untuk menentukan jenis dokumen dan mengidentifikasi bahwa itu adalah Halaman HTML. HTML Anda harus membaca:

...

Menggunakan Header HTTP untuk Keamanan Ekstra

Anda juga dapat menentukan pengkodean karakter di header HTTP. Ini bahkan lebih aman daripada menambahkannya ke halaman HTML, tetapi Anda harus memiliki akses ke konfigurasi server atau file .htaccess, yang berarti Anda mungkin perlu bekerja dengan penyedia hosting situs web Anda untuk mendapatkan akses semacam ini atau minta mereka membuat perubahan untuk Anda. Akses benar-benar merupakan tantangan di sini. Perubahan itu sendiri sederhana, jadi setiap penyedia hosting harus dapat membuat perubahan ini untuk Anda dengan relatif mudah.

Jika Anda menggunakanApache, Anda dapat mengatur set karakter default untuk seluruh situs Anda dengan menambahkan: AddDefaultCharset UTF-8 ke file .htaccess root Anda. Set karakter standar Apache adalah ISO-8859-1 .