Pengantar Singkat untuk Pengodean URL

URL situs web, juga dikenal sebagai "alamat situs web", adalah apa yang akan dimasukkan seseorang ke dalam peramban web untuk mengakses situs web tertentu. Ketika Anda menyampaikan informasi melalui URL, Anda harus memastikan itu hanya menggunakan karakter tertentu yang diizinkan. Karakter yang diizinkan ini mencakup karakter alfabet, angka, dan beberapa karakter khusus yang memiliki makna dalam string URL. Karakter lain apa pun yang perlu ditambahkan ke URL harus di-enkode agar tidak menyebabkan masalah selama perjalanan browser untuk menemukan halaman dan sumber daya yang Anda cari.

Mengkodekan URL

Karakter yang paling sering dikodekan dalam string URL adalah karakter . Anda melihat karakter ini setiap kali Anda melihat tanda tambah (+) di URL. Ini mewakili karakter ruang. Tanda tambah bertindak sebagai karakter khusus yang mewakili ruang itu di URL. Cara paling umum yang akan Anda lihat adalah di tautan mailto yang menyertakan subjek. Jika Anda ingin subjek memiliki ruang di dalamnya, Anda dapat menyandikannya sebagai plus:

mailto: email? subject = this + adalah + subjek + saya

Ini sedikit teks encoding akan mengirimkan subjek "ini adalah subjek saya". Karakter "+" dalam pengkodean akan diganti dengan aktual ketika dirender di browser.

Untuk menyandikan URL, Anda cukup mengganti karakter khusus dengan string pengkodean mereka. Ini hampir selalu dimulai dengan karakter%.

Mengkodekan URL

Sebenarnya, Anda harus selalu mengkodekan karakter khusus yang ditemukan di URL. Satu catatan penting, jika Anda merasa sedikit terintimidasi oleh semua pembicaraan atau penyandian ini, adalah bahwa Anda umumnya tidak akan menemukan karakter khusus apa pun di URL di luar konteks normal mereka kecuali dengan data formulir.

Sebagian besar URL menggunakan karakter sederhana yang selalu diizinkan, jadi tidak perlu pengkodean sama sekali.

Jika Anda mengirimkan data ke skrip CGI menggunakan metode GET, Anda harus menyandikan data karena akan dikirim melalui URL. Misalnya, jika Anda menulis tautan untuk mempromosikan umpan RSS , URL Anda harus dienkode untuk ditambahkan ke URL skrip yang Anda promosikan.

Apa yang Harus Dikodekan?

Karakter apa pun yang bukan karakter alfabet, angka, atau karakter khusus yang digunakan di luar konteks normal akan perlu dikodekan di halaman Anda. Di bawah ini adalah tabel karakter umum yang dapat ditemukan di URL dan penyandiannya.

Pengodean Karakter yang Dicadangkan

Karakter Tujuan dalam URL Encoding
: Protokol terpisah (http) dari alamat % 3B
/ Pisahkan domain dan direktori % 2F
# Jangkar terpisah % 23
? String kueri terpisah % 3F
& Elemen kueri terpisah % 24
@ Pisahkan nama pengguna dan kata sandi dari domain % 40
% Menunjukkan karakter yang dikodekan % 25
+ Menunjukkan ruang % 2B
Tidak direkomendasikan di URL % 20 atau +

Perhatikan bahwa contoh yang disandikan ini berbeda dari yang Anda temukan dengan karakter khusus HTML . Misalnya, jika Anda perlu menyandikan URL dengan karakter ampersand (&), Anda akan menggunakan% 24, yang ditampilkan pada tabel di atas. Jika Anda menulis HTML dan Anda ingin menambahkan ampersand ke teks, Anda tidak dapat menggunakan% 24. Sebagai gantinya, Anda akan menggunakan "& amp;"; atau "& # 38;", keduanya akan menulis & di halaman HTML saat dirender. Ini mungkin tampak membingungkan pada awalnya, tetapi pada dasarnya adalah perbedaan antara teks yang muncul di halaman itu sendiri, yang merupakan bagian dari kode HTML, dan string URL, yang merupakan entitas terpisah dan karena itu tunduk pada aturan yang berbeda.

Kenyataan bahwa karakter "&", serta banyak karakter lain, dapat muncul di masing-masing seharusnya tidak membuat Anda bingung dengan perbedaan di antara keduanya.

Artikel asli oleh Jennifer Krynin. Diedit oleh Jeremy Girard.