URL safe Characters url 글자 규칙

less than 1 minute read

  1.  Characters부분을 확인하면 된다.

#요약

  • 기본 기반은 US-ASCII  이다.
  • 예약어
  • gen-delims  = “:” / “/” / “?” / “#” / “[” / “]” / “@”
  • sub-delims  = “!” / “$” / “&” / “’” / “(“ / “)” / “*” / “+” / “,” / “;” / “=”
  • 따로 뜻이 있게 쓰이는 단어.

  • 비 예약어
  • unreserved  = ALPHA / DIGIT / “-“ / “.” / “_” / “~”
  • 임의 사용이 가능한 단어.

  • US-ASCII 범위를 넘어가는 경우 %{HEX}{HEX} 로 나타낸다. 
  • 보통 2바이트~4바이트 범위
  • ex > “한글” (UTF-8, 2글자 , 3+3=총 6바이트) : %ED%95%9C%EA%B8%80

  • 기타 
  • 빈칸(“ “)은 +로 표현되는 경우가 있다.(%20이 encode 된 값이다.)
  • 한글은 URL에서 바로 표현 못한다, 하고 싶다면 encode 해여된다.
  • Q.그냥 지원 하던데요?
  • A. 브라우저에서 변환해서 처리된 것이다.
    이와 비슷한걸로 과거 IE에서 utf-8전송 설정을 빼야된다는 이야기도 있다.
    브라우저에서 기본으로 설정이 없으면 utf-8로 인코딩해서 보내버렸기 때문에… 
    즉, 인코딩 엉키면 정상 적으로 페이지 안보이는 경우가 있다.

  • 사용할 때
  • urlencode() 등으로 처리해서 사용하면 된다.

🔗original-link

Updated: