URL safe Characters url 글자 규칙
- Characters부분을 확인하면 된다.
#요약
- 기본 기반은 US-ASCII 이다.
- 예약어
- gen-delims = “:” / “/” / “?” / “#” / “[” / “]” / “@”
- sub-delims = “!” / “$” / “&” / “’” / “(“ / “)” / “*” / “+” / “,” / “;” / “=”
-
따로 뜻이 있게 쓰이는 단어.
- 비 예약어
- unreserved = ALPHA / DIGIT / “-“ / “.” / “_” / “~”
-
임의 사용이 가능한 단어.
- US-ASCII 범위를 넘어가는 경우 %{HEX}{HEX} 로 나타낸다.
- 보통 2바이트~4바이트 범위
-
ex > “한글” (UTF-8, 2글자 , 3+3=총 6바이트) : %ED%95%9C%EA%B8%80
- 기타
- 빈칸(“ “)은 +로 표현되는 경우가 있다.(%20이 encode 된 값이다.)
- 한글은 URL에서 바로 표현 못한다, 하고 싶다면 encode 해여된다.
- Q.그냥 지원 하던데요?
-
A. 브라우저에서 변환해서 처리된 것이다.
이와 비슷한걸로 과거 IE에서 utf-8전송 설정을 빼야된다는 이야기도 있다.
브라우저에서 기본으로 설정이 없으면 utf-8로 인코딩해서 보내버렸기 때문에…
즉, 인코딩 엉키면 정상 적으로 페이지 안보이는 경우가 있다. - 사용할 때
- urlencode() 등으로 처리해서 사용하면 된다.