유니코드 텍스트 수정 — 깨진 인코딩 복구
텍스트가 가끔 이상한 모양으로 옵니다 — 작은따옴표 자리에 '’', 한글 자리에 '?' 사각형, 무작위처럼 보이는 모지바케. 이 도구는 흔한 인코딩 실수를 감지하고 복구합니다.
모지바케(文字化け)는 텍스트가 잘못된 문자셋으로 디코드될 때 생기는 현상. UTF-8 바이트를 Windows-1252로 해석(또는 반대)하면 작은따옴표가 '’', em-대시가 'â€"', 말줄임표가 '…'로. 이 도구는 흔한 실수를 되돌려요.
기타 정리: 보이지 않는 유니코드 제거(피싱·템플릿이 가끔 삽입하는 zero-width 공백), 악센트 정규화, 사적 사용 영역 글리프 제거.
흔한 수정
- •’ → ' (UTF-8을 Windows-1252로 잘못 읽음)
- •Â → (불필요한 줄바꿈 없는 공백)
- •Zero-width 공백(U+200B)과 다른 보이지 않는 문자 제거
- •스마트 따옴표 → 일반 따옴표 (또는 반대)
- •결합된 vs 분해된 악센트 (NFC vs NFD 정규화)
자주 묻는 질문
모든 모지바케를 고칠 수 있나요?
흔한 패턴은 가능 — UTF-8 ↔ Windows-1252 실수는 대부분 복구 가능. 여러 번 반복 디코드/인코드된 병적인 경우는 정보가 영구히 손실.
붙여넣은 글이 저장되나요?
아니요 — 브라우저에서만 처리.
