글본 — Geulbon 한글 복원
한글 복원 AI · v0.2 PoCCover · 001

깨진 글자를 다시,
획 하나까지.

NotebookLM, Midjourney가 한글을 깨뜨립니다. 자모가 어긋나고 획이 휘어 의미가 사라집니다. 글본은 그 순간을 자모 단위로 되돌립니다.

ViT-Small 인코더와 11,172 음절의 prototype bank가 가장 가까운 한 글자를 찾아냅니다. top-1 정확도 94.8%, top-5 96%—실제 NotebookLM 캡처에서 검증 중입니다.

음절 클래스
11,172
top-1 정확도
94.8%
번들 폰트
12 · OFL
증거Evidence · 002

얼마나
깨졌었는지,
얼마나
돌아왔는지.

오른쪽은 NotebookLM이 만들어낸 깨진 한글과 글본이 복원한 결과를 나란히 둔 격자입니다. 윗줄이 모델이 생성한 원본—획이 짓이겨지고 받침이 사라진 자모들. 아랫줄이 11,172 음절 prototype bank에서 가장 가까운 한 점을 찾아 다시 세운 결과.

  1. 01받침 손실 (□)종성이 빈 사각형으로 변환되는 가장 흔한 패턴.
  2. 02획 짓이김초성·중성의 획이 두꺼워지면서 음절이 한 덩어리로 뭉쳐짐.
  3. 03자모 어긋남ㅁ과 ㅂ, ㄴ과 ㄷ처럼 형태가 비슷한 자모가 서로 자리를 바꿈.
  4. 04음절 단위 정합픽셀이 아니라 11,172 음절 좌표 안에서 nearest-neighbor.
FIG. 02 · proof.png — corrupted vs restoredNotebookLM · 캡처 일자 2026.04.25
깨진 한글과 복원된 한글이 격자로 나열된 증거 이미지
윗줄: BlackHanSans 깨진 원본 · 아랫줄: GowunBatang 복원
파이프라인

Pipeline · 003

네 단계로
글자를 다시
세웁니다.

  1. 텍스트 추출

    완료

    EasyOCR이 이미지의 모든 글자 영역을 bbox·신뢰도·전경/배경 색까지 함께 잡아냅니다. is_corrupted 플래그가 다음 단계의 게이트입니다.

  2. 음절 복원

    완료

    ViT-Small 인코더와 SupCon contrastive로 학습된 11,172 음절 prototype bank에 nearest-neighbor 매칭. top-1 80%, top-5 94%.

  3. 폰트 매칭

    진행 중

    주변 글자의 ROI에서 stroke width, slant, serif 등 7가지 글리프 특징을 추출해 가장 비슷한 폰트를 12종 OFL 번들에서 선택합니다.

  4. 재렌더

    진행 중

    repair 모드는 깨진 글자만, restyle 모드는 전체 텍스트를 동일 폰트로 재렌더. 결과는 원본 위에 픽셀 정합으로 합성됩니다.

해부Anatomy · 004

글자는
여섯 가지로
깨집니다.

자모 손실, 가우시안 블러, JPEG 노이즈, 자모 위치 어긋남, 획 두께 왜곡, 색 출혈—실제 깨짐은 이 여섯 가지 합성으로 분해됩니다. 글본의 ViT-Small 인코더는 각 패턴을 강도 0.3·0.6·0.9 세 단계로 학습해 SupCon contrastive 임베딩 공간 안에 깨짐 지도와 정답 지도를 동시에 만듭니다.

  • 01자모 손실jamo_erase
  • 02가우시안 블러gaussian_blur
  • 03JPEG 아티팩트jpeg_artifact
  • 04자모 위치 어긋남jamo_shift
  • 05획 두께 왜곡stroke_weight
  • 06색 출혈noise_bleed
FIG. 03 · 합성 깨짐 매트릭스강도 0.3 · 0.6 · 0.9
자모 손실, 블러, JPEG, 자모 어긋남, 획 두께, 색 출혈 등 여섯 가지 깨짐을 강도별로 시각화한 매트릭스
철학

Philosophy · 005

한글은 픽셀이 아니라 자모입니다.

초성·중성·종성은 음절 안에서 정해진 자리에 놓입니다. "한"이라는 글자는 ㅎ + ㅏ + ㄴ의 약속이고, 그 약속이 깨졌을 때 우리는 글자를 잃습니다. 글본은 픽셀을 보정하지 않습니다.

자모 prototype bank의 11,172 좌표 안에서 가장 가까운 한 점을 찾아 다시 약속을 맺습니다. 흐릿한 글자도, 휘어 버린 글자도 본래 모양으로 돌아옵니다.