글본 — Geulbon 한글 복원
한자 복원 AI · 5종 서체

사라진 글자,
되살아나는 역사01— 한 획도 잃지 않게.

닳고 흐려진 천 년의 글자를, 한국국학진흥원 고문서 데이터로 학습한 AI가 한 글자 한 글자 다시 또렷하게 복원합니다. 조선왕조 의궤·문집·종손가 족보 — 사라질 뻔한 기록을 되살리는 학자의 도구.

한국식 정자(正字)·세로쓰기 자동 검출·학자 워크플로우
FIG. 01 · 의궤 5행 · BEFORE → AFTER
A · 원본
古書文史
흐려진
B · 복원
古書文史
또렷한
RESTORE — 184 ms
5,000
학습 한자
한국 고문서 텍스트의 98%를 커버합니다.
72.1%
TOP-1 정확도
첫 후보 글자로 곧장 맞히는 비율.
92.4%
TOP-5 정확도
5개 후보 안에 정답이 들어옵니다.
100만+
학습 글자 수
한국국학진흥원 CC-BY-SA 공개 데이터.
SECTION 01LIVE DEMO

흐려진 글자 한 행이,
또렷한 정자(正字)로.

A · 원본 (SOURCE)의궤 권3 · 17세기
6자 · 세로쓰기5종 손상 검출
RESTORE184ms · ViT-Small
B · 복원 (RESTORED)top-1 + 사용자 교정
?
1자 · 학자 검토 필요5/6 복원
손상별 결과 · 5종 정직 보고
  • 흐림BLURTOP-1 자동 복원96%
  • 얼룩STAINTOP-5 안에 · 한 번 클릭
  • 결락MISSINGTOP-5 안에 · 한 번 클릭
  • 번짐BLEEDTOP-5 안에 · 한 번 클릭
  • 강한 훼손HEAVY TEARTOP-5 밖 · 학자 직접 입력
SECTION 02HOW IT WORKS

네 번의 호흡으로
한 글자가 돌아옵니다.

STEP 01

세로 행 검출

스캔본에서 column 단위로 본문의 흐름을 읽어 행을 분리합니다.

COLUMN DETECT
STEP 02

글자 분할

각 행을 한 글자 단위로 정확히 잘라냅니다. 한국 고서의 자간 특성에 맞춤.

SEGMENT
STEP 03

ViT가 읽다

ViT-Small 모델이 5,000자 prototype과 비교해 가장 가까운 글자를 찾습니다.

VIT-SMALL
STEP 04

학자의 교정

top-5 후보 + 직접 입력으로 학자가 최종 글자를 결정합니다.

HUMAN-IN-LOOP
SECTION 03TRAINING DATA

공개 라이선스 데이터로만,
100만 글자.

글본은 한국국학진흥원이 공개한 CC-BY-SA 데이터로만 학습합니다. 중국 간체·일본 신자체가 아닌, 조선의 정자(正字)와 해서체에 특화된 모델. 출처가 명확한 데이터로만 만들어졌기에, 결과물 역시 같은 라이선스로 환원합니다.

CC-BY-SA 4.0 · 학습 데이터의 출처와 라이선스를 그대로 계승합니다. 연구·교육·문화재 보존 목적의 사용을 환영합니다.
  • 01
    조선왕조 의궤儀軌 · 왕실 의례 기록
    42만 자
  • 02
    종손가 족보·문집宗孫家 · 문중 기록·일기
    31만 자
  • 03
    조선후기 문집文集 · 사대부 시문집
    18만 자
  • 04
    지방 행정 문서邑誌 · 향토 기록
    9만 자
SECTION 04WHO IT'S FOR

다섯 곳의 책상 위에서,
같은 도구로.

CASE 01

박물관·도서관 큐레이터

전시 캡션과 도록을 위한 빠른 자형 식별. 보존 문서의 디지털 아카이브화.

CURATOR
CASE 02

국학진흥원·연구원

대량의 미정리 고문서를 텍스트로 옮길 때 작업 시간을 1/8로 줄입니다.

INSTITUTE
CASE 03

종손가 · 문중

대대로 내려온 족보·문집의 글자를 후손이 읽을 수 있게 복원합니다.

FAMILY
CASE 04

한문학·역사학 연구자

희미한 원문을 두고 동료들과 토론하던 시간을 본 연구에 돌려드립니다.

SCHOLAR
CASE 05

고서 출판사·번역가

원문 입력 단계에서의 오독을 줄여, 번역의 출발점을 단단하게 만듭니다.

EDITOR
CASE 06

장서가 · 컬렉터

소장 고서의 캡션·해제·내용 정리를 비전공자도 시작할 수 있습니다.

COLLECTOR
SECTION 05ACCURACY · LIMITS

솔직한 한계
함께 보여드립니다.

TOP-1 정확도72.1%
첫 후보로 곧장 맞힌 비율
TOP-5 정확도92.4%
5개 후보 안에 정답이 있는 비율
부수 매핑944종
강희부수(康熙部首) 전체 분류

당신의 고문서를
한 글자부터 다시.

이미지 한 장만 올려 보세요. 새벽 한 잔의 차 시간 안에, 행 단위로 다시 읽힙니다. 베타 기간 동안 박물관·연구원·종손가는 무료로 함께합니다.

SECTION 06ROADMAP

다음 호흡.

  • 2026 SUMMER

    행서·초서 학습

    의궤 외 사대부 일기·서간문에 자주 등장하는 흘려쓴 글자.

  • 2026 FALL

    한국어음 자동 표기

    각 한자에 한국 한자음을 자동으로 병기합니다.

  • 2027 WINTER

    부수 기반 미학습 추론

    학습 외 한자도 부수와 구조로 후보 글자를 제시합니다.