<aside> 💡 본 메뉴얼은 2022년 NIA 데이터 구축사업으로 만들어진 데이터의 유효성을 검증하기 위한 메뉴얼입니다. 구축된 데이터로 실제 인공지능 모델을 훈련시켰을때 목표했던 수준을 달성하는지를 확인합니다.
</aside>
.tar)를 로드하여 재현가능합니다.| CPU | Intel(R) Xeon(R) CPU E5-2620 v4 @ 2.10GHz | | --- | --- | | Memory | 31 GB RAM | | GPU | GeForce GTX 1080 Ti * 2 | | Storage | 468GB | | OS | Ubuntu 18.04.6 LTS |
| CPU | AMD EPYC Processor (with IBPB) |
|---|---|
| Memory | 885GB |
| GPU | NVIDIA A100-SXM4-40GB * 4 |
| Storage | 197GB |
| OS | Ubuntu 18.04.5 LTS |
| 개발언어 | Python |
|---|---|
| 프레임워크 | PyTorch |
| 도커 이미지 용량 | 3.37GB |
| 실행 파일명 | ko-menu-text-recognition.tar |
| 알고리즘 | deep-text-recognition-benchmark (TPS+VGG+BiLSTM+Attn) |
| 검증/평가 방법 | Test dataset에 대한 CER 평균 계산 |
|---|
| 어노테이션 유형 | 관광 음식 메뉴판 데이터 |
|---|---|
| 종류 및 수량 | ✅ Training Set: 80% (80,190개 이미지의 메뉴명 데이터) |
| ✅ Validation Set: 10% (10,000개 이미지의 메뉴명 데이터) | |
| ✅ Test Set: 10% (10,000개 이미지의 메뉴명 데이터) |
총 100,190 메뉴판 이미지 | | 형식 | 메뉴명 데이터(.json) + 메뉴판 이미지(.jpg) |