OCR Data Centric
#naverboostcamp #ai_tech #computer_vision #data_centric #ocr
ํ๋ก์ ํธ ๊ฐ์
- 2024.10.28 ~ 2024.11.7
- ์์์ฆ ๊ธ์ ์ธ์์ ์ํ OCR ๋ํ
- Data-Centric AI ๊ด์ ๋ํ
- Naver Connect & Upstage ์ฃผ๊ด ๋ํ
๋ํ ์๊ฐ

์นด๋ฉ๋ผ๋ก ์์์ฆ์ ์ธ์ํ ๊ฒฝ์ฐ ์๋์ผ๋ก ์์์ฆ ๋ด์ฉ์ด ์
๋ ฅ๋๋ ์ดํ๋ฆฌ์ผ์ด์
์ด ์์ต๋๋ค. ์ด์ฒ๋ผ OCR (Optical Character Recognition) ๊ธฐ์ ์ ์ฌ๋์ด ์ง์ ์ฐ๊ฑฐ๋ ์ด๋ฏธ์ง ์์ ์๋ ๋ฌธ์๋ฅผ ์ป์ ๋ค์ ์ด๋ฅผ ์ปดํจํฐ๊ฐ ์ธ์ํ ์ ์๋๋ก ํ๋ ๊ธฐ์ ๋ก, ์ปดํจํฐ ๋น์ ๋ถ์ผ์์ ํ์ฌ ๋๋ฆฌ ์ฐ์ด๋ ๋ํ์ ์ธ ๊ธฐ์ ์ค ํ๋์
๋๋ค.
๋ณธ ๋ํ๋ Data-Centric AI์ ๊ด์ ์์ ๋ชจ๋ธ ํ์ฉ์ ๊ฒฝ์ํ๋ ๋ํ์ ๋๋ค. ์ด์ ๋ฐ๋ผ ์ ๊ณต๋๋ ๋ฒ ์ด์ค๋ผ์ธ ์ฝ๋ ์ค ๋ชจ๋ธ ๊ด๋ จ ๋ถ๋ถ์ ๋ณ๊ฒฝํ๋ ๊ฒ์ด ๊ธ์ง๋์ด ์์ต๋๋ค. ๋ณดํต์ ๋ํ์์๋ AI ๋ชจ๋ธ์ ๊ตฌ์กฐ๋ ๊ธฐ์ ์ ์ง์คํ์ง๋ง ๋ชจ๋ธ๋งํผ์ด๋ ์ค์ํ ๋ฐ์ดํฐ์ ๊ด์ ์์ (๋ฐ์ดํฐ ์ ์ , ์ ์, ์ฑ๋ฅ ํ๊ฐ, ํ์ฒ๋ฆฌ ๋ฑ) ๋ค์ํ ๋ฐฉ์์ผ๋ก ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํฅ์์ํค๋ ๋ํ์ ๋๋ค.
๊ฐ๋ฐ ํ๊ฒฝ
- Language : Python
- Environment
- CPU : Intel(R) Xeon(R) Gold 5120
- GPU : Tesla V100-SXM2 32GB x 1
- Framework : PyTorch
- Collaborative Tool : GitHub, Tensorboard, Notion
Leaderboard

์ด๋ฒ ๋ํ์์๋ 10๋ฑ์ด๋ผ๋ ๋์ง๋ ๋ฎ์ง๋ ์์ ๊ฒฐ๊ณผ๋ฅผ ์ป๊ฒ ๋์์ต๋๋ค. ํ์ง๋ง, ๊ทธ ์ ๋ํ์ ๋ด์ฉ๋ค๋ณด๋ค ๋์ฑ ๋ง์ด ๋ฐฐ์ธ ์ ์๋ ๊ธฐํ๊ฐ ๋์์ต๋๋ค. ๋ฐ์ดํฐ ์ค์ฌ์ AI๋ผ๋ ๋ํ์ ํน์ฑ ์ ์ ์ฒ๋ฆฌ, ๋ฐ์ดํฐ ์ ์, ์ธ๋ถ ๋ฐ์ดํฐ ์ฌ์ฉ ๋ฑ ๋ค์ํ ๊ฐ์ค์ ์ค์ ํ๊ณ ์๋๋ฅผ ํด๋ณผ ์ ์์์ต๋๋ค. ํ ๊ฐ์ง ์์ฌ์ด ์ ์ ๋ํ ๊ท์ ์ ๋ชจ๋ธ ์ฝ๋ ๋ณ๊ฒฝ ๊ด๋ฆฌ์ ๋ํ ๋ฌธ์ ๋ก ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๋ถ๋ถ์ด ๊ธ์ง๋ ์ ์ด์์ต๋๋ค. ํด๋น ๋ํ์์ ์ ๋ ์ ์ฒ๋ฆฌ๋ฅผ ์์ฃผ๋ก ์งํํ์ง๋ง ํ
์คํธ์
๋ฐ์ดํฐ์ ์ ์ฒ๋ฆฌ ์์
์ ๊ธ์ง๋์๊ธฐ ๋๋ฌธ์ ์ต์ข
๊ฒฐ๊ณผ์ ์ ์ฉํ์ง๋ ๋ชปํ์ต๋๋ค.
ํ์๋ผ์ธ

ํ๋ก์ ํธ ์ํ ๋ด์ฉ
๋ค๊ตญ์ด ์์์ฆ OCR ํ๋ก์ ํธ์์ F1-Score๋ฅผ ํฅ์์ํค๊ธฐ ์ํด์๋ ์ ํํ Bounding Box๋ฅผ Detectionํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค. ๊ทธ๋ฌ๊ธฐ ์ํด์ ์ ๋ ๋ค์๊ณผ ๊ฐ์ ์๋๋ฅผ ํ์์ต๋๋ค.
- ๋ฐ์ดํฐ ์์ง
- ๋ฐ์ดํฐ ํด๋ ์ง ๋ฐ ๋ผ๋ฒจ๋ง
- ๋ฐ์ดํฐ ํด์๋ ๋ณ๊ฒฝ
- ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ(์ด์งํ ๋ฐ ์ํ ์ ๋ ฌ)
๋ฌธ์ ํด๊ฒฐ
๋ฐ์ดํฐ ์์ง
- ๋ฌธ์ ์ํฉ
- ์ฃผ์ด์ง ๋ฐ์ดํฐ์ ์ ์ค๊ตญ์ด, ์ผ๋ณธ์ด, ๋ฒ ํธ๋จ์ด, ํ๊ตญ์ด, ์ด 4๊ฐ์ง ์ธ์ด๊ฐ 100์ฅ์ฉ์ผ๋ก ์ด๋ฃจ์ด์ง ๋ค๊ตญ์ด ์์์ฆ ๋ฐ์ดํฐ์ ์ด์์ต๋๋ค. ํ์ง๋ง, 400์ฅ์ ๋ฐ์ดํฐ์ ์ ๋ชจ๋ธ์ด ์ถฉ๋ถํ ํ์ต์ ํ๊ธฐ์๋ ๋ถ์กฑํ ๋ฐ์ดํฐ์์ด๋ผ๊ณ ํ๋จํ์์ต๋๋ค.
- ๊ฐ์ค
- ๋ค์ํ ์ธ์ด์์์ ๋ชจ๋ธ์ ์ผ๋ฐํ ์ฑ๋ฅ์ ์ฌ๋ฆฌ๊ธฐ ์ํด์ 4๊ฐ์ง ์ธ์ด ์ธ์ ๋ค๋ฅธ ์ธ์ด์ ๋ฐ์ดํฐ์ ์ ํตํด ํ์ต์ ์งํํ๋ ๊ฒ๋ ๋์์ด ๋ ๊ฒ์ด๋ผ๊ณ ์๊ฐํ์ต๋๋ค.
- ์คํ ์ค๊ณ
- ๊ฒฐ๊ณผ ๋ฐ ๋ถ์
- ์์งํ ๋ฐ์ดํฐ์ ์ ํ์ฉํ์ฌ ํ์ต์ ์งํํ ๊ฒฐ๊ณผ, CORD 200์ฅ๊ณผ SORIE 1,000์ฅ์ ์ถ๊ฐํ์ฌ ํ์ต์ ์งํํ์์ ๋ 0.7890์ผ๋ก ์ฑ๋ฅ์ด ๊ฐ์ฅ ๋๊ฒ ๋์์ต๋๋ค.
- ์์ด ๋ฐ์ดํฐ์ ์ ํ์ต์ ์ถ๊ฐํ์์ ๋, ์ฑ๊ณต์ ์ผ๋ก ์ฑ๋ฅ์ด ํฅ์๋ ๊ฒ์ ๋ณผ ์ ์์์ต๋๋ค.
- ๋จ, WILD ๋ฐ์ดํฐ์ ์ ํ๋ฆฟํ ์ด๋ฏธ์ง๋ ๋ ธ์ด์ฆ๊ฐ ๋๋ฌด ์ฌํ ์ด๋ฏธ์ง๋ก ์ด๋ฃจ์ด์ ธ ์์ด ์ถ๊ฐํ์์ ๋, ์คํ๋ ค ์ฑ๋ฅ์ด ๋จ์ด์ง๋ ๊ฒ์ ํ์ธํ์ฌ ํ์ต ๋ฐ์ดํฐ์ ์์ ์ ์ธํ์์ต๋๋ค.
- ๋ํ, CORD ๋ฐ์ดํฐ์ ์ ๊ฒฝ์ฐ ์ ๊ณต๋ ๊ธฐ๋ณธ ๋ฐ์ดํฐ์ ๊ณผ๋ ๋ฌ๋ฆฌ ์์์ฆ ๊ตฌ๋ถ์ (์ ์ , ์ค์ ๋ฑ)์ ๋ํด Bounding Box Ground Truth๊ฐ ๋๋ฝ๋์ด ์์ด 1,000์ฅ์ ์ถ๊ฐํ์์ ๋ 200์ฅ์ ๋นํด ์ฑ๋ฅ์ด ํ๋ฝํ์์ต๋๋ค.
| ํ์ต ๋ฐ์ดํฐ์ | F1-Score(Test) |
|---|---|
| BaseLine | 0.6886 |
| BaseLine + CORD 200์ฅ | 0.7780 |
| BaseLine + CORD 1,000์ฅ | 0.7738 |
| BaseLine + CORD 200์ฅ + SORIE 1,000์ฅ | 0.7890 |
| BaseLine + CORD 200์ฅ + WILD 1,000์ฅ | 0.7593 |
๋ฐ์ดํฐ ํด๋ ์ง ๋ฐ ๋ผ๋ฒจ๋ง
- ๋ฌธ์ ์ํฉ
- ์ CORD ๋ฐ์ดํฐ์ ์ ์ ์ฑ์ ์ผ๋ก ํ์ธํ ๊ฒฐ๊ณผ, ์์์ฆ์ด ์ ํ์๊ฑฐ๋, ๊ธฐ์ธ์ด์ง ๊ฒฝ์ฐ์ Bounding box๊ฐ ๋ถ์ ํํ๊ฒ ํ์ฑ๋์ด ์์๊ณ ๊ตฌ๋ถ์ (์ ์ , ์ค์ ๋ฑ)์ ๋ํด Bounding Box Ground Truth๊ฐ ๋๋ฝ๋์ด ์๋ค๋ ๋ฌธ์ ๋ฅผ ํ์ธํ์์ต๋๋ค.
- ๊ฐ์ค
- ๋ฐ๋ผ์ ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ฐ์ดํฐ ํด๋ ์ง๊ณผ ์ฌ๋ผ๋ฒจ๋ง์ ์ ์ฉํ ๋ค ํ์ต์ ์งํํ๋ฉด ์ฑ๋ฅ ํฅ์์ด ๋ ๊ฒ์ด๋ผ๊ณ ์๊ฐํ์์ต๋๋ค.
- ์คํ ์ค๊ณ
- CVAT ์ด๋ ธํ ์ด์ ํด์ ํ์ฉํ์ฌ ํ์๋ค๊ณผ ํจ๊ป CORD ๋ฐ์ดํฐ์ ์ ์ง์ ์์ ํ ๋ค ํ์ต์ ์งํํ์์ต๋๋ค.
- ๋ถ์ ํํ Ground Truth Bounding Box ์์

- ๊ตฌ๋ถ์ ์ฌ๋ผ๋ฒจ๋ง ์ ๊ณผ ํ

- ๊ฒฐ๊ณผ ๋ฐ ๋ถ์
- ๊ธฐ๋ณธ ๋ฐ์ดํฐ์ ์ ์์ ๋ CORD ๋ฐ์ดํฐ์ 200์ฅ์ ์ถ๊ฐํ์ฌ ํ์ต์ ์งํํ์์ง๋ง, ๊ธฐ์กด์ ๋ฒ ์คํธ ์ฑ๋ฅ๋ณด๋ค๋ ๋จ์ด์ง ๊ฒฐ๊ณผ๋ฅผ ์ป์์ต๋๋ค.
- ๋ํ, ๊ธฐ์กด ๋ฒ ์คํธ ์ฑ๋ฅ ๋ชจ๋ธ ๊ฐ์ค์น์ ์์ ๋ CORD ๋ฐ์ดํฐ์ ์ ํ์ฉํ์ฌ FineTuning๋ ์งํํด๋ณด์์ง๋ง ์ ์๋ฏธํ ์ฑ๋ฅ ํฅ์์ ์ป์ง ๋ชปํ์ต๋๋ค.
- ์์ ๊ฐ์ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์์ธ์ผ๋ก, ๋์ ์ฑ๋ฅ์ ์ํด์๋ ์ง ์ข์, ์ถฉ๋ถํ ๋ฐ์ดํฐ๊ฐ ํ์ํ์ง๋ง ์์ ๋ CORD ๋ฐ์ดํฐ์ ์ ๊ฒฝ์ง๋ํ๋ผ๋ ํน์ฑ ์ ๋ถ์กฑํ ์๊ฐ์ผ๋ก ์ธํด ์ถฉ๋ถํ ๋ฐ์ดํฐ์์ ์ถฉ์กฑํ์ง ๋ชปํ๊ธฐ ๋๋ฌธ์ด๋ผ๊ณ ์๊ฐํฉ๋๋ค.
์ด๋ฏธ์ง ํด์๋ ๋ณ๊ฒฝ
- ๋ฌธ์ ์ํฉ
- ์ด๊ธฐ BaseLine ๋ชจ๋ธ์ ๊ฒฝ์ฐ ์ ๋ ฅ ์ด๋ฏธ์ง ํฌ๊ธฐ๋ฅผ 1024๋ก ๋ฆฌ์ฌ์ด์ฆํ์ฌ ํ์ตํ๊ณ ์์ด ์๋ณธ ์ด๋ฏธ์ง์ ์ ๋ณด๊ฐ ์์ค๋๋ค๋ ๋ฌธ์ ๊ฐ ์์์ต๋๋ค.
- ๊ฐ์ค
- ๋ฐ๋ผ์ ์๋ณธ ์ด๋ฏธ์ง์ ์ ๋ณด ์์ค์ด ์ต์ํ ํ๋ฉด์ ๋ชจ๋ธ์์์ ์ต์ ์ ์ ๋ ฅ ์ฌ์ด์ฆ๋ฅผ ์ฐพ์ผ๋ฉด ์ฑ๋ฅ ํฅ์์ด ์ด๋ค์ง ๊ฒ์ด๋ผ๊ณ ์๊ฐํ์์ต๋๋ค.
- ์คํ ์ค๊ณ
- ์ ๋ ฅ ์ด๋ฏธ์ง์ ํฌ๊ธฐ๋ฅผ ๋ค์ํ๊ฒ ์กฐ์ ํ ๋ค ํ์ต์ ์งํํ์ฌ ๊ฒฐ๊ณผ๋ฅผ ๋น๊ตํ์์ต๋๋ค.
- ๊ฒฐ๊ณผ ๋ฐ ๋ถ์
- ๊ทธ ๊ฒฐ๊ณผ, 1536์ ์ด๋ฏธ์ง ํฌ๊ธฐ์์ ๊ฐ์ฅ ๋์ ์ฑ๋ฅ ํฅ์์ด ์ด๋ฃจ์ด์ก์ต๋๋ค.

- ๊ทธ ๊ฒฐ๊ณผ, 1536์ ์ด๋ฏธ์ง ํฌ๊ธฐ์์ ๊ฐ์ฅ ๋์ ์ฑ๋ฅ ํฅ์์ด ์ด๋ฃจ์ด์ก์ต๋๋ค.
์ต์ข ๋ฐ์ดํฐ ์์ง ๋ฐ ์ถ๊ฐ
- ๋ฌธ์ ์ํฉ
- ํ๋ก์ ํธ ๋ง๋ฌด๋ฆฌ ๋จ๊ณ์์ ๋ถ์กฑํ ๋ถ๋ถ์ ์ฐพ๊ธฐ ์ํด ์์ธก ๊ฒฐ๊ณผ๋ฅผ ์๊ฐํํ์ฌ ์ ์ฑ์ ์ผ๋ก ํ์ธํ์์ต๋๋ค.
- ๊ทธ ๊ฒฐ๊ณผ, ๋ฒ ํธ๋จ ๋ฐ ํ๊ตญ์ด์ ๊ฐ์ ํน์ ์ธ์ด ๋ชจ์์ ์ ํํ ์ธ์งํ์ง ๋ชปํ๋ค๋ ๋ฌธ์ ๋ฅผ ํ์ธํ์์ต๋๋ค.
- ๊ฐ์ค
- ๋ฐ๋ผ์ ๋ฒ ํธ๋จ, ํ๊ตญ์ด์ ๋ฌธ์ฅ ์ด๋ฏธ์ง ๋ฐ์ดํฐ๋ฅผ ์ถ๊ฐํ์ฌ ์ทจ์ฝ ์ธ์ด์์์ ํน์ง ์ถ์ถ ์ฑ๋ฅ์ ์ฌ๋ฆฌ๋ฉด ์ต์ข Test ์ฑ๋ฅ์ ํฅ์์ผ๋ก ์ด๋ฃจ์ด์ง ๊ฒ์ด๋ผ๊ณ ์๊ฐํ์์ต๋๋ค.
- ์คํ ์ค๊ณ
- Kaggle์ ๋ฒ ํธ๋จ, ํ๊ตญ์ด ๋ฌธ์ฅ ์ด๋ฏธ์ง ๋ฐ์ดํฐ 10,000์ฅ์ ํ์ต์ํจ ๋ค Test ์ฑ๋ฅ์ ๋น๊ตํ์์ต๋๋ค.
- ๋ฒ ํธ๋จ, ํ๊ตญ์ด ๋ฌธ์ฅ ์ด๋ฏธ์ง ๋ฐ์ดํฐ ์์(์ ๋ฒ ํธ๋จ, ์๋ ํ๊ตญ์ด)


- ๊ฒฐ๊ณผ ๋ฐ ๋ถ์
- ์ฑ๋ฅ ๋น๊ต ๊ฒฐ๊ณผ, ์ ์๋ฏธํ ์ฑ๋ฅ ํฅ์์ ๋ณด์ฌ ํด๋น ๋ฐ์ดํฐ ์ ์ ์ต์ข ์ ์ผ๋ก ํ์ต์ ํ์ฉํ์์ต๋๋ค.
| ํ์ต ๋ฐ์ดํฐ์ | F1-Score(Test) |
|---|---|
| ๋ฌธ์ฅ ๋ฐ์ดํฐ X | 0.82 |
| ๋ฌธ์ฅ ๋ฐ์ดํฐ O | 0.88 |
๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ(์ด์งํ)
- ๋ฌธ์ ์ํฉ
- Train ๋ฐ์ดํฐ์ Test ๋ฐ์ดํฐ์ ๊ทธ๋ฆผ์, ์กฐ๋ช , ๊ตฌ๊ฒจ์ง ๋ฑ์ ์ฐจ์ด๋ก ์ธํด Test ๋ฐ์ดํฐ์ ์์ ์ ํํ ๊ธ์ ์์ญ ์ถ์ถ์ด ์๋๋ ๋ฌธ์ ๋ฅผ ํ์ธํ์์ต๋๋ค.
- ๊ฐ์ค
- ์์์ฆ ์ด๋ฏธ์ง๋ ๋์ฒด๋ก ํฐ ๋ฐฐ๊ฒฝ ์์ ๊ฒ์ ๊ธ์จ๋ก ์ ๋ณด๊ฐ ํ์๋์ด ์์ด ๋ช ์ ๋๋น ๋น๊ต์ ๋๋ ทํฉ๋๋ค.
- ๋ฐ๋ผ์ ์ด๋ฏธ์ง ์ด์งํ ์ ์ฒ๋ฆฌ๋ฅผ ํตํด Train ๋ฐ์ดํฐ์ Test ๋ฐ์ดํฐ์ ๋ถํฌ ์ฐจ์ด๋ฅผ ์ค์ด๋ฉด ์ฑ๋ฅ์ด ํฅ์๋ ๊ฒ์ด๋ผ๊ณ ์๊ฐํ์์ต๋๋ค.
- ์คํ ์ค๊ณ
- ๋ ธ์ด์ฆ ์ ๊ฑฐ ๋ฐ Adaptive Thresholding์ ํ์ฉํด ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ๋ฅผ ์งํํ๊ณ ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ๋น๊ต ๋ถ์ํ์์ต๋๋ค.
- ์๋ณธ ์ด๋ฏธ์ง(์ผ)์ ์ด์งํ ์ ์ฒ๋ฆฌ(์ค)๋ฅผ ์ ์ฉํ ์ด๋ฏธ์ง

- ๊ฒฐ๊ณผ ๋ถ์
- ์ด์งํ ์ ์ฒ๋ฆฌ๋ฅผ ์ ์ฉํ ๊ฒฝ์ฐ Validation ๋ฐ์ดํฐ์ ์์ F1-Score ๊ธฐ์ค 0.69์์ 0.75๋ก 8.7%์ ์ฑ๋ฅ ํฅ์์ ํ์ธํ์์ต๋๋ค.
- ํ์ง๋ง, ๋ํ ๊ท์ ์ ํ ์คํธ ๋ฐ์ดํฐ์ ์ ์ ์ฒ๋ฆฌ๋ฅผ ์ ์ฉํ๋ ๊ฒ์ด ๊ธ์ง๋์ด ์์ด ์ดํ ๋ณธ ๋ํ์ ์ ์ฉ์ ํ์ง ๋ชปํ์์ต๋๋ค.
๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ(์ํ์ ๋ ฌ)
- ๋ฌธ์ ์ํฉ
- Train ๋ฐ์ดํฐ์ Test ๋ฐ์ดํฐ์ ๊ธฐ์ธ์ด์ง ๊ฐ๋ ์ฐจ์ด๋ก ์ธํด Test ๋ฐ์ดํฐ์ ์์ ์ ํํ ๊ธ์ ์์ญ ์ถ์ถ์ด ์๋๋ ๋ฌธ์ ๋ฅผ ํ์ธํ์์ต๋๋ค.
- ๊ฐ์ค
- ์์์ฆ ์ด๋ฏธ์ง๋ ์ฃผ๋ก ์ง์ฌ๊ฐํ ํํ์ ์ธ๊ณฝ ์ ๋ณด๋ฅผ ์ง๋๊ณ ์์ต๋๋ค.
- ์ด๋ฌํ ๊ตฌ์กฐ์ ํน์ฑ์ ํ์ฉํด ๊ธฐ์ธ์ด์ง ์์์ฆ ์ด๋ฏธ์ง์ ๊ฐ๋๋ฅผ ๋ฐ๋ก ์ก์ Train ๋ฐ์ดํฐ์ Test ๋ฐ์ดํฐ์ ๋ถํฌ ์ฐจ์ด๋ฅผ ์ค์ด๋ฉด ์ฑ๋ฅ ํฅ์์ผ๋ก ์ด๋ฃจ์ด ์ง ๊ฒ์ด๋ผ๊ณ ์๊ฐํ์ต๋๋ค.
- ์คํ ์ค๊ณ
- Gaussian ํํฐ๋ฅผ ํ์ฉํ Noise ์ ๊ฑฐ ๋ฐ Canny edge detection์ ํ์ฉํ์ฌ ์์์ฆ์ ์ธ๊ณฝ์ ์ ๋ณด๋ฅผ ๊ฒ์ถํ์์ต๋๋ค.
- ๊ธฐ์ธ์ด์ง ๊ฐ๋๋ฅผ ์ถ์ ํ๊ธฐ ์ํด ๊ฐ๋ ๋ณ Histogram ๋ถํฌ๋ฅผ ํ์ฉํ์์ต๋๋ค.
- ์ดํ Skew Correction ๊ณผ์ ์์ ์ด๋ฏธ์ง์ ์ธ๋ก ๋ฐ ๊ฐ๋ก ๋ฐฉํฅ์ ํ์คํ ๊ทธ๋จ ๊ฐ ์ฐจ์ด๊ฐ ์ต๋ํ๋๋๋ก ์ต์ ์ ํ์ ๊ฐ๋๋ฅผ ์ฐพ์ ์ ๋ ฌ์ ์งํํ์์ต๋๋ค.
- Edge Detection ๊ณผ์ . ์๋ณธ ์ด๋ฏธ์ง(์ผ), ๋
ธ์ด์ฆ ์ ๊ฑฐ ์ด๋ฏธ์ง(์ค์), Edge ์ด๋ฏธ์ง(์ค)

- Skew Correction ๊ณผ์ . Edge ์ด๋ฏธ์ง(์ผ), Edge์ ์ต์ ๊ฐ๋(์ค์), ์ํ ์ ๋ ฌ๋ ์ด๋ฏธ์ง(์ค)

- ๊ฒฐ๊ณผ ๋ฐ ๋ถ์
- ๋ณธ ์ฐ๊ตฌ์์ ์ ์ฉํ Skew Correction ๊ธฐ๋ฒ์ ๋ค์ํ ๊ฐ๋์์ ์ดฌ์๋ ์์์ฆ ์ด๋ฏธ์ง์์๋ ๋์ ์ ๋ ฌ ์ ํ๋๋ฅผ ๋ณด์์ผ๋ฉฐ, OCR์ฑ๋ฅ ํฅ์์ ๋ํ ๊ฐ๋ฅ์ฑ์ ํ์ธํ ์ ์์์ต๋๋ค.
- ํ์ง๋ง, ๋ํ ๊ท์ ์ ํ ์คํธ ๋ฐ์ดํฐ์ ์ ์ ์ฒ๋ฆฌ๋ฅผ ์ ์ฉํ๋ ๊ฒ์ ๊ธ์ง๋์ด ์๊ธฐ ๋๋ฌธ์ ์ถํ ์ ์ฉ์ ํ์ง ์์์ต๋๋ค.
๊ฒฐ๋ก
์ต์ข ์ ์ผ๋ก ๋ชจ๋ธ์ ๊ตฌ์กฐ์ ๊ธฐ๋ฒ์ ๋ฐ๊พธ์ง ์๊ณ , ์ค์ง ๋ฐ์ดํฐ ์์ง, ๋ฐ์ดํฐ ์ฆ๊ฐ, ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋ ๋ค์ ํตํด ๋ค๊ตญ์ด ์์์ฆ OCR Task F1-Score ์ฑ๋ฅ์ ์ฌ๋ฆด ์ ์์์ต๋๋ค.
์ธ๋ถ ๋ฐ์ดํฐ์ ์ ์์งํ๊ณ ํด๋ ์ง ๋ฐ ์ ์ฒ๋ฆฌ๋ฅผ ์ํํ์๊ณ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ์๊ฐํํ์ฌ ๋ฌธ์ ๋ฅผ ํ์ ํ์์ต๋๋ค.
ํนํ ๋ํ ๊ท์ ์ ์ฌ์ฉํ์ง ๋ชปํ์ง๋ง OCR Task์์ ์ ์ ํ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ(๋ฐ์ดํฐ ์ด์งํ ๋ฐ ์ํ ์ ๋ ฌ ๊ธฐ๋ฒ)๋ฅผ ํตํด ์ ์๋ฏธํ๊ฒ ์ฑ๋ฅ์ ํฅ์์ํฌ ์ ์๋ ๊ธฐ๋ฒ๋ค์ ๋ฐ๊ฒฌํ์ต๋๋ค.
๋ง์ง๋ง์ผ๋ก, ์ธ์ด ๊ฒ์ถ์ ํนํ๋ ๋ชจ๋ธ์ ๊ฒฐ๊ณผ์ ๊ตฌ๋ถ์ (์ ์ ๋ฐ ์ค์ )์ ์ ๊ฒ์ถํ๋ ๋ชจ๋ธ์ ๊ฒฐ๊ณผ๋ฅผ ์์๋ธํ์ฌ ์ต์ข 0.9034๊ฒฐ๊ณผ๋ฅผ ์ป์ด BaseLine ๊ธฐ์ค 21.5%์ ์ฑ๋ฅ ํฅ์์ ์ด๋์ด ๋์ต๋๋ค.
- ์ต์ข ๊ฒฐ๊ณผ
| Data-Centric AI | F1-Score(Test) |
|---|---|
| BaseLine | 0.6886 |
| Ours Data-Centric AI | 0.9034 |