OCR Data Centric

#naverboostcamp #ai_tech #computer_vision #data_centric #ocr

ํ”„๋กœ์ ํŠธ ๊ฐœ์š”


๋Œ€ํšŒ ์†Œ๊ฐœ

Pasted_image_20250215211658.png
์นด๋ฉ”๋ผ๋กœ ์˜์ˆ˜์ฆ์„ ์ธ์‹ํ•  ๊ฒฝ์šฐ ์ž๋™์œผ๋กœ ์˜์ˆ˜์ฆ ๋‚ด์šฉ์ด ์ž…๋ ฅ๋˜๋Š” ์–ดํ”Œ๋ฆฌ์ผ€์ด์…˜์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ด์ฒ˜๋Ÿผ OCR (Optical Character Recognition) ๊ธฐ์ˆ ์€ ์‚ฌ๋žŒ์ด ์ง์ ‘ ์“ฐ๊ฑฐ๋‚˜ ์ด๋ฏธ์ง€ ์†์— ์žˆ๋Š” ๋ฌธ์ž๋ฅผ ์–ป์€ ๋‹ค์Œ ์ด๋ฅผ ์ปดํ“จํ„ฐ๊ฐ€ ์ธ์‹ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ๊ธฐ์ˆ ๋กœ, ์ปดํ“จํ„ฐ ๋น„์ „ ๋ถ„์•ผ์—์„œ ํ˜„์žฌ ๋„๋ฆฌ ์“ฐ์ด๋Š” ๋Œ€ํ‘œ์ ์ธ ๊ธฐ์ˆ  ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค.

๋ณธ ๋Œ€ํšŒ๋Š” Data-Centric AI์˜ ๊ด€์ ์—์„œ ๋ชจ๋ธ ํ™œ์šฉ์„ ๊ฒฝ์Ÿํ•˜๋Š” ๋Œ€ํšŒ์ž…๋‹ˆ๋‹ค. ์ด์— ๋”ฐ๋ผ ์ œ๊ณต๋˜๋Š” ๋ฒ ์ด์Šค๋ผ์ธ ์ฝ”๋“œ ์ค‘ ๋ชจ๋ธ ๊ด€๋ จ ๋ถ€๋ถ„์„ ๋ณ€๊ฒฝํ•˜๋Š” ๊ฒƒ์ด ๊ธˆ์ง€๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋ณดํ†ต์˜ ๋Œ€ํšŒ์—์„œ๋Š” AI ๋ชจ๋ธ์˜ ๊ตฌ์กฐ๋‚˜ ๊ธฐ์ˆ ์— ์ง‘์ค‘ํ•˜์ง€๋งŒ ๋ชจ๋ธ๋งŒํผ์ด๋‚˜ ์ค‘์š”ํ•œ ๋ฐ์ดํ„ฐ์˜ ๊ด€์ ์—์„œ (๋ฐ์ดํ„ฐ ์ •์ œ, ์ œ์ž‘, ์„ฑ๋Šฅ ํ‰๊ฐ€, ํ›„์ฒ˜๋ฆฌ ๋“ฑ) ๋‹ค์–‘ํ•œ ๋ฐฉ์‹์œผ๋กœ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๋Œ€ํšŒ์ž…๋‹ˆ๋‹ค.


๊ฐœ๋ฐœ ํ™˜๊ฒฝ


Leaderboard

Pasted image 20250216013100.png
์ด๋ฒˆ ๋Œ€ํšŒ์—์„œ๋Š” 10๋“ฑ์ด๋ผ๋Š” ๋†’์ง€๋„ ๋‚ฎ์ง€๋„ ์•Š์€ ๊ฒฐ๊ณผ๋ฅผ ์–ป๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ, ๊ทธ ์ „ ๋Œ€ํšŒ์˜ ๋‚ด์šฉ๋“ค๋ณด๋‹ค ๋”์šฑ ๋งŽ์ด ๋ฐฐ์šธ ์ˆ˜ ์žˆ๋Š” ๊ธฐํšŒ๊ฐ€ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ์ค‘์‹ฌ์˜ AI๋ผ๋Š” ๋Œ€ํšŒ์˜ ํŠน์„ฑ ์ƒ ์ „์ฒ˜๋ฆฌ, ๋ฐ์ดํ„ฐ ์ œ์ž‘, ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ ์‚ฌ์šฉ ๋“ฑ ๋‹ค์–‘ํ•œ ๊ฐ€์„ค์„ ์„ค์ •ํ•˜๊ณ  ์‹œ๋„๋ฅผ ํ•ด๋ณผ ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ํ•œ ๊ฐ€์ง€ ์•„์‰ฌ์šด ์ ์€ ๋Œ€ํšŒ ๊ทœ์ •์ƒ ๋ชจ๋ธ ์ฝ”๋“œ ๋ณ€๊ฒฝ ๊ด€๋ฆฌ์— ๋Œ€ํ•œ ๋ฌธ์ œ๋กœ ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ ๋ถ€๋ถ„์ด ๊ธˆ์ง€๋œ ์ ์ด์—ˆ์Šต๋‹ˆ๋‹ค. ํ•ด๋‹น ๋Œ€ํšŒ์—์„œ ์ €๋Š” ์ „์ฒ˜๋ฆฌ๋ฅผ ์œ„์ฃผ๋กœ ์ง„ํ–‰ํ–ˆ์ง€๋งŒ ํ…Œ์ŠคํŠธ์…‹ ๋ฐ์ดํ„ฐ์˜ ์ „์ฒ˜๋ฆฌ ์ž‘์—…์€ ๊ธˆ์ง€๋˜์—ˆ๊ธฐ ๋•Œ๋ฌธ์— ์ตœ์ข… ๊ฒฐ๊ณผ์— ์ ์šฉํ•˜์ง€๋Š” ๋ชปํ–ˆ์Šต๋‹ˆ๋‹ค.


ํƒ€์ž„๋ผ์ธ

Pasted_image_20241125114625.png


ํ”„๋กœ์ ํŠธ ์ˆ˜ํ–‰ ๋‚ด์šฉ

๋‹ค๊ตญ์–ด ์˜์ˆ˜์ฆ OCR ํ”„๋กœ์ ํŠธ์—์„œ F1-Score๋ฅผ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ •ํ™•ํ•œ Bounding Box๋ฅผ Detectionํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๊ธฐ ์œ„ํ•ด์„œ ์ €๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์‹œ๋„๋ฅผ ํ•˜์˜€์Šต๋‹ˆ๋‹ค.


๋ฌธ์ œ ํ•ด๊ฒฐ

๋ฐ์ดํ„ฐ ์ˆ˜์ง‘

ํ•™์Šต ๋ฐ์ดํ„ฐ์…‹ F1-Score(Test)
BaseLine 0.6886
BaseLine + CORD 200์žฅ 0.7780
BaseLine + CORD 1,000์žฅ 0.7738
BaseLine + CORD 200์žฅ + SORIE 1,000์žฅ 0.7890
BaseLine + CORD 200์žฅ + WILD 1,000์žฅ 0.7593

๋ฐ์ดํ„ฐ ํด๋ Œ์ง• ๋ฐ ๋ผ๋ฒจ๋ง

์ด๋ฏธ์ง€ ํ•ด์ƒ๋„ ๋ณ€๊ฒฝ

์ตœ์ข… ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๋ฐ ์ถ”๊ฐ€

ํ•™์Šต ๋ฐ์ดํ„ฐ์…‹ F1-Score(Test)
๋ฌธ์žฅ ๋ฐ์ดํ„ฐ X 0.82
๋ฌธ์žฅ ๋ฐ์ดํ„ฐ O 0.88

๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ(์ด์ง„ํ™”)

๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ(์ˆ˜ํ‰์ •๋ ฌ)


๊ฒฐ๋ก 

์ตœ์ข…์ ์œผ๋กœ ๋ชจ๋ธ์˜ ๊ตฌ์กฐ์™€ ๊ธฐ๋ฒ•์„ ๋ฐ”๊พธ์ง€ ์•Š๊ณ , ์˜ค์ง ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘, ๋ฐ์ดํ„ฐ ์ฆ๊ฐ•, ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹ ๋“ค์„ ํ†ตํ•ด ๋‹ค๊ตญ์–ด ์˜์ˆ˜์ฆ OCR Task F1-Score ์„ฑ๋Šฅ์„ ์˜ฌ๋ฆด ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค.

์™ธ๋ถ€ ๋ฐ์ดํ„ฐ์…‹์„ ์ˆ˜์ง‘ํ•˜๊ณ  ํด๋ Œ์ง• ๋ฐ ์ „์ฒ˜๋ฆฌ๋ฅผ ์ˆ˜ํ–‰ํ•˜์˜€๊ณ  ์˜ˆ์ธก ๊ฒฐ๊ณผ๋ฅผ ์‹œ๊ฐํ™”ํ•˜์—ฌ ๋ฌธ์ œ๋ฅผ ํŒŒ์•…ํ•˜์˜€์Šต๋‹ˆ๋‹ค.

ํŠนํžˆ ๋Œ€ํšŒ ๊ทœ์ •์ƒ ์‚ฌ์šฉํ•˜์ง„ ๋ชปํ–ˆ์ง€๋งŒ OCR Task์—์„œ ์ ์ ˆํ•œ ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ(๋ฐ์ดํ„ฐ ์ด์ง„ํ™” ๋ฐ ์ˆ˜ํ‰ ์ •๋ ฌ ๊ธฐ๋ฒ•)๋ฅผ ํ†ตํ•ด ์œ ์˜๋ฏธํ•˜๊ฒŒ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ๋Š” ๊ธฐ๋ฒ•๋“ค์„ ๋ฐœ๊ฒฌํ–ˆ์Šต๋‹ˆ๋‹ค.

๋งˆ์ง€๋ง‰์œผ๋กœ, ์–ธ์–ด ๊ฒ€์ถœ์— ํŠนํ™”๋œ ๋ชจ๋ธ์˜ ๊ฒฐ๊ณผ์™€ ๊ตฌ๋ถ„์„ (์ ์„  ๋ฐ ์‹ค์„ )์„ ์ž˜ ๊ฒ€์ถœํ•˜๋Š” ๋ชจ๋ธ์˜ ๊ฒฐ๊ณผ๋ฅผ ์•™์ƒ๋ธ”ํ•˜์—ฌ ์ตœ์ข… 0.9034๊ฒฐ๊ณผ๋ฅผ ์–ป์–ด BaseLine ๊ธฐ์ค€ 21.5%์˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ์ด๋Œ์–ด ๋ƒˆ์Šต๋‹ˆ๋‹ค.

Data-Centric AI F1-Score(Test)
BaseLine 0.6886
Ours Data-Centric AI 0.9034