'AI 혁신'이라지만…딥시크 OCR, 판단은 시기상조

신규 AI 모델…'문서 10배 압축·97% 정확도' 강조
국내 업계 "정확도·성능 검증 필요…속단 일러"
"AI 자립 겨냥한 GPU 절감 전략" 분석도

입력 : 2025-10-24 오후 2:06:33
[뉴스토마토 박재연 기자] 중국 인공지능(AI) 기업 딥시크(DeepSeek)가 이미지 기반 문서를 10배 이상 압축할 수 있는 새로운 광학문자인식(OCR) 기술을 공개했습니다. 그래픽처리장치(GPU) 사용량을 대폭 줄이면서도 원본 정보의 97%를 유지할 수 있다고 강조하며 'AI 문서 처리 혁신'을 내세웠는데요. 다만 국내 업계에서는 기술적 완성도와 재현 가능성 검증이 필요하다며 신중한 평가를 내놓고 있습니다. 
 
딥시크는 이달 공개한 AI 모델 '딥시크-OCR'에 기존 텍스트 기반 인식 대신 문서 이미지를 시각적 특징 단위로 압축·인코딩하는 방식을 적용했습니다. 긴 문서나 대용량 데이터를 보다 적은 연산으로 처리할 수 있어 거대언어모델(LLM)의 학습 효율을 높일 수 있다는 설명입니다. 회사는 지난 20일 이 모델을 오픈소스 플랫폼 '허깅페이스(Hugging Face)'와 '깃허브(GitHub)'에 공개하며 "GPU 메모리 소모를 최소화하면서도 원본 정보의 97%를 보존하는 것이 핵심"이라고 밝혔습니다. 
 
깃허브에 업로드된 딥시크-OCR 오픈소스. (이미지=깃허브)
 
다만 국내 업계에서는 '혁신이라기엔 아직 판단이 이르다'는 취지의 신중론이 제기됩니다. 딥시크가 제시한 정확도(97%)는 국내 OCR 솔루션의 인식률(97~99%)과 비슷하거나 낮은 수준인데요. 24일 국내 한 AI 업계 관계자는 "압축률과 GPU 효율성 개선은 분명 흥미로운 시도지만, OCR의 핵심은 인식 안정성과 언어별 문맥 정확도에 있다"고 설명했습니다. 뿐만 아니라 딥시크가 공개한 공식 리포트에 '압축 비율이 높아질수록 정확도가 떨어질 수 있다'는 내용이 명시돼 있습니다. 실제로 압축률을 20배로 높일 경우 OCR 정확도는 약 60% 수준으로 낮아지는데요. 일부 외신에서도 "이는 바람직하지 않은 수치"라고 지적한 바 있습니다. 
 
또한 현재 공개된 리포트만으로는 학습 데이터셋, 평가 지표 등이 구체적으로 제시되지 않아 기술 완성도를 가늠하기 어렵다는 지적도 나옵니다. 또 다른 AI 업계 관계자는 "논문과 코드가 공개된 지 불과 며칠밖에 안 된 만큼, 실제 기업 단위에서 수백만 장의 문서를 돌려봤을 때 동일한 성능이 나오는지는 아직 검증되지 않았다"며 "딥시크가 주장한 97% 정확도 역시 자체 실험 결과일 뿐, 아직 다른 사용자들이 동일한 결과를 재현했다는 보고는 없는 상황에서 현 단계에서 완성도를 단정하긴 이르다"고 덧붙였는데요. 
 
일각에서는 이번 기술 개발의 배경에 '미국발 GPU·AI 인프라 통제'가 있다는 분석도 나옵니다. 미국의 기술 제재 아래서 자국 내 '프런티어 모델' 개발 기반을 확보하려는 전략적 행보라는 주장인데요. 업계 관계자는 "이번 딥시크의 신제품 발표는 GPU 사용량을 줄여 미국의 통제권에서 벗어나려는 기술적 움직임으로 볼 수 있다"고 짚었습니다. 
 
결국 딥시크-OCR은 'AI 문서 처리 혁신'의 가능성을 보여주는 흥미로운 시도임에는 분명하지만 추가 검증이 필요한 기술로 보입니다. GPU 절감을 앞세운 이번 시도가 진정한 기술 혁신으로 이어질지, 혹은 일시적 화제에 그칠지는 향후 실제 적용 결과가 가를 전망입니다. 
 
딥시크 로고. (이미지=딥시크 공식 홈페이지)
 
박재연 기자 damgomi@etomato.com
 
ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지
박재연 기자
SNS 계정 : 메일 트윗터