이 누리집은 대한민국 공식 전자정부 누리집입니다.

한컴, PDF 추출 핵심 기술 글로벌 오픈소스로 공개

2025.09.18

2025..09.17

ⓒ바이라인네트워크

By

최가람

한글과컴퓨터(이하 한컴)는 인공지능(AI) 학습 및 활용 과정에서 PDF 문서 데이터 처리 병목 현상을 해소할 핵심 기술을 글로벌 오픈소스로 공개했다고 17일 밝혔다.

한컴이 공개한 ‘오픈데이터로더 PDF(OpenDataLoader PDF)’는 오랜 기간 축적한 한컴의 문서 처리 기술력을 바탕으로 개발한 PDF 데이터 추출 엔진이다.

회사에 따르면 PDF는 전 세계적으로 AI 학습에 가장 널리 사용되는 문서 포맷이지만, 복잡한 내부 구조 때문에 학습용 데이터 추출이 쉽지 않다. 이로 인해 ‘데이터 감옥’이라 불릴 만큼 AI 개발 과정에서 큰 제약이 따랐다.

(후략)

[원본기사 :

https://byline.network/2025/09/91711/

]

댓글 0

첫 댓글을 작성해보세요!

댓글 작성

댓글을 작성하려면 게시글 작성 시 입력한 이메일과 패스워드를 입력해주세요.