출판사별 에이치티엠엘 구조 적응형 학술 논문 그림·캡션 추출 시스템

3, 2025·
이웅희
,
김인섭
,
이준형
,
이찬우
· 0 분 읽기
초록
출판사별로 상이한 HTML 구조를 가진 학술 논문 페이지에서, 출판사 구조에 적응적으로 figure 이미지와 그에 대응하는 caption, 그리고 본문 내에서 해당 caption을 언급하는 문장을 함께 추출하는 시스템. 대규모 문헌 조사 및 메타데이터 파이프라인 구축에 활용 가능하다.
출판유형
발행기관
소프트웨어 저작권 등록 · 한국저작권위원회
publications