출판사별 에이치티엠엘 구조 적응형 학술 논문 그림·캡션 추출 시스템
3, 2025·,,,·
0 분 읽기
이웅희
김인섭
이준형
이찬우
초록
출판사별로 상이한 HTML 구조를 가진 학술 논문 페이지에서, 출판사 구조에 적응적으로
figure 이미지와 그에 대응하는 caption, 그리고 본문 내에서 해당 caption을 언급하는
문장을 함께 추출하는 시스템. 대규모 문헌 조사 및 메타데이터 파이프라인 구축에
활용 가능하다.
출판유형
발행기관
소프트웨어 저작권 등록 · 한국저작권위원회