hwp olefile 글자와 수식의 위치값?

안녕하세요, 한글문서파일형식_5.0_revision1.3.pdf 파일을 보면서 한글 분석 처리를 해보고 있습니다.

HWPTAG_PARA_TEXT 를 통해 텍스트를 가져오고,
HWPTAG_EQEDIT 를 통해 수식을 가져오고 있습니다.

이미지에서 처럼 한줄에 한글, 수식이 있는 경우
텍스트 따로, 수식 따로 추출이 되어 형태 유지가 되지 않는데요…

추출한 내역을 순서대로 보여지려면 어떻게 하는게 좋을까요?

GetPos 처럼 위치정보라도 구할 수 있으면 정렬하면 좋겠는데요…

이런 부분에 도움 주실 사항 있으실까요?
확인 부탁 드립니다.

감사합니다.

1개의 좋아요

안녕하세요.

문서 파일의 데이터 모델를 가지고 뷰(View)를 만들기 위한 레이아웃을 생성하는 로직을 고민하시는 것 같습니다.

한글은 레이아웃 모델을 생성하는 역할을 레이아웃 엔진이 하는데요.
레이아웃 엔진은 모델 정보(페이지 속성, 폰트, 글자 속성, 문단 속성, 도형 간의 배치 속성 등)를 바탕으로 복합적인 연산을 통해 쪽, 글자, 문단, 도형 등의 배치 정보들을 만들어냅니다.

모델 데이터에는 위치 정보는 없기 때문에
뷰어를 만드신다면 한글 레이아웃 엔진이 하는 역할의 로직을 구현하셔야 합니다.

충분한 도움을 드리지 못해 죄송합니다.

감사합니다.

2개의 좋아요