hwp olefile 글자와 수식의 위치값?

user272 · 8월 27, 2024, 7:03오전

안녕하세요, 한글문서파일형식_5.0_revision1.3.pdf 파일을 보면서 한글 분석 처리를 해보고 있습니다.

HWPTAG_PARA_TEXT 를 통해 텍스트를 가져오고,
HWPTAG_EQEDIT 를 통해 수식을 가져오고 있습니다.

이미지에서 처럼 한줄에 한글, 수식이 있는 경우
텍스트 따로, 수식 따로 추출이 되어 형태 유지가 되지 않는데요…

추출한 내역을 순서대로 보여지려면 어떻게 하는게 좋을까요?

GetPos 처럼 위치정보라도 구할 수 있으면 정렬하면 좋겠는데요…

이런 부분에 도움 주실 사항 있으실까요?
확인 부탁 드립니다.

감사합니다.

jhbang · 8월 27, 2024, 7:56오전

안녕하세요.

문서 파일의 데이터 모델를 가지고 뷰(View)를 만들기 위한 레이아웃을 생성하는 로직을 고민하시는 것 같습니다.

한글은 레이아웃 모델을 생성하는 역할을 레이아웃 엔진이 하는데요.
레이아웃 엔진은 모델 정보(페이지 속성, 폰트, 글자 속성, 문단 속성, 도형 간의 배치 속성 등)를 바탕으로 복합적인 연산을 통해 쪽, 글자, 문단, 도형 등의 배치 정보들을 만들어냅니다.

모델 데이터에는 위치 정보는 없기 때문에
뷰어를 만드신다면 한글 레이아웃 엔진이 하는 역할의 로직을 구현하셔야 합니다.

충분한 도움을 드리지 못해 죄송합니다.

감사합니다.

글		댓글	조회수
한글파일 내의 텍스트/이미지의 위치 정보(x,y 좌표) 및 값을 얻고 싶습니다 한글 컨트롤	0	1717	10월 21, 2021
텍스트와 표/그림/수식을 각각 뽑아 위치 일치 시키기 한글 컨트롤	2	1020	10월 12, 2023
<hp:lineseg textpos="0" ..> textpos 의 기준이 궁금합니다. 한글 오토메이션	2	101	5월 7, 2025
한글 문서에서 문장, 테이블, 이미지 파싱하기 한컴 통합문서뷰어	1	720	2월 6, 2025
표에 대한 글자 텍스트 데이터 추출에 관해 문의드립니다. 한글 오토메이션	1	468	6월 13, 2024