한글 고정폭 빈칸 읽기

파이썬으로 한글 파일을 읽어 올 때 고정폭 빈칸이 읽히지 않는데, 어떻게 된 일인지 알 수 있을까요?
예를 들면 '서기[고정폭빈칸]4300년’의 경우 고정폭빈칸이 존재하지 않는 것처럼 '서기4300년’처럼 읽힙니다.

안녕하세요.

한글 파일을 읽는 동작을 구현한 API를 코멘트해주시면 답변 남기겠습니다.

감사합니다.

관심주셔서 감사합니다. 저는 한글 파일을 읽어올 때 주로 표를 읽어오고요. 표를 읽어오는 방식은 표의 모든 셀에 셀주소를 필드이름으로 넣은 후 필드 이름과 값을 아래와 같이 쌍(dict)으로 읽어와서 dataframe으로 변환해서 작업하고 있습니다.
field_list = hwp.GetFieldList(Number=1) #문자열
field_values = hwp.GetFieldText(field_list)
문자열의 공백은 내가 작업하기 위해서도 필요해서 남겨두고 있으며 다만, 이과정에서 'u\3000’은 한글파일 작성과정에서 엑셀데이터를 읽어올때 생긴 비정상현상이라서 삭제하고 있습니다.
만약 'u\3000’을 삭제하면서 생긴 현상이라면 이해할 수 있으나 그런 건 아닌 것 같더라고요.

GetFieldText 함수는 컨트롤 코드값은 제외시켜 텍스트를 반환하도록 구현되어 있습니다.
예를 들어, [표], [누름틀], [고정폭 빈 칸], [묶은 빈 칸] 등 조판부호 상으로 표시되는 문자들은
컨트롤 코드에 해당합니다.

서기[고정폭빈칸]4300년 → 서기4300년 반환된 것은 해당 함수의 구현 동작입니다. :thinking:

감사합니다.

답변에 감사드립니다. 그 외의 공백 문자들은 모두 가져오는데 그 부분만 안되는군요. getfieldText 옵션으로 컨트롤키를 포함하여 가져올 수는 없습니까? 그렇지 않으면 고정폭빈칸을 읽어오기 위해 전부 gettext로 읽어오는 방법밖에 없나요?

현재 제공하는 API(GetFieldText, GetText, GetTextFile) 중에는 텍스트를 컨트롤을 포함해서 가져올 방법이 없네요. :sob:

답변에 감사드립니다.
한 가지 추가 질문 드리면 고정형 빈칸의 경우 복사해서 엑셀에 붙여넣어도 나타나지 않지만 누름틀의 경우 '입력할 내용의 안내문’을 간단히 #기호를 넣어 테스트해보면 인쇄하거나 pdf로 변환할때는 그 부분이 나타나지 않지만 복사해서 엑셀에 붙여 넣으면 그대로 나타나는데 실제 API에서도 복사해서 블럭을 읽어오면 가능할까요? 제가 작업할 때 한글 파일에서 눈으로 확인가능하면서도 인쇄하거나 pdf파일에 나타나지 않는 표시가 필요해서 그럽니다. 또 다른 대안이 있으면 알려주시기 바라고요.

안녕하세요.

① 누름틀의 안내문

인쇄나 PDF 변환시 출력이 안되는 것은 인쇄 옵션과 관련 있어서 의도하신 동작의 방법으로 활용하기는 어려울 것 같습니다.
인쇄 > 확장 > 선택 사항 > 누름틀 안내문

② 한글 파일 작업에서 시각적으로 확인은 가능하나 인쇄나 PDF변환시 표시되지 않는 영역

한글 2024에서는 컨텐츠가 아닌 추가 정보를 저장할 수 있도록 메타태그 기능(≒해시태그)이 추가되었는데요.
상세
본문이나 개체에 태그 정보를 추가가 가능하며 이 정보를 태그 작업창을 통해 확인이 가능함



또한 이 정보는 오토메이션 API를 통해 추가/삭제/변경/추출/이동 이 가능합니다.
(관련된 API는 별도로 요청 시 남겨드리겠습니다.)

※ 문체부에서는 보도자료에 태그정보를 추가하여 문서를 데이터화하는데 활용하고 있음

@ ajjicamp1 의도한 질문의 답변이 되었는지 모르겠습니다. :thinking:
추가 문의가 있으시면 다시 코멘트 부탁드립니다.

감사합니다.