지금까지 만든 코드입니다
객체생성 > open > initscan > gettext로 검사가 전부입니다
var hwp = Activator.CreateInstance(Type.GetTypeFromProgID(“HWPFrame.HwpObject”));
hwp.Open(filePath, ext, null);
hwp.InitScan(“”, 0x0077, 0, 0, -1, -1);
while (true){
string text = “”;
int ret;
ret = hwp.GetText(out text);
if (ret == 0) //마지막줄이면 끝냄
{
break;
}
else
{
Debug.WriteLine(text);
}
}
궁금한점이 두가지 있습니다
-첫번째는 매뉴얼에 GetText의 반환값에서 0은 텍스트 정보 없음 / 1은 리스트의 끝이라고 되어 있는데요
한글파일 처음부터 마지막까지, 모든 내용을 검색하고 있는데 0으로 해야 되나요, 1로 해야 되나요?
0과 1의 의미 차이가 궁금합니다.
-두번째는 법조문 형식으로 된 한글파일이 검색되지 않는다는 것입니다.
리턴값은 아래와 같습니다.
0 = 텍스트 정보 없음.
1 = 리스트의 끝.
2 = 일반 텍스트.
3 = 다음 문단.
4 = 제어문자 내부로 들어감.
5 = 제어 문자를 빠져 나옴.
101 = 초기화 안됨. (InitScan() 실패 또는 InitScan()를 실행하지 않
음)
102 = 텍스트 변환 실패
보면 법제처에서 받는 hwp의 경우 hwp가 아닙니다 … hml 파일로 저장이 되는대요. 저희 엔진이 아닌 다른 방식으로 hml을 만드는것 같습니다. 해서 오류가 발생하는것 같은대요
해당 파일을 열어 hwp 또는 hwpx로 저장후 테스트해보시길 바랍니다.
감사합니다 ^^