웹한글 기안기로 작성한 유통문서 특수문자 문의

안녕하세요
웹한글 기안기를 통해 유통문서를 생성시 사용자가 xml 파싱이 불가능한 특수문자나 기호를 넣는 경우가 발생합니다.
웹한글 기안기에서 xml 파싱이 가능한 특수문자나 기호만 사용할 수 있도록 검증하거나 제한을 할 수 있는지 문의드립니다.
사용자가 입력한 기호는 천지인 키보드에서 찾을 수 있습니다.

  1. 문서유통을 통해 처리된 pubdoc.xml 본문 내용
    <ROW>
    <CELL ColAddr=“0” RowAddr=“0” ColSpan=“1” RowSpan=“2” Width=“3850” Height=“3380” Header=“false” HasMargin=“false” Protect=“false” Editable=“false” Dirty=“false” BorderFill=“5”>
    <CELLMARGIN Left=“510” Right=“510” Top=“141” Bottom=“141”/>
    <PARALIST TextDirection=“0” LineWrap=“Break” VertAlign=“Center” LinkListID=“0” LinkListIDNext=“0”>
    <P ParaShape=“16” Style=“0”>
    <TEXT CharShape=“23”>
    <CHAR>구분</CHAR>
    </TEXT>
    </P>
    </PARALIST>
    </CELL>
    <CELL ColAddr=“1” RowAddr=“0” ColSpan=“1” RowSpan=“2” Width=“11131” Height=“3380” Header=“false” HasMargin=“false” Protect=“false” Editable=“false” Dirty=“false” BorderFill=“5”>
    <CELLMARGIN Left=“510” Right=“510” Top=“141” Bottom=“141”/>
    <PARALIST TextDirection=“0” LineWrap=“Break” VertAlign=“Center” LinkListID=“0” LinkListIDNext=“0”>
    <P ParaShape=“16” Style=“0”>
    <TEXT CharShape=“23”>
    <CHAR>��상생형(고도화)</CHAR>
    </TEXT>
    </P>
    </PARALIST>
    </CELL>
    <CELL ColAddr=“2” RowAddr=“0” ColSpan=“1” RowSpan=“2” Width=“11131” Height=“3380” Header=“false” HasMargin=“false” Protect=“false” Editable=“false” Dirty=“false” BorderFill=“5”>
    <CELLMARGIN Left=“510” Right=“510” Top=“141” Bottom=“141”/>
    <PARALIST TextDirection=“0” LineWrap=“Break” VertAlign=“Center” LinkListID=“0” LinkListIDNext=“0”>
    <P ParaShape=“16” Style=“0”>
    <TEXT CharShape=“24”>
    <CHAR>��지자체 연계</CHAR>
    </TEXT>
    </P>
    <P ParaShape=“16” Style=“0”>
    <TEXT CharShape=“24”>
    <CHAR>(광주·경남·전남·충북)</CHAR>
    </TEXT>
    </P>
    </PARALIST>
    </CELL>
    <CELL ColAddr=“3” RowAddr=“0” ColSpan=“2” RowSpan=“1” Width=“19432” Height=“1665” Header=“false” HasMargin=“false” Protect=“false” Editable=“false” Dirty=“false” BorderFill=“5”>
    <CELLMARGIN Left=“510” Right=“510” Top=“141” Bottom=“141”/>
    <PARALIST TextDirection=“0” LineWrap=“Break” VertAlign=“Center” LinkListID=“0” LinkListIDNext=“0”>
    <P ParaShape=“16” Style=“0”>
    <TEXT CharShape=“23”>
    <CHAR>��식품업</CHAR>
    </TEXT>
    </P>
    </PARALIST>
    </CELL>
    </ROW>

  2. 서버에서 발생하는 오류 메시지
    [Fatal Error] pubdoc.xml:694:43: Character reference “&#xdb80” is an invalid XML character.
    java.lang.NullPointerException

감사합니다.

안녕하세요.

오류가 발생한 문자는 서로게이트 패어로 구성된 4바이트 특수문자 입니다.
한글 제품 문자표에 “한글 호환 영역” 에서 확인 가능합니다.

사각형 테두리의 1, 2, 3 문자는 아래 코드와 같습니다.
0x0F02B1, 0x0F02B1, 0x0F02B1

이 문자들이 아래와 같이 변경되었습니다.
&#xdb80&#xdeb1, &#xdb80&#xdeb2, &#xdb80&#xdeb3

문서 처리과정에서 유통문서가 utf-8 인코딩에서 euc-kr 인코딩으로 변경되어 발생한 문제인것 같습니다.

utf-8 형식으로 유지되면 문제없이 사용 가능합니다.

감사합니다.