下面範例包含了「正體字」、「簡體字」,並使用了 GB2312 字元集,但信件內的部份字元卻不在 GB2312 字元集範圍內,如:
华 堃 編
上述範例中編輯者指定 GB2312 進行編碼,將造成閱讀者解碼時的錯誤。如需要同時使用「正體字」與「簡體字」,編輯時可以改用範圍較大的 UTF-8。
目前多數輸入法 (微軟新注音輸入法、新酷音輸入法) 支援輸入「正體字」與「簡體字」,使用者在選字時往往因為字體較小或字型差異,不自覺選了相似的字,如「編」、「编」,其中前者為「正體字」;後者則為「簡體字」。此時同時混合使用「正體字」與「簡體字」,但卻使用了字元範圍較小的 GB2312 字元集,將會造成部份「正體字」編碼與解碼的錯誤。(另一例和語系無關但容易選錯字,則是國字的「一」與注音的「ㄧ」)
建議改善方式:
# iconv -f big5/gbk -t utf-8 輸入檔案 # piconv -f big5/gbk -t utf-8 輸入檔案
# iconv -l # piconv -l