用于自定义文字码转换的外字参照文件格式,与用于自定义文字码校验的文字码校验文件名几乎是相同的。
关于自定义文字码转换的详细信息,参照 外字参照。
关于自定义文字码校验的详细信息,参照 文字码校验。
关于外字参照文件的登录方法和优先级的详细信息,参照 外字参照标签。
关于文字码校验文件名的登录方法和优先级的详细信息,参照 文字码校验标签。
外字参照文件和文字码校验文件名是由GB18030表现的CSV格式的可变长度文本文件。该文件可以从如下定义的带可变长度文本连接源信息视表中读取。
可变长度文本连接源信息属性 | |
---|---|
引号 | 无 |
分隔符 | 逗号 |
标题行数 | 0 |
新的输入行选项 | 自动 |
视表属性 | |
文字码 | GB18030 |
表格栏名 | 内容 | 使用 | 注释 |
---|---|---|---|
输入码 | xxxx | EC |
字符的内部码以4位十六进制数被指定。
(关于内部码的详细信息,参照 文字码校验的外部码与内部码)。 即使是1字节文字码,也需要4位"001A"的形式来表现。关于范围限制及详细信息,参照文字码校验文件名中的范围限制。 十六进制可以是大写或者小写字符。 "0x"可能被用于像"0x001A"的开头部分。 即使使用的是Unicode,但是也不能使用U+9AD8这样的值。 |
xxxx-xxxx | EC | 使用4位十六进制数,以"开始码-结束码"格式来指定其范围。 | |
输入数 | n | EC |
这是被用于指定文字码plane的保留值。 请将其设置为0。 |
输出码 | xxxx | EC | 转换为内部码的结果为4位十六进制。 |
错误 | EC |
要将在"输入码" 和 "输入数"中,所指定的字符视为转换错误或代码校验错误时,需要指定相应的说明。 一般来说,当指定的字符在字符数据中被发现,将会发生带有"C13001 文字码值不正确。"响应码的异常完成。 |
|
删除 | -C |
在"输入码" 和 "输入数"中指定的字符删除。 这只能在文字码校验文件名中被指定。 |
|
正确 | -C |
要将在"输入码" 和 "输入数"中指定的字符在不考虑代码校验的情况下被读取。 这只能在文字码校验文件名中被指定。 |
|
输出数 | n | EC |
这是被用于指定文字码结果平面数的保留值。 请将其设置为0。 |
注释 | 选项 | EC |
不包含换行符任意的选项文本。可以写入一些说明等。 这可以被忽略。 |
解释性说明:
使用 | ||
E | : | 对外字参照文件可用的格式。 |
C | : | 对文字码校验文件名可用的格式。 |
内容 | ||
xxxx | : | 指定十六进制字符(也包括大小写字符)。 |
n | : | 指定十进制字符。 |
大写字母 | : | 指定内容如(这也可以以小写字母被指定) |
选项 | : | 指定选项文本。 |
注释行: 下面的行将被忽略。
举例: 在外字参照文件中,当将EBCDIC的0x05(控制码HT)转换为GB18030的0x09(控制码HT)时,创建如下记录。
0005,0,0009,0
或者
0x0005,0,0x0009,0
举例: 在外字参照文件或文字码校验文件名中,当需要Unicode字符属于U+0080与U+FFFF之间到错误,创建如下记录。
0080-FFFF,0,ERROR,0