在视表属性对话框的文字码中,可以设置以下的文字码。
文字码 | 可用的 连接源信息 |
1-字节码 | 2-字节码 | 4-字节码 | 补充说明 |
---|---|---|---|---|---|
GB18030 | TBSLEP | ASCII |
GB-2312-80,GB/T12345-90, GBK,GB13000.1, GB18030-2000. 1. 非中文码集 -拉丁字母 -希腊字母 -俄文 -日语片假名/平假名 -数字 -特殊符号 -垂直形式 -框画 -其它特殊符号 2. 中文码集 高层字节: 0x81-0xFE 底层字节: 0x40-0x7E or 0x80-0xFE |
GB18030-2000 1. 非中文码集 -Uygur (Arabic in ISO 10646-1) (206) -Tibetan (193) -Mongolian (155) -Yi Syllables (1165) -Yi Radical (50) 2. 中文码集 |
Windows代码页(CodePage)54936。 GB18030字体,需要4字节的GB18030字符。若需要使用该字体,必须安装"Microsoft GB18030字符支持工具包"。 |
BIG5 | TB-L-P | ASCII |
微软-CP950 | - | Windows代码页(Codepage)950。 |
IBM GB HOST | -B---P | CPGID=00836 IBM EBCDIC |
CPGID=00837 IBM GB18030 DBCS-Host 高层字节: 0x41-0xFE 底层字节: 0x41-0xFE |
- | "汉字字段"和"非汉字字段"可以通过表格栏设置来指定。 |
Unicode (Big endian) |
TB-L-P | ISO 10646 (Note 1) | - | 该文字码集是Unicode编码方法的一种。在该文字码中,字符以小端的UCS-2(Unicode编码其中1个字符通常由2字节来表达)字节顺序被表达。 | |
Unicode (Little endian) |
TB-L-P | ISO 10646 (Note 1) | ISO 10646 (Note 1) | - |
该文字码集是Unicode编码方法的一种。在该文字码中,字符以小端的UCS-2字节顺序被表达。 这是Windows (显示)的文字码集. |
UTF-8 | TB-L-P | ISO 10646 (Note 1) | ISO 10646 (Note 1) | - | 该文字码集是Unicode编码方法的一种。在该文字码中, 1个字符由可变长度字节来表示。由1个字节表达的代码范围与7-位ASCII是兼容的。 |
解释性说明: 可用连接源信息
T: 文本连接源信息(固定长度文本连接源信息或可变长度文本连接源信息)
B: 二进制连接源信息
S: SQL DB连接源信息(SQL DB连接源信息或更新SQL DB连接源信息)
L: ORACLE连接源信息的数据库装载机
E: Essbase连接源信息(Essbase维度构建连接器或Essbase数据加载连接源信息视表)
P: 关于数据通道连接器的连接源信息(数据通道连接器或临时文件连接源信息或虚拟文件连接源信息)
Note 1:
该文字码集与 Unicode 4.0一致。
(只有MatchRE 函数 /
ReplaceRE 函数的常规表达过程与 Unicode 4.0.1是一致的)。
当本产品读取外部码是Unicode(Big endian),
Unicode(Little endian) 或 UTF-8的文件时,内部码将变成 UCS-2。
UCS-2 是固定 2 字节(2 octet)文字码集,
并且这可以处理Unicode的基本多平面中的字符数据。数据不能在非基本多平面的情况下被处理。
(在 Unicode(Big endian) 等视表中如果编码为UTF-16的字符数据被读取,上2层字节与下2层字节将作为单独字符被处理)
(UTF-8 可以代表到UCS-4的代码,但是它在本产品中只支持UCS-2的代码范围)