文字码

在视表属性对话框的文字码中，可以设置以下的文字码。

文字码	可用的连接源信息	1-字节码	2-字节码	4-字节码	补充说明
GB18030	TBSLEP	ASCII (ISO 646:1991)	GB-2312-80，GB/T12345-90， GBK，GB13000.1， GB18030-2000. 1. 非中文码集 GB 2312-80 set (682) -拉丁字母 -希腊字母 -俄文 -日语片假名/平假名 -数字 -特殊符号非中文码 (187) -垂直形式 -框画 -其它特殊符号汉字偏旁(28) 表意结构符号(13) 拼音(32) 2. 中文码集 ISO 10646-1 CJK 统一表意文字，包括GB 2312-80 集(20902) ISO 10646-1 CJK 兼容表意文字 (21) ISO 10646-1 CJK 统一表意文字扩展-A(52) 高层字节: 0x81-0xFE 底层字节: 0x40-0x7E or 0x80-0xFE	GB18030-2000 1. 非中文码集符号(9245)，包括 -Uygur (Arabic in ISO 10646-1) (206) -Tibetan (193) -Mongolian (155) -Yi Syllables (1165) -Yi Radical (50) Hangul Syllables (11172) 2. 中文码集 ISO 10646-1 CJK compatibility ideographs (281) ISO 10646-1 CJK unified ideographs Extension-A(6530)	Windows代码页(CodePage)54936。 GB18030字体，需要4字节的GB18030字符。若需要使用该字体，必须安装"Microsoft GB18030字符支持工具包"。
BIG5	TB-L-P	ASCII (ISO 646:1991)	微软-CP950	-	Windows代码页(Codepage)950。
IBM GB HOST	-B---P	CPGID=00836 IBM EBCDIC	CPGID=00837 IBM GB18030 DBCS-Host 高层字节: 0x41-0xFE 底层字节: 0x41-0xFE	-	"汉字字段"和"非汉字字段"可以通过表格栏设置来指定。
Unicode (Big endian)	TB-L-P	ISO 10646 (Note 1)	ISO 10646 (Note 1)	-	该文字码集是Unicode编码方法的一种。在该文字码中，字符以小端的UCS-2(Unicode编码其中1个字符通常由2字节来表达)字节顺序被表达。
Unicode (Little endian)	TB-L-P	ISO 10646 (Note 1)	ISO 10646 (Note 1)	-	该文字码集是Unicode编码方法的一种。在该文字码中，字符以小端的UCS-2字节顺序被表达。这是Windows (显示)的文字码集.
UTF-8	TB-L-P	ISO 10646 (Note 1)	ISO 10646 (Note 1)	-	该文字码集是Unicode编码方法的一种。在该文字码中， 1个字符由可变长度字节来表示。由1个字节表达的代码范围与7-位ASCII是兼容的。

解释性说明: 可用连接源信息
T: 文本连接源信息(固定长度文本连接源信息或可变长度文本连接源信息)
B: 二进制连接源信息
S: SQL DB连接源信息(SQL DB连接源信息或更新SQL DB连接源信息)
L: ORACLE连接源信息的数据库装载机
E: Essbase连接源信息(Essbase维度构建连接器或Essbase数据加载连接源信息视表)
P: 关于数据通道连接器的连接源信息(数据通道连接器或临时文件连接源信息或虚拟文件连接源信息)

Note 1: 该文字码集与 Unicode 4.0一致。 (只有 MatchRE 函数 / ReplaceRE 函数的常规表达过程与 Unicode 4.0.1是一致的)。
当本产品读取外部码是Unicode(Big endian)， Unicode(Little endian) 或 UTF-8的文件时，内部码将变成 UCS-2。 UCS-2 是固定 2 字节(2 octet)文字码集，并且这可以处理Unicode的基本多平面中的字符数据。数据不能在非基本多平面的情况下被处理。
(在 Unicode(Big endian) 等视表中如果编码为UTF-16的字符数据被读取，上2层字节与下2层字节将作为单独字符被处理)
(UTF-8 可以代表到UCS-4的代码，但是它在本产品中只支持UCS-2的代码范围)