文字码

视表属性对话框文字码中,可以设置以下的文字码。

文字码 可用的
连接源信息
1-字节码 2-字节码 4-字节码 补充说明
GB18030 TBSLEP ASCII
(ISO 646:1991)
GB-2312-80,GB/T12345-90,
GBK,GB13000.1,
GB18030-2000.
1. 非中文码集
  • GB 2312-80 set (682)

  • -拉丁字母
    -希腊字母
    -俄文
    -日语片假名/平假名
    -数字
    -特殊符号
  • 非中文码 (187)

  • -垂直形式
    -框画
    -其它特殊符号
  • 汉字偏旁(28)
  • 表意结构符号(13)
  • 拼音(32)


  • 2. 中文码集
  • ISO 10646-1 CJK 统一表意文字, 包括GB 2312-80 集(20902)
  • ISO 10646-1 CJK 兼容表意文字 (21)
  • ISO 10646-1 CJK 统一表意文字扩展-A(52)

    高层字节:
    0x81-0xFE
    底层字节:
    0x40-0x7E or 0x80-0xFE
  • GB18030-2000

    1. 非中文码集
  • 符号(9245),包括
    -Uygur (Arabic in ISO 10646-1) (206)
    -Tibetan (193)
    -Mongolian (155)
    -Yi Syllables (1165)
    -Yi Radical (50)
  • Hangul Syllables (11172)


  • 2. 中文码集
  • ISO 10646-1 CJK compatibility ideographs (281)
  • ISO 10646-1 CJK unified ideographs Extension-A(6530)
  • Windows代码页(CodePage)54936。
    GB18030字体,需要4字节的GB18030字符。若需要使用该字体,必须安装"Microsoft GB18030字符支持工具包"。
    BIG5 TB-L-P ASCII
    (ISO 646:1991)
    微软-CP950 - Windows代码页(Codepage)950。
    IBM GB HOST -B---P CPGID=00836
    IBM EBCDIC
    CPGID=00837
    IBM GB18030 DBCS-Host
    高层字节:
    0x41-0xFE
    底层字节:
    0x41-0xFE
    - "汉字字段"和"非汉字字段"可以通过表格栏设置来指定。
    Unicode
    (Big endian)
    TB-L-P ISO 10646 (Note 1) ISO 10646 (Note 1) - 该文字码集是Unicode编码方法的一种。在该文字码中,字符以小端的UCS-2(Unicode编码其中1个字符通常由2字节来表达)字节顺序被表达。
    Unicode
    (Little endian)
    TB-L-P ISO 10646 (Note 1) ISO 10646 (Note 1) - 该文字码集是Unicode编码方法的一种。在该文字码中,字符以小端的UCS-2字节顺序被表达。
    这是Windows (显示)的文字码集.
    UTF-8 TB-L-P ISO 10646 (Note 1) ISO 10646 (Note 1) - 该文字码集是Unicode编码方法的一种。在该文字码中, 1个字符由可变长度字节来表示。由1个字节表达的代码范围与7-位ASCII是兼容的。

    解释性说明: 可用连接源信息
    T: 文本连接源信息(固定长度文本连接源信息或可变长度文本连接源信息)
    B: 二进制连接源信息
    S: SQL DB连接源信息(SQL DB连接源信息或更新SQL DB连接源信息)
    L: ORACLE连接源信息的数据库装载机
    E: Essbase连接源信息(Essbase维度构建连接器或Essbase数据加载连接源信息视表)
    P: 关于数据通道连接器的连接源信息(数据通道连接器或临时文件连接源信息或虚拟文件连接源信息)

    Note 1: 该文字码集与 Unicode 4.0一致。 (只有MatchRE 函数 / ReplaceRE 函数的常规表达过程与 Unicode 4.0.1是一致的)。
    当本产品读取外部码是Unicode(Big endian), Unicode(Little endian) 或 UTF-8的文件时,内部码将变成 UCS-2。 UCS-2 是固定 2 字节(2 octet)文字码集, 并且这可以处理Unicode的基本多平面中的字符数据。数据不能在非基本多平面的情况下被处理。
    (在 Unicode(Big endian) 等视表中如果编码为UTF-16的字符数据被读取,上2层字节与下2层字节将作为单独字符被处理)
    (UTF-8 可以代表到UCS-4的代码,但是它在本产品中只支持UCS-2的代码范围)