native2unicode
将数值字节转换为 Unicode 字符表示形式
语法
unicodestr = native2unicode(bytes)
unicodestr = native2unicode(bytes, encoding)
说明
unicodestr = native2unicode(bytes) 将数值向量 bytes 从用户默认编码方式转换为 Unicode® 字符表示形式。native2unicode 将 bytes 视为 8 位字节的向量,而且每个值必须在范围 [0,255] 内。输出参量 unicodestr 是与 bytes 有着相同的常规数组形状的字符向量。
unicodestr = native2unicode(bytes, encoding) 假定 bytes 符合字符向量 encoding 指定的字符编码方案,并将 bytes 转换成 Unicode 表示形式。输入参量 encoding 不能包含字符 (''),或者它必须是编码方案的名称或别名。下面是一些示例:'UTF-8'、'latin1'、'US-ASCII' 和 'Shift_JIS'。如果 encoding 未指定或不包含任何字符 (''),则使用默认编码方案。encoding 可以是字符向量或字符串标量。
注意
如果 bytes 是字符向量或字符串标量,它将原样返回。
示例
该例从使用未知字符编码方案的字节向量开始。用户编写了一个函数 detect_encoding,用来检测向量的编码方案。如果成功,则以字符向量的形式返回编码方案的名称或别名。如果不成功,则抛出以 MException 对象 ME 表示的错误。该例调用 native2unicode 将 bytes 转换为 Unicode 表示形式:
try
enc = detect_encoding(bytes);
str = native2unicode(bytes, enc);
disp(str);
catch ME
rethrow(ME);
end请注意,计算机必须经过正确的配置,可以检测到的编码方案所代表的语言显示文本,才能正确显示 disp(str) 的输出。
扩展功能
版本历史记录
在 R2006a 之前推出