字符集问题的初步探讨


2. 字符集的更改

数据库创建以后,如果需要修改字符集,通常需要重建数据库,通过导入导出的方式来转换。
我们也可以通过以下方式更改

ALTER DATABASE CHARACTER SET

注意:修改数据库字符集时必须谨慎,修改之前一定要为数据库备份。由于不能回退这项操作,因此可能会造成数据丢失或者损坏。

这是最简单的转换字符集的方式,但并不总是有效。
这个命令在Oracle8时被引入Oracle,这个操作在本质上并不转换任何数据库字符,只是简单的更新数据库中所有跟字符集相关的信息。
这意味着,你只能在新字符集是旧字符集严格超集的情况下使用这种方式转换。
所谓超集是指:
当前字符集中的每一个字符在新字符集中都可以表示,并使用同样的代码点
比如很多字符集都是US7ASCII的严格超集。
如果不是超集,将获得以下错误:

SQL> ALTER DATABASE CHARACTER SET ZHS16CGB231280;ALTER DATABASE CHARACTER SET ZHS16CGB231280*ERROR at line 1:ORA-12712: new character set must be a superset of old character set

下面我们来看一个测试(以下测试在Oracle9.2.0下进行,Oracle9i较Oracle8i在编码方面有较大改变,在Oracle8i中,测试结果可能略有不同):
SQL> select name,value$ from props$ where name like ’%NLS%’;

NAME VALUE$
------------------------------ ------------------------------
NLS_LANGUAGE AMERICAN
NLS_TERRITORY AMERICA
NLS_CURRENCY $
NLS_ISO_CURRENCY AMERICA
NLS_NUMERIC_CHARACTERS .,
NLS_CHARACTERSET US7ASCII
NLS_CALENDAR GREGORIAN
NLS_DATE_FORMAT DD-MON-RR
NLS_DATE_LANGUAGE AMERICAN
……………….
NLS_NCHAR_CHARACTERSET AL16UTF16
NLS_RDBMS_VERSION 9.2.0.4.0

20 rows selected.
SQL> select name,dump(name) from eygle.test;

NAME DUMP(NAME)
------------------------------------------------------
测试 Typ=1 Len=4: 178,226,202,212
Test Typ=1 Len=4: 116,101,115,116

2 rows selected.

转换字符集,数据库应该在RESTRICTED模式下进行.

c:>sqlplus "/ as sysdba"

SQL*Plus: Release 9.2.0.4.0 - Production on Sat Nov 1 10:52:30 2003

Copyright (c) 1982, 2002, Oracle Corporation. All rights reserved.

Connected to:
Oracle9i Enterprise Edition Release 9.2.0.4.0 - Production
With the Partitioning, Oracle Label Security, OLAP and Oracle Data Mining options
JServer Release 9.2.0.4.0 - Production

SQL> shutdown immediate
Database closed.
Database dismounted.
ORACLE instance shut down.
SQL> STARTUP MOUNT;
ORACLE instance started.

Total System Global Area 76619308 bytes
Fixed Size 454188 bytes
Variable Size 58720256 bytes
Database Buffers 16777216 bytes
Redo Buffers 667648 bytes
Database mounted.
SQL> ALTER SESSION SET SQL_TRACE=TRUE;

Session altered.

SQL> ALTER SYSTEM ENABLE RESTRICTED SESSION;

System altered.

SQL> ALTER SYSTEM SET JOB_QUEUE_PROCESSES=0;

System altered.

SQL> ALTER SYSTEM SET AQ_TM_PROCESSES=0;

System altered.

SQL> ALTER DATABASE OPEN;

Database altered.

SQL> set linesize 120
SQL> ALTER DATABASE CHARACTER SET ZHS16GBK;
ALTER DATABASE CHARACTER SET ZHS16GBK
*
ERROR at line 1:
ORA-12721: operation cannot execute when other sessions are active

SQL> ALTER DATABASE CHARACTER SET ZHS16GBK;
ALTER DATABASE CHARACTER SET ZHS16GBK
*
ERROR at line 1:
ORA-12716: Cannot ALTER DATABASE CHARACTER SET when CLOB data exists

在Oracle9i中,如果数据库存在CLOB类型字段,那么就不允许对字符集进行转换

SQL>

这时候,我们可以去查看alert

  1<sid>.log日志文件,看CLOB字段存在于哪些表上:   
  2ALTER DATABASE CHARACTER SET ZHS16GBK SYS.METASTYLESHEET (STYLESHEET) - CLOB populatedORA-12716 signalled during: ALTER DATABASE CHARACTER SET ZHS16GBK...   
  3  
  4  
  5对于不同情况,Oracle提供不同的解决方案,如果是用户数据表,一般我们可以把包含CLOB字段的表导出,然后drop掉相关对象,   
  6转换后再导入数据库;对于系统表,可以按照以下方式处理:   
  7  
  8SQL&gt; truncate table Metastylesheet;   
  9Table truncated.   
 10  
 11  
 12  
 13然后可以继续进行转换!   
 14  
 15  
 16SQL&gt; ALTER SESSION SET SQL_TRACE=TRUE;   
 17  
 18Session altered.   
 19  
 20SQL&gt; ALTER DATABASE CHARACTER SET ZHS16GBK;   
 21  
 22Database altered.   
 23  
 24SQL&gt; ALTER SESSION SET SQL_TRACE=FALSE;   
 25  
 26Session altered.   
 27  
 28  
 29  
 30  
 31在9.2.0中,转换完成以后,可以通过运行catmet.sql脚本来重建Metastylesheet表:   
 32  
 33SQL&gt; @?/rdbms/admin/catmet.sql   
 34  
 35转换后的数据:   
 36  
 37SQL&gt; select name,value$ from props$ where name like ’%NLS%’;   
 38  
 39NAME VALUE$   
 40\------------------------------ ------------------------------   
 41NLS_LANGUAGE AMERICAN   
 42NLS_TERRITORY AMERICA   
 43NLS_CURRENCY $   
 44NLS_ISO_CURRENCY AMERICA   
 45NLS_NUMERIC_CHARACTERS .,   
 46NLS_CHARACTERSET ZHS16GBK   
 47…..   
 48NLS_NCHAR_CHARACTERSET AL16UTF16   
 49NLS_RDBMS_VERSION 9.2.0.4.0   
 50  
 5120 rows selected.   
 52  
 53SQL&gt; select * from eygle.test;   
 54  
 55NAME   
 56\------------------------------   
 57测试   
 58test   
 59  
 602 rows selected.   
 61  
 62  
 63  
 64提示:   
 65通过设置sql_trace,我们可以跟踪很多数据库的后台操作,这个工具是DBA常用的“利器”之一。   
 66我们简单看一下数据库更改字符集时的后台处理,我提取了主要的更新部分。   
 67通过以下跟踪过程,我们看到数据库在更改字符集的时候,主要更新了12张数据字典表,修改了数据库的原数据,这也证实了我们以前的说法:   
 68这个更改字符集的操作在本质上并不转换任何数据库字符,只是简单的更新数据库中所有跟字符集相关的信息。   
 69  
 70update col$ set charsetid = :1   
 71where   
 72charsetform = :2   
 73  
 74  
 75update argument$ set charsetid = :1   
 76where   
 77charsetform = :2   
 78  
 79  
 80update collection$ set charsetid = :1   
 81where   
 82charsetform = :2   
 83  
 84  
 85update attribute$ set charsetid = :1   
 86where   
 87charsetform = :2   
 88  
 89  
 90update parameter$ set charsetid = :1   
 91where   
 92charsetform = :2   
 93  
 94  
 95update result$ set charsetid = :1   
 96where   
 97charsetform = :2   
 98  
 99  
100update partcol$ set spare1 = :1   
101where   
102charsetform = :2   
103  
104  
105update subpartcol$ set spare1 = :1   
106where   
107charsetform = :2   
108  
109  
110update props$ set value$ = :1   
111where   
112name = :2   
113  
114  
115update "SYS"."KOTAD$" set SYS_NC_ROWINFO$ = :1   
116where   
117SYS_NC_OID$ = :2   
118  
119update seq$ set increment$=:2,minvalue=:3,maxvalue=:4,cycle#=:5,order$=:6,   
120cache=:7,highwater=:8,audit$=:9,flags=:10   
121where   
122obj#=:1   
123  
124update kopm$ set metadata = :1, length = :2   
125where   
126name=’DB_FDO’   
127  
128  
129  
130  
131在这里我们顺便纠正一个由来以及的错误方法.   
132经常可以在网上看到这样的更改字符集的方法:   
133  
134  
1351)用SYS用户名登陆ORACLE。   
1362)查看字符集内容   
137SQL&gt;SELECT * FROM PROPS$;   
1383)修改字符集   
139SQL&gt; update props$ set value$=’新字符集’ where name=’NLS_CHARACTERSET’   
1404) COMMIT;   
141  
142  
143我们看到很多人在这个问题上遇到了惨痛的教训,使用这种方式更改字符集,如果你的value$值输入了不正确的字符集,在8i中那么你   
144的数据库可能会无法启动,这种情况是非常严重的,有时候你必须从备份中进行恢复;如果是在9i中,可以重新启动数据库后再修改回正   
145确的字符集。但是我们仍然不建议使用这种方式进行任何数据库修改,这是一种极其危险的操作。   
146实际上当我们更新了字符集,数据库启动时会根据数据库的字符集自动的来修改控制文件的字符集,如果字符集可以识别,更新控制文   
147件字符集等于数据库字符集;如果字符集不可识别,那么控制文件字符集更新为US7ASCII.   
148通过更新props$表的方式修改字符集,在Oracle7之后就不应该被使用.   
149以下是我的测试结果,但是严禁一切不备份的修改研究,即使是对测试库的。   
150  
151SQL&gt; update props$ set value$=’EYGLE’ where name=’NLS_CHARACTERSET’;   
152  
1531 row updated.   
154  
155SQL&gt; commit;   
156  
157Commit complete.   
158  
159SQL&gt; select name,value$ from props$ where name like ’%NLS%’;   
160  
161NAME VALUE$   
162\------------------------------ -----------------------------------   
163NLS_LANGUAGE AMERICAN   
164NLS_TERRITORY AMERICA   
165NLS_CURRENCY $   
166NLS_ISO_CURRENCY AMERICA   
167NLS_NUMERIC_CHARACTERS .,   
168NLS_CHARACTERSET EYGLE   
169NLS_CALENDAR GREGORIAN   
170NLS_DATE_FORMAT DD-MON-RR   
171NLS_DATE_LANGUAGE AMERICAN   
172….   
173NLS_NCHAR_CHARACTERSET ZHS16GBK   
174NLS_RDBMS_VERSION 8.1.7.1.1   
175  
17618 rows selected.   
177  
178重新启动数据库,发现alert.log文件中记录如下操作:   
179  
180Mon Nov 03 16:11:35 2003   
181Updating character set in controlfile to US7ASCII   
182Completed: ALTER DATABASE OPEN   
183  
184启动数据库后恢复字符集设置:   
185  
186SQL&gt; update props$ set value$=’ZHS16GBK’ where name=’NLS_CHARACTERSET’;   
187  
1881 row updated.   
189  
190SQL&gt; commit;   
191  
192Commit complete.   
193  
194SQL&gt; select name,value$ from props$ where name like ’%NLS%’;   
195  
196NAME VALUE$   
197\------------------------------ -----------------------------------   
198NLS_LANGUAGE AMERICAN   
199NLS_TERRITORY AMERICA   
200NLS_CURRENCY $   
201NLS_ISO_CURRENCY AMERICA   
202NLS_NUMERIC_CHARACTERS .,   
203NLS_CHARACTERSET ZHS16GBK   
204NLS_CALENDAR GREGORIAN   
205NLS_DATE_FORMAT DD-MON-RR   
206NLS_DATE_LANGUAGE AMERICAN   
207………   
208NLS_COMP BINARY   
209NLS_NCHAR_CHARACTERSET ZHS16GBK   
210NLS_RDBMS_VERSION 8.1.7.1.1   
211  
21218 rows selected.   
213  
214重新启动数据库后,发现控制文件的字符集被更新:   
215  
216Mon Nov 03 16:21:41 2003   
217Updating character set in controlfile to ZHS16GBK   
218Completed: ALTER DATABASE OPEN   
219  
220  
221  
222  
223理解了字符集调整的内部操作以后,我们可以轻易的指出,以上的方法是不正确的,通过前面 ” ALTER DATABASE CHARACTER SET” 方式更改字   
224符集时,Oracle至少需要更改12张数据字典表,而这种直接更新props$表的方式只完成了其中十二分之一的工作,潜在的完整性隐患是可想而知的。   
225所以,更改字符集尽量要使用正常的途径。</sid>
Published At
Categories with 数据库类
Tagged with
comments powered by Disqus