SQL Server中全角和半角字符的比较问题

/*------------------------------------------------------------------------------------

/* 欢迎转载,请保留本声明信息

/* 作者:翁 彦 [email protected]

/*------------------------------------------------------------------------------------

这是一个在我实际一个项目中遇到的问题。 03BHL01001 (上海)和 03BHL01001( 上海 ) 比较的结果是一样的。导致引起的重复的主键问题。

03BHL01001 (上海)和 03BHL01001( 上海 ) 差别,就在于前者的括号是全角的括号字符,后者是半角的括号字符。全角的括号字符和半角的括号字符的 ascii 码显然是不一样的。全角的( ASCII 码是 0xA3A8 ,而半角的 ( 是 0x28 。那么为什么 SQL Server 会认为是一样的呢?

问题其实就出在数据库的排序规则上,让我们在仔细研读一下 SQL Server 的文档。 SQL Server 的排序规则由这样几部分组成,代码页、区分大小写、区分重音、 区分宽度 。最后一个在 SQL Server 的联机帮助中没有进一步提及,其实本篇遇到的问题就是由于这个原因造成的。区分宽度:指定 SQL Server 区分相同字符的单字节表示法(半角)和双字节表示法(全角)。如果没有选择,则 SQL Server 将认为相同字符的单字节表示法和双字节表示法等效。

缺省,安装 SQL Server 中文版的时候, SQL Server 帮你选择的排序规则是 Chinese_PRC_CI_AS(Chinese-PRC, case-insensitive, accent-sensitive, kanatype-insensitive, width-insensitive), 是中文,不区分大小写、区分重音、不区分假名、不区分宽度。因此,自然就认同 03BHL01001 (上海) =03BHL01001( 上海 ) 。

所以,正确的选择应该是,后缀为 WS 的中文排序规则。本例中我们应该选择 Chinese_PRC_CI_AS_WS 。

我们来看一下,指定排序规则是 Chinese_PRC_CI_AS_WS 后,怎么样了?

select 1 where '03BHL01001 (上海) '='03BHL01001( 上海 )'

collate Chinese_PRC_CI_AS_WS

** ----------- **


** (所影响的行数为 0 ** ** 行) **


看来这个问题解决了。

** 重要提示: **

如何察看使用那个排序规则呢?可以使用下面的 SQL 语句。

SELECT *

FROM ::fn_helpcollations()

可以查询所有排序规则的信息。

查出所有中文排序规则的信息

SELECT * FROM

(

SELECT *

FROM ::fn_helpcollations()) A

WHERE name like 'Chinese%'


Published At
Categories with 数据库类
Tagged with
comments powered by Disqus