最近在日常使用中,遇到了一个问题.
在 python 里去重处理好了的数据,插入时却遇到了 1064 错误
1062 Duplicate entry 'xxx' for key primary
但是实际上是没有重复的. 又不想用 ignore 忽略这个错误.
遂仔细检查了一下数据,发现有有的数据在忽略大小写的情况下是一致的
即 有 'AAA' 和 'aaa' 这样的数据
也就是说 mysql 的主键不是大小写敏感的
如何使 MySQL 的主键大小写敏感?
MySQL 默认查询是不区分大小写的,主键也是不缺分大小写的.
如果需要区分,必须在建表的时候,使用 Binary 标示敏感的属性.
以下摘自 MySQL 5.7 官方文档 10.1.10.8 The Binary Character Set
10.1.10.8 The Binary Character Set
The binary
character set is the chararcter set of binary strings, which are sequences of bytes. The binary
character set has one collation, also named binary
. Comparison and sorting are based on numeric byte values. The effect is that lettercase and accent differences are significant in comparisons. That is, the binary
collation is case-sensitive and accent sensitive.
(也就是说,binary 排序规则是区分大小写和区分重音的。)
mysql> SET NAMES 'binary';
mysql> SELECT CHARSET('abc'), COLLATION('abc');
+----------------+------------------+
| CHARSET('abc') | COLLATION('abc') |
+----------------+------------------+
| binary | binary |
+----------------+------------------+
mysql> SELECT 'abc' = 'ABC', 'a' = 'ä';
+---------------+------------+
| 'abc' = 'ABC' | 'a' = 'ä' |
+---------------+------------+
| 0 | 0 |
+---------------+------------+
For information about the differences between the binary
collation of the binary
character set and the _bin
collations of nonbinary character sets, see Section 10.1.8.5, “The binary Collation Compared to _bin Collations”.
To convert a string expression to a binary string, any of these constructs are equivalent:
BINARY expr
CAST(expr AS BINARY)
CONVERT(expr USING BINARY)
If expr
is a character string literal, the _binary
introducer may be used to designate it as a binary string. For example:
_binary 'a'
The _binary
introducer is permitted for hexadecimal literals and bit-value literals as well, but unnecessary; such literals are binary strings by default.
解决方案 - 字段大小写敏感
1:创建表时字段指定 binary
create table table_name (
id varchar(32) binary;
)
2:修改列指定校对规则
MODIFY COLUMN `x` varchar(100) BINARY CHARACTER SET utf8 COLLATE utf8_general_ci
BINARY 与 COLLATE
mysql 中控制数据库名和表名的大小写敏感由参数 lower_case_table_names 控制,**为 0 时表示区分大小写,为 1 时,表示将名字转化为小写后存储,不区分大小写。**字段名通常都是不区分大小写的,字段值呢?字段值的大小写由 mysql 的校对规则来控制。提到校对规则,就不得不说字符集。字符集是一套符号和编码,校对规则是在字符集内用于比较字符的一套规则,比如定义'A'<'B'这样的关系的规则。不同的字符集有多种校对规则,一般而言,校对规则以其相关的字符集名开始,通常包括一个语言名,并且以 _ci
(大小写不敏感)、_cs
(大小写敏感)或 _bin
(二元)结束 。
比如 utf8 字符集,
utf8_general_ci
,表示不区分大小写,这个是 utf8 字符集默认的校对规则;
utf8_general_cs
表示区分大小写,
utf8_bin
表示二进制比较,同样也区分大小写。
校对规则通过关键字 collate 指定,比如创建数据库 d1,指定字符集为 utf8,校对规则为 utf8_bin
CREATE DATABASE d1 DEFAULT CHARACTER SET utf8 COLLATE utf8_bin;
通过上述语句说明数据库 d1 中的数据按 utf8 编码,并且是对大小写敏感的。
解决方案 - 查询大小写敏感
有时候我们建库时,没有指定校对规则校对时字符大小写敏感,但是我们查询时,又需要对字符比较大小写敏感,例如只想要 ab 打头的字符串。没关系,mysql 提供了 collate 语法,通过指定 utf8_bin 校对规则即可。
select * from test where c1 like 'ab%' collate utf8_bin;
+-----+
| c1 |
+-----+
| abc|
+-----+
这里还有另外一种方法,通过 binary 关键字,将串转为二进制进行比较,由于大小写字符的二进制肯定不同,因此可以认为是区分大小的一种方式。
select * from test where binary c1 like 'ab%';
+-----+
| c1 |
+-----+
| abc |
+-----+
最后要说明一点的是校对规则与索引存储的关系。因为校对规则会用于字符串之间比较,而索引是基于比较有序排列的,因此校对规则会影响记录的索引顺序。
MySQL 其他大小写敏感
在 MySQL 的配置文件 my.ini 中增加一行:
lower_case_table_names = 0
其中 0:区分大小写,1:不区分大小写
MySQL 在 Linux 下数据库名、表名、列名、别名大小写规则是这样的:
- 数据库名与表名是严格区分大小写
- 表的别名是严格区分大小写的;
- 列名与列的别名在默认情况下均是忽略大小写的;
- 变量名也是严格区分大小写的;
MySQL 在 Windows 下都不区分大小写
参考资料
[MySql 主键不区分大小写问题、查询不区分大小写问题
](http://blog.csdn.net/u011127019/article/details/51404862)
mysql 大小写敏感与校对规则
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于