在平时的mysql运维操作中,经常会碰到插入中文字段后出现乱码的情况,产生中文乱码的原因一般有:
1)mysql的编码格式不对,是latin1编码。强烈推荐将mysql下的编码格式都改为utf8,因为它兼容世界上所有字符!
2)mysql的表的语系设定问题(包含character与collation)
3)客户端程式(例如php)的连线语系设定问题
下面就对Mysql下处理数据表中中文字段乱码问题的操作做一记录:
为了防止后续操作出现乱码现象,最好在创建库或数据表的时候就设置正确的编码。
创建数据库的时候,设置编码格式
1
2
3
4
|
mysql>
CREATE
DATABASE
hqsb
->
CHARACTER
SET
utf8
->
COLLATE
utf8_general_ci;
Query OK, 1 row affected (0.01 sec)
|
创建表的时候,设置编码格式
1
2
3
4
5
6
7
|
mysql> use hqsb;
Database
changed
mysql>
CREATE
TABLE
haha (
-> id
int
(10)
PRIMARY
KEY
AUTO_INCREMENT,
->
name
varchar
(64)
NOT
NULL
-> ) ENGINE=InnoDB
DEFAULT
CHARSET=utf8;
Query OK, 0
rows
affected (0.02 sec)
|
这3个设置好了,基本就不会出问题了,即建库和建表时都使用相同的编码格式。
如果在建库建表的时候没有指明编码格式导致中文乱码,可以通过以下方式进行查询。
1)查看mysql系统默认的编码格式(保证下面查询结果中的所有编码格式都是utf8,有不是的就手动修改!):
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
mysql> show variables
like
"%char%"
;
+
--------------------------+----------------------------------+
| Variable_name | Value |
+
--------------------------+----------------------------------+
| character_set_client | gbk |
| character_set_connection | gbk |
| character_set_database | utf8 |
| character_set_filesystem |
binary
|
| character_set_results | gbk |
| character_set_server | utf8 |
| character_set_system | utf8 |
| character_sets_dir | /usr/
local
/mysql/share/charsets/ |
+
--------------------------+----------------------------------+
8
rows
in
set
(0.01 sec)
|
手动进行修改:
1
2
|
mysql>
SET
character_set_filesystem=
'utf8'
;
Query OK, 0
rows
affected (0.00 sec)
|
再次查看是否已修改:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
mysql> show variables
like
"%char%"
;
+
--------------------------+----------------------------------+
| Variable_name | Value |
+
--------------------------+----------------------------------+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_filesystem | utf8 |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
| character_sets_dir | /usr/
local
/mysql/share/charsets/ |
+
--------------------------+----------------------------------+
8
rows
in
set
(0.01 sec)
|
2)查看数据库(比如hqsb)的编码格式:
1
2
3
4
5
6
7
|
mysql> show
create
database
hqsb;
+
----------+---------------------------------------------------------------+
|
Database
|
Create
Database
|
+
----------+---------------------------------------------------------------+
| hqsb |
CREATE
DATABASE
`hqsb`
/*!40100 DEFAULT CHARACTER SET utf8 */
|
+
----------+---------------------------------------------------------------+
1 row
in
set
(0.00 sec)
|
如果数据库的编码格式不正确,可以手动修改:
1
2
|
mysql>
ALTER
DATABASE
hqsb
DEFAULT
CHARACTER
SET
utf8
COLLATE
utf8_general_ci;
Query OK, 1 row affected (0.01 sec)
|
3)查看数据表(比如haha)的编码格式:
1
2
3
4
5
6
7
8
9
10
11
|
mysql> show
create
table
haha;
+
-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+
|
Table
|
Create
Table
|
+
-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+
| haha |
CREATE
TABLE
`haha` (
`id`
int
(10)
NOT
NULL
AUTO_INCREMENT,
`
name
`
varchar
(64)
NOT
NULL
,
PRIMARY
KEY
(`id`)
) ENGINE=InnoDB
DEFAULT
CHARSET=utf8 |
+
-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+
1 row
in
set
(0.00 sec)
|
如果数据表的编码格式不正确,可以手动修改:
1
2
|
mysql>
ALTER
TABLE
haha
DEFAULT
CHARACTER
SET
utf8
COLLATE
utf8_general_ci;
Query OK, 0
rows
affected (0.01 sec)
|
注意:
在客户端(比如xshell)里连接mysql插入数据,最好事先确保编码格式为Utf-8。
解决网页中乱码的问题
1)将网站编码设为utf-8。
2)如果网站已运作了好久,并有很多旧数据,不能再更改简体中文的设定,那么建议将页面的编码设为GBK。
GBK与GB2312的区别就在于:GBK能比GB2312显示更多的字符,要显示简体码的繁体字,就只能用GBK。
3)编辑/etc/my.cnf ,在[mysql]段加入default_character_set=utf8;
4)在编写Connection URL时,加上?useUnicode=true&characterEncoding=utf-8参数;
5)在网页代码中加上一个"set names utf8"或者"set names gbk"的指令,告诉MySQL连线内容都要使用utf8或者gbk;