问题描述
当数据库中插入表情的时候,报错如下:
ERROR 1366 (HY000): Incorrect string value: '\xF0\x9F\x98\x8A' for column 'nick_name' at row 1
问题分析
是由于客户端和服务端的字符集配置不正确导致, 表情 emoji 需要用 utf8mb4 的字符集来解析。
模拟复现
1.查看当前服务端和客户端连接的字符集配置(服务端和客户端都设置为 utf8 )的情况
mysql> show variables like '%chara%';
+--------------------------+----------------------------+
| Variable_name | Value |
+--------------------------+----------------------------+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8mb4 |
| character_set_filesystem | binary |
| character_set_results | utf8mb4 |
| character_set_server | utf8 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+
8 rows in set (0.00 sec)
插入表情的时候报错如下:
mysql> insert into test_moji values('逆风飞翔1\U+1F60A');
ERROR 1366 (HY000): Incorrect string value: '\xF0\x9F\x98\x8A' for column 'nick_name' at row 1
修改客户端连接的字符集为 utf8mb4 , 具体参数为character_set_client
和 character_set_connection
然后重新执行插入表情操作
mysql> show variables like '%chara%';
+--------------------------+----------------------------+
| Variable_name | Value |
+--------------------------+----------------------------+
| character_set_client | utf8mb4 |
| character_set_connection | utf8mb4 |
| character_set_database | utf8mb4 |
| character_set_filesystem | binary |
| character_set_results | utf8mb4 |
| character_set_server | utf8 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+
8 rows in set (0.00 sec)
mysql> insert into test_moji values('逆风飞翔1\U+1F60A');
Query OK, 1 row affected (0.00 sec)
解决方案
一般应用程序会使用 官网的 Connector/J 去连接数据库
- 如果使用的 Connect/J 5.1.47 版本 之后去连接,connection url 连接设置 characterEncoding=UTF-8
- 如果是 Connect/J 的低版本 (5.1.46 版本及以前) MySQL 服务端必须设置 character_set_server=utf8mb4, 否则 connection string 中的 utf8 会映射为 utf8 (即utf8mb3)
参考文档
https://dev.mysql.com/doc/connector-j/5.1/en/connector-j-reference-charsets.html 如果您有其他问题,欢迎您联系火山引擎技术支持服务