如何在MySQL中存储emoji?

数据库 MySQL
目前来说,多数 MySQL 都是以 utf8 存储,注意 MySQL 的 utf8 和我们所说的传统 utf8 有点区别。MySQL 的 utf8 编码规定了最多只能有 3 个字节,而 emoji 的 unicode 已经超过了 3 个字节,因此 MySQL 的 utf8 无法识别与存储 emoji。

[[170505]]

问题还原

使用 erlang 存储一些特殊字符串到 MySQL 的时候,却没法读出来。经检查,这些字符串的二进制格式如下:

  1. <<240,159,152,134,240,159,152,144>> 

查看二进制的 unicode 是什么?

  1. 14> unicode:characters_to_list(<<240,159,152,134,240,159,152,144>>). 
  2. [128518,128528] 
  3. 15> erlang:integer_to_list(128518,16).%%查看十六进制 
  4. "1F606" 
  5. 16> erlang:integer_to_list(128528,16). 
  6. "1F610" 

明显,1F606 和 1F610 超过了常见 unicode 字符串 0000-FFFF 的表达范围。

这里引用资料:http://cenalulu.github.io/linux/character-encoding/

1F606 和 1F610 代表什么?

根据 unicode 官网上的说明,这是一种 emoji(表情符号),具体的展示形式与厂商有关。

MySQL 上存储失败的原因

目前来说,多数 MySQL 都是以 utf8 存储,注意 MySQL 的 utf8 和我们所说的传统 utf8 有点区别。MySQL 的 utf8 编码规定了最多只能有 3 个字节,而 emoji 的 unicode 已经超过了 3 个字节,因此 MySQL 的 utf8 无法识别与存储 emoji。

为此可以查阅 MySQL 中关于 unicode 支持的资料,从中可以得知 MySQL 在 5.5 后开始支持 utf8mb4,这种编码支持 1 ~ 4 个字节,这种编码可以表示 emoji。

另外 utf8mb4 向下兼容 utf8。

关于 unicode 与 utf8 的详细介绍,请查看:http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

解决方案

将 MySQL 中对应的字段改成 utf8mb4 编码:

  1. ALTER TABLE t1 
  2.   DEFAULT CHARACTER SET utf8mb4, 
  3.   MODIFY col1 CHAR(10) 
  4.     CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NOT NULL
  5.   MODIFY col2 CHAR(10) 
  6.     CHARACTER SET utf8mb4 COLLATE utf8mb4_bin NOT NULL

参考:http://dev.mysql.com/doc/refman/5.5/en/charset-unicode-upgrading.html

将连接库的连接编码改为 utf8mb4,以 erlang 的连接库 emysql 为例:

  1. emysql:add_pool(pool,[{size,1},{user,"user"},{password,"password"},{host,"host"},{port,3306},{encoding,utf8mb4}]). 
  2. %%或者 
  3. emysql:add_pool(pool,1,"user","password","host",3306,undefined, utf8mb4). 

为了建表方便,可以修改 my.cnf:

  1. # 服务器字符集 
  2. [mysql] 
  3. default-character-set=utf8mb4 
  4. [mysqld] 
  5. character-set-server=utf8mb4 

 

责任编辑:庞桂玉 来源: Linux中国
相关推荐

2019-12-23 09:42:19

Linux输入emoji

2016-09-12 16:19:38

MySQL存储数据库

2022-09-20 14:46:17

PostgreSQL存储工具

2022-06-22 09:56:19

PythonMySQL数据库

2013-08-23 10:30:41

虚拟桌面虚拟快照

2013-07-03 09:42:06

桌面虚拟化存储

2017-02-22 10:06:11

UbuntuCeph存储

2009-07-21 14:57:41

iBatis中调用存储iBatis

2018-12-27 13:35:11

MySQLMySQL 8重置密码

2022-01-17 13:34:45

MySQLLinux数据库

2011-08-11 14:35:47

SQL Server插入更新

2011-07-25 09:45:51

树状结构数据库存储

2009-06-01 09:57:43

netbeans连接数netbeans数据库netbeans连接m

2011-03-03 10:00:14

ProFTPD建立MySQL

2015-03-09 10:12:51

AWS S3AWSCloudFront

2015-11-24 14:14:00

CentOS 7.0Ceph配置

2022-11-09 07:40:18

2017-03-17 15:25:54

LinuxMySQLroot密码

2024-03-12 11:36:50

MySQL数据库函数

2024-01-17 09:33:16

数据库MySQL
点赞
收藏

51CTO技术栈公众号