MySQL如何有效的存储IP地址?

运维 数据库运维 通信技术
用数据库的函数的话,只需要在 IP地址 入库时,稍稍做一下转换即可,方便快捷;而且到了这里,你不觉得将IP地址转换成数字存储是一种不错的选择么。

前几天,阿粉的一个朋友去面试,他回来告诉我,面试官问他 IP 地址是怎么存在数据库的?他当时也没多想,直接就回答的存字符串啊(心想:这么简单的问题,怕不是看不起我吧)

前面这段权当看看,毕竟 IP地址 本来就是一个字符串,存放在数据库作为字符穿类型,也是无可厚非的。但是,阿粉我可是一个喜欢换位思考的人,站在面试官的角度,你觉得我会问这么一个低级的问题么?那么档案当然是否定的。所以,面试官想知道的是你对这个问题会不会有深度思考,从此来一定程度的判断你在平常的开发中只是一个单纯的 "搬砖" 的码农,还是一个有灵魂的 Coder 。

[[328314]]

序言

针对这个问题,首先声明一下,将 IP地址 以字符串的形式保存在数据库是完全没问题的。那么你可能就有疑问了?既然没问题,那你还在这里瞎比比什么呢?

虽然,这是一个前后矛盾的话题,但是除了存字符串以外,我们还有其他的存储方式。例如比较常用的,将 IP地址 存成 int 型的数据,这种存储方式虽然实现起来不复杂,但是能想到该方法,也从一定程度上表明了你是一个善于思考,对数据底层基础把握的比较到位。

因为一个 int 型的数据占 4 个字节,每个字节 8 位,其范围就是 0~(2^8-1),而 ipv4地址 可以分成4段,每段的范围是 0~255 刚刚好能存下,所以将其稍稍转换,就巧妙的将 IP地址 用最小的空间存在了数据库中(接下来的描述若无特殊说明,则都是指的 ipv4地址)。可能你会觉得这个小小的改变没有什么关系,但是当数据量越来越多的时候,15个字节和4个字节相差的数据量会让你吃惊。所以在设计数据库的时候,字段类型用合适的,够用就行,能省则省。

正如在《高性能MySQL 第3版》第4.1.7节时,作者建议当存储IPv4地址时,应该使用32位的无符号整数(UNSIGNED INT)来存储IP地址,而不是使用字符串的原理一样。

相对字符串存储,使用无符号整数来存储有如下的好处:

  • 节省空间,不管是数据存储空间,还是索引存储空间
  • 便于使用范围查询(BETWEEN...AND),且效率更高

通常,在保存IPv4地址时,一个IPv4最小需要7个字符,最大需要15个字符,所以,使用VARCHAR(15)即可。MySQL在保存变长的字符串时,还需要额外的一个字节来保存此字符串的长度。而如果使用无符号整数来存储,只需要4个字节即可。另外还可以使用4个字段分别存储IPv4中的各部分,但是通常这不管是存储空间和查询效率应该都不是很高(虽然有的场景适合使用这种方式存储)。不过使用无符号整数来存储也有不便于阅读和需要手动转换的缺点。

工具类实现转换

而要实现将IP地址存储成 int 型保存在数据库中,一种是通过java代码中的 移位操作 和 & 计算得到相应的值:

  1. package com.java.mmzsit; 
  2.  
  3. /** 
  4.  * @author :mmzsblog 
  5.  * @description:Ipv4地址的转换 
  6.  * @date :2020/5/27 22:43 
  7.  */ 
  8. public class Ipv4Covert { 
  9.     public static void main(String[] args) { 
  10.         String ip = "10.108.149.219"
  11.  
  12.         // step1: 分解IP字符串,并对应写对字节数组 
  13.         byte[] ip1 = ipToBytes(ip); 
  14.  
  15.         // step2: 对字节数组里的每个字节进行左移位处理,分别对应到整型变量的4个字节 
  16.         int ip2 = bytesToInt(ip1); 
  17.         System.out.println("整型ip ----> " + ip2); 
  18.  
  19.         // step3: 对整型变量进行右位移处理,恢复IP字符串 
  20.         String ip3 = intToIp(ip2); 
  21.         System.out.println("字符串ip---->" + ip3); 
  22.  
  23.     } 
  24.  
  25.      
  26.     /** 
  27.      * 把IP地址转化为int 
  28.      * @param ipAddr 
  29.      * @return int 
  30.      */ 
  31.     public static byte[] ipToBytesByReg(String ipAddr) { 
  32.         byte[] ret = new byte[4]; 
  33.         try { 
  34.             String[] ipArr = ipAddr.split("\\."); 
  35.             ret[0] = (byte) (Integer.parseInt(ipArr[0]) & 0xFF); 
  36.             ret[1] = (byte) (Integer.parseInt(ipArr[1]) & 0xFF); 
  37.             ret[2] = (byte) (Integer.parseInt(ipArr[2]) & 0xFF); 
  38.             ret[3] = (byte) (Integer.parseInt(ipArr[3]) & 0xFF); 
  39.             return ret; 
  40.         } catch (Exception e) { 
  41.             throw new IllegalArgumentException(ipAddr + " is invalid IP"); 
  42.         } 
  43.  
  44.     } 
  45.  
  46.  
  47.  
  48.     /** 
  49.      * 第一步,把IP地址分解为一个btye数组 
  50.      */ 
  51.     public static byte[] ipToBytes(String ipAddr) { 
  52.         // 初始化字节数组,定义长度为4 
  53.         byte[] ret = new byte[4]; 
  54.         try { 
  55.             String[] ipArr = ipAddr.split("\\."); 
  56.             // 将字符串数组依次写入字节数组 
  57.             ret[0] = (byte) (Integer.parseInt(ipArr[0])); 
  58.             ret[1] = (byte) (Integer.parseInt(ipArr[1])); 
  59.             ret[2] = (byte) (Integer.parseInt(ipArr[2])); 
  60.             ret[3] = (byte) (Integer.parseInt(ipArr[3])); 
  61.             return ret; 
  62.         } catch (Exception e) { 
  63.             throw new IllegalArgumentException("invalid IP : " + ipAddr); 
  64.         } 
  65.     } 
  66.  
  67.     /** 
  68.      * 根据位运算把 byte[] -> int 
  69.      * 原理:将每个字节强制转化为8位二进制码,然后依次左移8位,对应到Int变量的4个字节中 
  70.      */ 
  71.     public static int bytesToInt(byte[] bytes) { 
  72.         // 先移位后直接强转的同时指定位数 
  73.         int addr = bytes[3] & 0xFF; 
  74.         addr |= ((bytes[2] << 8) & 0xFF00); 
  75.         addr |= ((bytes[1] << 16) & 0xFF0000); 
  76.         addr |= ((bytes[0] << 24) & 0xFF000000); 
  77.         return addr; 
  78.     } 
  79.  
  80.     /** 
  81.      * 把int->string地址 
  82.      * 
  83.      * @param ipInt 
  84.      * @return String 
  85.      */ 
  86.     public static String intToIp(int ipInt) { 
  87.         // 先强转二进制,再进行移位处理 
  88.         return new StringBuilder() 
  89.                 // 右移3个字节(24位),得到IP地址的第一段也就是byte[0],为了防止符号位是1也就是负数,最后再一次& 0xFF 
  90.                 .append(((ipInt & 0xFF000000) >> 24) & 0xFF).append('.') 
  91.                 .append((ipInt & 0xFF0000) >> 16).append('.') 
  92.                 .append((ipInt & 0xFF00) >> 8).append('.') 
  93.                 .append((ipInt & 0xFF)) 
  94.                 .toString(); 
  95.     } 

其实这是一种二进制的思维,也是计算技术中广泛采用的一种数制,虽然平时用的不多,但是熟练掌握后,有助于加强我们对机器语言的理解和提升我们的编码水平,特别是面对资源紧张(运存)的场景时,有助于我们分析和优化问题。

数据库函数实现转换

另一种方式就是通过数据库自带的函数 INET_ATON 和 INET_NTOA 进行转化:

  1. mysql> SELECT INET_ATON('192.168.0.1'); 
  2. +--------------------------+ 
  3. | INET_ATON('192.168.0.1') | 
  4. +--------------------------+ 
  5. |               3232235521 | 
  6. +--------------------------+ 
  7. 1 row in set 
  8.  
  9. mysql> SELECT INET_NTOA(3232235521);   
  10. +-----------------------+ 
  11. | INET_NTOA(3232235521) | 
  12. +-----------------------+ 
  13. | 192.168.0.1           | 
  14. +-----------------------+ 
  15. 1 row in set 

如果是 IPv6地址 的话,则使用函数 INET6_ATON 和 INET6_NTOA 进行转化:

  1. mysql> SELECT HEX(INET6_ATON('1030::C9B4:FF12:48AA:1A2B')); 
  2.  
  3. +----------------------------------------------+ 
  4. | HEX(INET6_ATON('1030::C9B4:FF12:48AA:1A2B')) | 
  5. +----------------------------------------------+ 
  6. | 1030000000000000C9B4FF1248AA1A2B             | 
  7. +----------------------------------------------+ 
  8. 1 row in set 
  9.  
  10. mysql> SELECT INET6_NTOA(UNHEX('1030000000000000C9B4FF1248AA1A2B'));  
  11. +-------------------------------------------------------+ 
  12. | INET6_NTOA(UNHEX('1030000000000000C9B4FF1248AA1A2B')) | 
  13. +-------------------------------------------------------+ 
  14. | 1030::c9b4:ff12:48aa:1a2b                             | 
  15. +-------------------------------------------------------+ 
  16. 1 row in set 

然后数据库定义为 varbinary 类型,分配 128bits 空间(因为 ipv6采用的是128bits,16个字节);或者定义为 char 类型,分配 32bits 空间。

用数据库的函数的话,只需要在 IP地址 入库时,稍稍做一下转换即可,方便快捷;而且到了这里,你不觉得将IP地址转换成数字存储是一种不错的选择么,毕竟数据库都帮我们考虑到了这一点,也间接性的证明了这的确是一种可行、并且不错的存储方式。

 

责任编辑:赵宁宁 来源: Java极客技术
相关推荐

2010-06-13 14:26:22

IP协议地址

2018-05-14 10:56:36

MySQL数据库存储

2015-07-10 09:08:52

IP地址IP地址冲突

2022-02-11 09:31:23

IPV4IP地址IANA

2009-01-20 10:51:00

局域网IP地址分配

2020-11-30 12:15:26

KubernetesPodLinux

2023-07-18 16:05:00

IP地址

2014-01-08 09:33:57

重复IP地址IP检测

2021-09-01 09:54:10

IP地址域名

2021-12-03 14:41:00

云存储可扩展性存储

2015-09-28 09:58:24

网络IP地址IP

2009-01-12 12:50:43

服务器虚拟化存储

2019-09-08 15:43:19

UbuntuLinuxIP地址

2018-05-28 11:10:08

Linux命令IP地址

2010-09-25 16:26:32

DHCP保留特定IP地

2010-05-24 15:53:44

MySQL内置函数

2009-05-27 09:47:46

2013-05-27 13:45:06

网管技巧IP地址跟踪

2022-10-10 08:05:23

IP地址节点

2022-10-14 12:07:04

LinuxIP
点赞
收藏

51CTO技术栈公众号