背景
平时与开发交流,或在论坛回答问题时,发现这个问题被问及的频率非常高,例如: 程式中报错 “MySQL server has gone away” 是什么意思? 如何避免? 因此,感觉有必要总结一下发生这个问题的原因。
正好看到一篇外文 blog 总结的比较好,就翻译过来了,分享给大家。
原因一: MySQL 服务宕了
判断是否属于这个原因的方法很简单,执行以下命令,检视 mysql 的执行时长:
$ mysql -uroot -p -e “show global status like ‘uptime’;”+—————+——-+
| Variable_name | Value |
+—————+——-+
| Uptime | 68928 |
+—————+——-+
1 row in set (0.04 sec)
或者检视 MySQL 的报错日志,看看有没有重启的资讯:
$ tail /var/log/mysql/error.log
130101 22:22:30 InnoDB: Initializing buffer pool, size = 256.0M
130101 22:22:30 InnoDB: Completed initialization of buffer pool
130101 22:22:30 InnoDB: highest supported file format is Barracuda.
130101 22:22:30 InnoDB: 1.1.8 started; log sequence number 63444325509
130101 22:22:30 [Note] Server hostname (bind-address): ‘127.0.0.1’; port: 3306
130101 22:22:30 [Note] – ‘127.0.0.1’ resolves to ‘127.0.0.1’;
130101 22:22:30 [Note] Server socket created on IP: ‘127.0.0.1’.
130101 22:22:30 [Note] Event Scheduler: Loaded 0 events
130101 22:22:30 [Note] /usr/sbin/mysqld: ready for connections.
Version: ‘5.5.28-cll’ socket: ‘/var/lib/mysql/mysql.sock’ port: 3306 MySQL Community Server (GPL)
如果 uptime 数值很大,表明 MySQL 服务执行了很久了,说明最近服务没有重启过。 如果日志没有相关资讯,也说明 MySQL 服务最近没有重启过,可以继续检查下面几项内容。
原因 2:连线超时
如果程式使用的是长连线,则这种情况的可能性会比较大。 即某个长连线很久没有发起新的请求,达到了 server 端的 time out,被 server 强行关闭。此后再通过这个 client 发起查询的时候,就会报错 server has gone away 。
$ mysql -uroot -p -e “show global variables like ‘%timeout’;”+—————————-+———-+
| Variable_name | Value |
+—————————-+———-+
| connect_timeout | 30 |
| delayed_insert_timeout | 300 |
| innodb_lock_wait_timeout | 50 |
| innodb_rollback_on_timeout | OFF |
| interactive_timeout | 28800 |
| lock_wait_timeout | 31536000 |
| net_read_timeout | 30 |
| net_write_timeout | 60 |
| slave_net_timeout | 3600 |
| wait_timeout | 28800 |
+—————————-+———-+mysql> SET SESSION wait_timeout=5;#Wait 10 secondsmysql> SELECT NOW();
ERROR 2006 (HY000): MySQL server has gone away
No connection. Trying to reconnect…
Connection id: 132361
Current database: *** NONE ***+———————+
| NOW() |
+———————+
| 2013-01-02 11:31:15 |
+———————+
1 row in set (0.00 sec)
原因 3: 程序在 server 端被主动 kill
这种原因和第 2 种原因比较相似,只是发起者是 DBA,或者其他 job,发现有长时间的慢查询执行 kill xxx 导致。
$ mysql -uroot -p -e “show global status like ‘com_kill’”+—————+——-+
| Variable_name | Value |
+—————+——-+
| Com_kill | 0 |
+—————+——-+
原因 4: Your SQL statement was too large
当查询的结果集超过 max_allowed_packet 也会出现这样的报错,定位方法是打出相关报错的语句。 用 select*into outfile 的方式汇出到档案,检视档案大小是否超过 max_allowed_packet,如果超过则需要调整引数,或者优化语句。
mysql> show global variables like ‘max_allowed_packet’;
+——————–+———+
| Variable_name | Value |
+——————–+———+
| max_allowed_packet | 1048576 |
+——————–+———+
1 row in set (0.00 sec)# 修改引数:mysql> set global max_allowed_packet=1024*1024*16;mysql> show global variables like ‘max_allowed_packet’;
+——————–+———-+
| Variable_name | Value |
+——————–+———-+
| max_allowed_packet | 16777216 |
+——————–+———-+
1 row in set (0.00 sec)