(十四)全解MySQL之各方位事无巨细的剖析存储过程与触发器!

引言

前面的MySQL系列章节中,一直在反复讲述MySQL一些偏理论、底层的知识,很少有涉及到实用技巧的分享,而在本章中则会阐述MySQL一个特别实用的功能,即MySQL的存储过程和触发器。

在项目的业务开发中,每条SQL语句不会太过复杂,通常就由几行SQL组成,但往往在一些复杂的业务需求下,SQL操作不会那么简单,有时写着写着,可能会编写出一条由几百行、甚至上千行SQL组成的语句,这种大SQL执行的效率通常会异常的缓慢,因此需要从各方面去尽可能的优化它,而存储过程则是专门为这类SQL而创造的,下面咱们一起来聊一聊它。

MySQL起初并不支持存储过程,而是到了MySQL5.0版本才支持存储过程的编写与执行,在MySQL中存储过程主要分为两类,一类是普通的存储过程,另一类则是触发器类型的存储过程,但如若你海不了解啥是触发器,就随我一点点往下看,好戏,开场啦!

一、初识MySQL的存储过程

Stored Procedure存储过程是数据库系统中一个十分重要的功能,使用存储过程可以大幅度缩短大SQL的响应时间,同时也可以提高数据库编程的灵活性,但一般的开发者很少去主动编写存储过程,通常都会由专门的数据库工程师去负责撰写,但大多数中小型企业并不会将岗位划分的太过细致,因此作为一个合格的后端开发,对于这块内容也需要有一定程度上的掌握。

先来简单的聊一聊啥是存储过程吧,存储过程是一组为了完成特定功能的SQL语句集合,使用存储过程的目的在于:将常用且复杂的SQL语句预先写好,然后用一个指定名称存储起来,这个过程经过MySQL编译解析、执行优化后存储在数据库中,因此称为存储过程。当以后需要使用这个过程时,只需调用根据名称调用即可。

其实存储过程和Java中的方法、其他语言中的函数十分类似,也就是先将一堆代码抽象成一个函数,当之后需要使用时,不需要再重写一遍代码,而是直接根据名称调用相应的函数/方法即可。

对比常规的SQL语句来说,普通SQL在执行时需要先经过编译、分析、优化等过程,最后再执行,而存储过程则不需要,一般存储过程都是预先已经编译过的,这就好比咱们在讲《JVM-执行引擎》聊到过的JIT即时编译器一样,为了提升一些常用代码的执行效率,JIT会将热点代码编译成本地机器码,以此省略解释器翻译执行的步骤,从而做到提升性能的目的。

但使用存储过程有利有弊,具备的优点如下:

复用性:存储过程被创建后,可以在程序中被反复调用,不必重新编写该存储过程的SQL语句,同时库表结构发生更改时,只需要修改数据库中的存储过程,无需修改业务代码,也就意味着不会影响到调用它的应用程序源代码。

灵活性:普通的SQL语句很难像写代码那么自由,而存储过程可以用流程控制语句编写,也支持在其中定义变量,有很强的灵活性,可以完成复杂的条件查询和较繁琐的运算。

省资源:普通的SQL一般都会存储在客户端,如Java中的dao/mapper层,每次执行SQL需要通过网络将SQL语句发送给数据库执行,而存储过程是保存在MySQL中的,因此当客户端调用存储过程时,只需要通过网络传送存储过程的调用语句和参数,无需将一条大SQL通过网络传输,从而可降低网络负载。

高性能:存储过程执行多次后,会将SQL语句编译成机器码驻留在线程缓冲区,在以后的调用中,只需要从缓冲区中执行机器码即可,无需再次编译执行,从而提高了系统的效率和性能。

安全性:对于不同的存储过程,可根据权限设置执行的用户,因此对于一些特殊的SQL,例如清空表这类操作,可以设定root、admin用户才可执行。同时由于存储过程编写好之后,对于客户端而言是黑盒的,因此减小了SQL被暴露的风险。

但还是那句话,凡事有利必有弊,存储过程也会带来一些之前不存在的问题:

CPU开销大:如果一个存储过程中涉及大量逻辑运算工作,会导致MySQL所在的服务器CPU飙升,因而会影响正常业务的执行,有可能导致MySQL在线上出现抖动,毕竟MySQL在设计时更注重的是数据存储和检索,对于计算性的任务并不擅长。

内存占用高:为了尽可能的提升执行效率,因此当一个数据库连接反复调用某个存储过程后,MySQL会直接将该存储过程的机器码放入到连接的线程私有区中,当MySQL中的大量连接都在频繁调用存储过程时,这必然会导致内存占用率同样飙升。

维护性差:一方面是过于复杂的存储过程,普通的后端开发人员很难看懂,毕竟存储过程类似于一门新的语言,不同语言之间跨度较大。另一方面是很少有数据库的存储过程支持Debug调试,MySQL的存储过程就不支持,这也就意味着Bug出现时,无法像应用程序那样正常调试排查,必须得采取“人肉排查”模式,即一步步拆解存储过程并排查。
基于上述原因,咱们在不必要使用存储过程的情况下,就尽量减少存储过程的编写,除非特定的业务需求导致不得不用时,再将注意力转向这块。不过话虽这么说,但少量的存储过程并不会造成太大影响,除非你没事在MySQL中写几十、上百个存储过程,否则基本上不会导致“不良反应”出现。

对存储过程有了基本认知后,接着来聊一聊MySQL中该如何定义、调用及管理存储过程。

二、存储过程的定义、调用与管理

前面简单提过一嘴,存储过程类似于一门新的语言,在其中存在专门的语法规则,因此想要撰写一个高效的存储过程之前,我们得先掌握存储过程中的一些基本语法,例如创建、变量、流程控制、循环等基础语法。

但好在大家都并非刚学编程的小白,因此这些在其他语言中都存在的语法,其实我们只需要搞清楚在MySQL中的关键字即可,所以上手速度还是非常快的,那么 Les't Go~

2.1、存储过程的语法

先来看看存储过程的定义语法,如下:

DELIMITER $

-- 创建的语法:指定名称、入参、出参
CREATE
PROCEDURE存储过程名称(返回类型参数名1参数类型1,....)
[...这里在后面讲...]
-- 表示开始编写存储过程体
BEGIN
-- 具体组成存储过程的SQL语句....
-- 表示到这里为止,存储过程结束
END $

DELIMITER ;

实际上这个语法和其他语言定义函数/方法的过程类似,例如Java方法的定义:

访问修饰符 返回类型 方法名(参数类型 参数名称, ....){
    // 方法体...
}

存储过程的BEGIN、END就类似于Java方法的{},用来区分起始和结束的边界。OK~,所有语言的函数/方法定义时,一般都会分为四类,如下:

① 无参无返回。

② 有参无返回。

③ 无参有返回。

④ 有参有返回。

而SQL的存储过程也不例外,同样也支持这四种定义,主要依赖于IN、OUT、INOUT三个关键字来区分:

定义存储过程时,没有入参也没有出参,代表无参无返回类型。
定义存储过程时,仅定义了带有IN类型的参数,表示有参无返回类型。
定义存储过程时,仅定义了带有OUT类型的参数,表示无参有返回类型。
定义存储过程时,同时定义了带有IN、OUT类型的参数,或定义了带有INOUT类型的参数,表示有参有返回类型。

在上述给出的语法体中,最开始有一个DELIMITER $是什么意思呢?

其实这表示指定结束标识,在MySQL中默认是以;分号作为一条语句的结束标识,因此当存储过程的过程体中,如果包含了SQL语句,SQL语句以;结束时,MySQL会认为存储过程的定义也结束了,过程体就会和;结束符冲突,所以一般咱们要重新定义结束符,例如DELIMITER ,表示以作为结束标识,只有当MySQL识别到$符时,才会认为结束了。

但记得在结束之后,要再次把结束符改回;,即DELIMITER ;。

还有一条[...这里在后面讲...]是啥意思呢?这是指定存储过程的约束条件,取值范围有很多,如下:

① LANGUAGE SQL

[NOT] DETERMINISTIC

③ { CONTAINS SQL | NO SQL | READS SQL DATA | MODIFIES SQL DATA }

④ SQL SECURITY { DEFINER | INVOKER }

⑤ COMMENT '....'

是不是看起来很头大?确实,我写起来也头大,但接着往下看,分别解释一下吧。

① 说明存储过程中的过程体是否由SQL语句组成。

② 说明存储过程的返回值是否为固定的,没有[NOT]表示为固定的,默认为非固定的。

③ 说明过程体使用SQL语句的限制:

CONTAINS SQL:表示当前存储过程包含SQL,但不包含读写数据的SQL语句。

NO SQL:表示当前存储过程中不包含任何SQL语句。

READS SQL DATA:表示当前存储过程中包含读数据的SQL语句。

MODIFIES SQL DATA:表示当前存储过程中包含写数据的SQL语句。

④ 说明哪些用户可以调用当前创建的存储过程:

DEFINER:表示只有定义当前存储过程的用户才能调用。

INVOKER:表示任何具备访问权限的用户都能调用。

⑤注释信息,可以用来描述当前创建的存储过程。

上述的五条分别和之前的五种取值范围一一对应,估计大家现在直接来看会有些懵逼,其实这些大概了解即可,无需过多关注,一般在写存储过程的时候不会加上这些条件,通常都是使用默认的。

2.1.1、存储过程的定义

上面刚刚了解了存储过程的基础语法,但多少有点犯迷糊,因此接下来简单的先写几个存储过程简单感受一下:

-- 查询用户表中的所有信息
select*from`zz_users`;
+---------+-----------+----------+----------+---------------------+
| user_id | user_name | user_sex | password | register_time       |
+---------+-----------+----------+----------+---------------------+
|1|熊猫|女|6666|2022-08-1415:22:01|
|2|竹子|男|1234|2022-09-1416:17:44|
|3|子竹|男|4321|2022-09-1607:42:21|
|4|黑熊|男|8888|2022-09-1723:48:29|
|8|猫熊|女|8888|2022-09-2717:22:29|
+---------+-----------+----------+----------+---------------------+

-- 查询用户表的字段结构
desc`zz_users`;
+---------------+--------------+------+-----+---------+-------+
|Field|Type|Null|Key|Default|Extra|
+---------------+--------------+------+-----+---------+-------+
| user_id       |int(8)|NO| PRI |NULL||
| user_name     |varchar(255)| YES  | MUL |NULL||
| user_sex      |varchar(255)| YES  ||NULL||
| password      |varchar(255)| YES  ||NULL||
| register_time |varchar(255)| YES  ||NULL||
+---------------+--------------+------+-----+---------+-------+

下面会基于这张用户表,来设计几个需求,用来加强对存储过程的掌握度,一共四个案例:

① 定义一个存储过程,查询用户表的所有用户信息。

② 定义一个存储过程,接收一个用户名,查询用户的注册时间。

③ 定义一个存储过程,查询ID=1的用户密码并返回。

④ 定义一个存储过程,接收一个用户名,返回该用户名对应的用户ID。

这四个案例分别对应存储过程的四种类型,也就是分别演示IN、OUT、INOUT的用法,现在依次实践完成!

①查询用户表的所有用户信息

-- 改变结束标识为 $ 符号
DELIMITER $

CREATE
-- 定义存储过程的名称为:get_all_userInfo()
PROCEDURE get_all_userInfo()
BEGIN
-- 存储过程体:由一条查询全表的SQL组成
select*from`zz_users`;
-- 标识存储过程体结束
END $
-- 重置结束标识为 ; 符号
DELIMITER ;

上述定义了一个无参无返回的存储过程,接着来执行并调用一下该存储过程,如下:

CALL get_all_userInfo();
+---------+-----------+----------+----------+---------------------+
| user_id | user_name | user_sex | password | register_time       |
+---------+-----------+----------+----------+---------------------+
|1|熊猫|女|6666|2022-08-1415:22:01|
|2|竹子|男|1234|2022-09-1416:17:44|
|3|子竹|男|4321|2022-09-1607:42:21|
|4|黑熊|男|8888|2022-09-1723:48:29|
|8|猫熊|女|8888|2022-09-2717:22:29|
+---------+-----------+----------+----------+---------------------+

所有存储过程都是通过CALL命令来调用,调用刚刚定义的存储过程后,显然将用户表的所有用户信息查询出来啦!

②接收一个用户名,查询用户的注册时间

上面定义的存储过程,即没有入参,也没有返回值,接着咱们来演示一下带有入参的存储过程:

-- 这里又将结束标识换成了 // 符号
DELIMITER //

CREATE
-- 在定义存储过程时,用 IN 声明了一个入参
PROCEDURE get_user_register_time(IN name varchar(255))
BEGIN
select`register_time`from`zz_users`where`user_name`= name;
END//

DELIMITER ;

上面这个存储过程中,使用IN声明了一个入参,其类型为varchar,接着来看看如何调用呢?

CALL get_user_register_time("竹子");
+---------------------+
| register_time       |
+---------------------+
| 2022-09-14 16:17:44 |
+---------------------+

结果十分明显,达到了我们想要的效果,但在定义带有参数的存储过程时要注意:参数名必须在参数类型的前面,同时参数类型需要定义长度,也就是varchar(255),而并非varchar,否则低版本的MySQL会出现不兼容的问题。

③查询ID=1的用户密码并返回

上面掌握了IN的用法,接下来咱们瞅瞅OUT关键字的用法,可以用这个关键字指定返回值:

DELIMITER //

CREATE
-- 在定义存储过程时,用 OUT 声明了一个返回值
PROCEDURE get_user_password(OUT userPassword varchar(255))
BEGIN
select`password`into userPassword from`zz_users`where`user_id`=1;
END//

DELIMITER ;

在上述这个过程中,当ID=1的用户密码被查询出来之后,会通过into关键字,将查询出的密码赋给userPassword,那这种带有返回值的存储过程又该如何调用呢?如下:

CALL get_user_password(@userPassword);
select @userPassword;
+---------------+
| @userPassword |
+---------------+
|     6666      |
+---------------+

没错,要调用时直接使用@符号,在调用的地方定义变量即可,调用完成后想要查看返回值,还需要手动查询一次调用时定义的变量。

但定义有返回值的存储过程时,有一点也要额外注意:返回值的数据类型一定要和表字段保持一致,否则有可能出现类型转换错误,毕竟不是所有的类型之间可以隐式转换。

④接收一个用户名,返回该用户名对应的用户ID

这个需求有两种实现方式:

① 定义两个参数,一个IN类型的,一个OUT类型的。

② 使用INOUT关键字来实现。

咱们这里主要是为了讲解,因此就采取第二种方式来实现,毕竟还没用过INOUT关键字,如下:

DELIMITER $

CREATE
-- 在定义存储过程时,用 OUT 声明了一个返回值
PROCEDURE get_user_id(INOUT parameters varchar(255))
BEGIN
select`user_id`into parameters from`zz_users`where`user_name`= parameters;
END $

DELIMITER ;

上述存储过程中,利用INOUT定义了一个参数parameters,在下面的存储过程体当中,即使用它作为查询参数,又使用它作为了保存返回值的变量,再来看看这个函数如何调用:

-- 先定义一个变量
set@parameters="熊猫";
-- 将定义的变量在调用时传入
CALL get_user_id(@parameters);
-- 再次查询定义的变量
select@parameters;
+-------------+
|@parameters|
+-------------+
|1|
+-------------+

如果想要调用这类方法,咱们得先定义一个变量,然后在调用时传入,最后再次查询这个变量即可。

看到这里大家会发现,存储过程中的返回值,并不像正常语言中的return,而是通过变量传递的方式来实现的,上述这个存储过程,就类似于Java中的这段代码:

ublic void getUserID(Object obj){
    obj = 1;
}

Object obj = new Object("熊猫");
getUserID(obj);
System.out.println(obj);

本质上并没有return出结果,而是对传入的变量重新赋值,从而做到了值的传递。

OK~,刚刚介绍到了变量的概念,实际上在存储过程也存在这些基础语法,例如变量、判断、循环、游标等,接下来就聊一聊这些存储过程的基础语法。

2.1.2、系统变量和用户变量、局部变量

变量几乎是所有语言都支持的一种语法,存储过程也不例外,在MySQL中大体存在三种级别的变量,即系统变量、用户变量、局部变量,这三个不同级别的有效范围也不同,下面一起聊聊。

系统变量

在MySQL启动后,其内部也会存在许多的系统变量,系统的意思是指由MySQL定义的,而并非用户自己定义的,一般系统变量要么来自于MySQL编译期,要么来自于my.ini配置文件,对于具体拥有那些系统变量,可参考:MySQL官网文档-系统变量,这里就不做过多的赘述。

MySQL的系统变量也会分为两类,一类是全局级变量,一类是会话级变量,还记得在《MySQL事务篇-隔离机制》中,修改数据库隔离级别时的命令嘛?

当在修改命令中加上global关键字,则代表修改全局级别的系统变量,如若不加或加上session关键字,则表示只修改当前会话的系统变量,这是啥意思呢?修改全局级别表示对所有连接都生效,而修改会话级别的变量,表示只对当前连接生效,在当前连接中修改系统变量的值之后,是不会影响其他数据库连接的。

对于系统变量,想要查看或修改,使用两个@@符号即可,例如:

-- 查看某个系统变量
select @@xxx;
-- 修改某个系统变量
set @@xxx = "xxx";

用户变量

系统变量并非咱们的重点,接着来瞧瞧用户变量,也就是自定义的变量,其实非常简单,如下:

set @变量名称 = 变量值;
select @变量名称;

相较于系统变量而言,用户变量仅仅少了一个@符号而已,不过上述用户变量的赋值,中间的=也可改为:=,其作用也是相同的。除此之外,用户变量的定义还可以和SQL组合,如下:

-- 将用户表的总行数赋值给 row_count 变量
select @row_count := count(*) from `zz_users`;
-- 将 user_id 的平均值赋给 avg_user_id 变量
select avg(user_id) into @avg_user_id from `zz_users`;

上述这两种方式,都可以创建一个用户变量,也就意味着但凡出现@符号时,MySQL都会将其识别为在定义变量。

局部变量

前面简单讲述了用户变量,但在存储过程中还存在一种名为局部变量的概念,这也就是类似于在Java的方法中定义的变量,有效范围只对当前方法体生效,而局部变量亦是同理,只对当前存储过程体有效,其他存储过程或外部是无法读取或操作局部变量的,定义方式如下:

DECLARE 变量名称 数据类型 default 默认值;

是不是有点眼熟?这跟通过SQL创建表时,声明表字段的语法相差无几,就前面多了一个DECLARE关键字,举个简单的例子,如下:

DECLARE message varchar(255) default "not message";

上述定义了一个名为message的局部变量,如果后续使用时未对其赋值,该变量的默认值为"not message"。

后续使用局部变量时,主要有两种赋值方式,如下:

-- 赋值方式一
SET message = 变量值;
SET message := 变量值;

-- 赋值方式二
select 字段名或函数 into message from 表名;

非常的简单,接着来结合存储过程一起熟悉一下用户变量和局部变量:

DELIMITER //

CREATE
-- 定义了一个 求两数之和 的存储过程
PROCEDURE add_value(IN number1 int(8),OUTresultint(8))
BEGIN
-- 这里定义了一个局部变量:number2,默认值为 666
DECLARE number2 int(8)default666;
-- 将两个数字相加,计算得到的和放入用户变量 result 中
SETresult:= number1 + number2;
END//

DELIMITER ;

-- 定义一个用户变量,接收调用存储过程后得到的和
SET@result=0;
-- 调用存储过程,传入一个数字 888 以及接收结果的 result 变量
CALL add_value(888,@result);
-- 查询计算后的和
SELECT@result;
+---------+
|@result|
+---------+
|1554|
+---------+

对于局部变量的定义,必须要写在BEGIN、END之间,否则会提示语法错误,这一点需要在使用时注意,上述定义的存储过程,其工作十分简单,即计算两数之和并返回,具体的过程参考源码中的注释,经过这个例子相信大家对存储过程中的变量能够进一步掌握。

2.1.3、流程控制 - IF判断与CASE分支

上面简单掌握几种变量的语法后,接着再来说说存储过程中的流程控制,也就是条件判断、循环、跳转等语法,先来聊一聊所有语言都有的条件判断。

条件判断:IF

在存储过程中,主要有两类条件判断的语法,即IF、CASE,先来说说常见的IF,语法如下:

IF 条件判断 THEN
    -- 分支操作.....
ELSEIF 条件判断 THWN
    -- 分支操作.....
ELSE
    -- 分支操作.....
END IF

上述这段if判断语句基本上和其他语言中相差无几,当一个条件判断成立时,就会进入相应的分支中执行,否则程序会跳过该分支继续往下执行,举个案例快速过一下:

DELIMITER $

CREATE
PROCEDURE if_user_age(IN age int,OUT msg varchar(255))
BEGIN
    IF age <18THEN
SET msg :='未成年';
    ELSEIF age =18THEN
SET msg :='刚成年';
ELSE
SET msg :='已成年';
END IF;

END $

DELIMITER ;

上面定义了一个判断年龄的存储过程,调用时需要传入一个age值,内部会对传入的值进行判断,最后将判断结果写入到msg变量中,调用方式如下:

SET @msg:="Not Data";

CALL if_user_age(16,@msg);
SELECT@msg;
+---------+
|@msg|
+---------+
|未成年|
+---------+

CALL if_user_age(18,@msg);
SELECT@msg;
+---------+
|@msg|
+---------+
|刚成年|
+---------+

CALL if_user_age(25,@msg);
SELECT@msg;
+---------+
|@msg|
+---------+
|已成年|
+---------+

OK~,存储过程中分支判断的语法,与常规编程语言中的if、else if、else无太大差异,接着来看看CASE的语法。

分支判断:CASE

存储过程中的CASE语法,就类似于Java中的switch语法,但CASE有两种写法,如下:

-- 第一种语法
CASE变量
WHEN值1THEN
-- 分支操作1....
WHEN值2THEN
-- 分支操作2....
.....
ELSE
-- 分支操作n....
ENDCASE;

-- 第二种语法
CASE
WHEN条件判断1THEN
-- 分支操作1....
WHEN条件判断2THEN
-- 分支操作2....
.....
ELSE
-- 分支操作n....
ENDCASE;

举个例子快速过一下,这里就演示第一种语法,毕竟第二种方式就等同于多重IF判断:

DELIMITER $

CREATE
PROCEDURE test_case(IN n int)
BEGIN
CASE n
WHEN1THEN
select'竹子真的帅';
WHEN2THEN
select'熊猫真好看';
ELSE
select'两个都好看';
ENDCASE;
END $

DELIMITER ;

调用结果如下(上面的SELECT 'xxx'就类似于其他语言的print输出):

CALL test_case(1);
+---------------+
|竹子真的帅|
+---------------+
|竹子真的帅|
+---------------+

CALL test_case(2);
+---------------+
|熊猫真好看|
+---------------+
|熊猫真好看|
+---------------+

CALL test_case(3);
+---------------+
|两个都好看|
+---------------+
|两个都好看|
+---------------+

调用结果很明显,基本上与Java中的switch效果相同!OK~,接着来看看存储过程中的循环语法。

2.1.4、循环:LOOP、WHILE、REPEAT

编程中常见的循环有for、foreach、while、do-while四大类,而存储过程中也支持LOOP、WHILE、REPEAT三类循环,接着挨个简单过一下。

LOOP循环

先简单聊一聊LOOP,语法如下:

循环名称:LOOP
    -- 循环体....
END LOOP 循环名称;

在存储过程的循环,与其他编程语言的循环并不同,在存储过程中可以给每个循环取一个名字,后续可以基于这个名字来跳出循环,但如果想要跳出一个循环,还需要结合LEAVE这个关键字,否则会令循环成为一个死循环,无限执行下去,现在先上个简单的例子:

DELIMITER $

CREATE 
    PROCEDURE test_loop(IN num int)
BEGIN
--定义一个局部变量:num
    DECLARE num int(8)default1;

    add_loop:LOOP
--一直循环对num +1
        SET num = num +1;
--当num被加到100时
        IF num >=100 THEN
--跳出循环
            LEAVE add_loop;
END IF;
END LOOP add_loop;

select num;
END $

DELIMITER ;

这个存储过程很简单,就是利用LOOP循环对局部变量num进行累加,加到100时退出循环,最后查询一下num值,调用结果如下:

CALL test_loop();
+--------+
|  num   |
+--------+
|  100   |
+--------+

效果跟想象的差不多,num最终值为100,OK,接着看看其他的循环。

WHILE循环

WHILE循环的语法也和前面的LOOP循环类似,如下:

【循环名称】:WHILE 循环条件 DO
    -- 循环体....
END WHILE 【循环名称】;

其实对于这个循环名称,可以写也可以不写,主要是利用名称来做跳转,这点后续说,先来举个简单的例子感受一下WHILE循环:

DELIMITER $

CREATE
PROCEDURE test_while()
BEGIN
-- 定义一个局部变量:num
DECLARE num int(8)default1;

-- 循环对num=1,当<=10时退出
    WHILE num <=10 DO
-- 一直循环对num + 1
SET num = num +1;
END WHILE;

-- 最后查询一下num值
SELECT num;
END $

DELIMITER ;

这个存储过程也是一个对num变量不断做+1的循环,调用结果如下:

CALL test_while();
+-------+
|  num  |
+-------+
|  11   |
+-------+

但此时来看,答案为何是11而并不是10呢?因为循环条件是num<=10,也就是当num=10的时候,依旧会循环一次,num又被+1,所以最终num=11。

REPEAT循环

REPEAT循环和之前两个循环不同,在这种循环中,有专门控制循环结束的语法,如下:

【循环名称】:REPEAT
    -- 循环体....
UNTIL 结束循环的条件判断
END REPEAT 【循环名称】;

上述语法种,当UNTIL关键字之后的条件为真时,循环就会终止,OK,来看个用例:

DELIMITER $

CREATE
PROCEDURE test_repeat()
BEGIN
-- 定义一个局部变量:num
DECLARE num int(8)default1;

    REPEAT
SET num = num +1;
    UNTIL num>=10
END REPEAT;

-- 最后查询一下num值
SELECT num;
END $

DELIMITER ;

存储过程和之前的循环案例相同,也就是对num做累加,调用结果如下:

CALL test_repeat();
+-------+
|  num  |
+-------+
|  10   |
+-------+

嗯!?此时num=10是啥原因呢?因为当num>=10时会停止循环,当num被累加到10后就触发了终止条件,因此最终num=10。

OK~,到这里就简单的过了三种循环的基本语法,其中并未涉及太多的案例实操,毕竟这些循环的用法和正常编程语言并无太大差异,所以简单演示语法即可,其他的根据业务来编写循环体即可。

接着来看看存储过程中的跳转语法,其实在之前的LOOP循环中简单的用过,下面一起聊一聊。

2.1.5、跳转:LEAVE、ITERATE

LEAVE、ITERATE两个跳转的关键字,其实本质上就和Java中的break、continue类似,LEAVE主要功能是结束循环体,当执行循环体时遇到了LEAVE关键字,就会结束当前循环。而ITERATE则是跳出本次循环,继续下次循环的意思,作用与continue相同,接着举个案例来简单的实验一下。

-- 测试LEAVE关键字终止循环
DELIMITER $

CREATE
PROCEDURE test_leave()
BEGIN
-- 定义一个局部变量:num
DECLARE num int(8)default1;

        add_while:WHILE TRUE DO
-- 对num持续做+1
SET num = num +1;

-- 如果num=10,用LEAVE终止循环
            IF num =10THEN
                LEAVE add_while;
END IF;

END WHILE add_while;


-- 最后查询一下num值
SELECT num;
END $

DELIMITER ;

依旧还是这个令人熟悉的例子,在这里咱们通过WHILE TRUE的方式开启了一个死循环,后续利用LEAVE来终止循环,调用结果如下:

CALL test_leave();
+-------+
|  num  |
+-------+
|  10   |
+-------+

最终num=10,这是因为当num=10的时候,就会执行LEAVE add_while;语句,会通过LEAVE关键字终止名为add_while的循环。

存储过程中的这点设计的很不错,在编写循环结构时,由于可以为每个循环命名,因此后续要跳出、终止某个循环时,可以直接通过循环的名称来跳转,在循环嵌套的情况下,这点尤为好用!

-- 测试ITERATE关键字跳出循环
DELIMITER $

CREATE
PROCEDURE test_iterate()
BEGIN
-- 定义一个局部变量:num
DECLARE num int(8)default0;
-- 定义一个局部变量用来统计偶数和
DECLARE even_sum int(8)default0;

        sum_while:WHILE num <=100 DO
-- 对num持续做+1
SET num = num +1;

-- 如果num=10,用LEAVE终止循环
            IF num %2=0THEN
SET even_sum = even_sum + num;
ELSE
-- 如果num不为偶数则跳过本次循环
                ITERATE sum_while;
END IF;

END WHILE sum_while;

-- 最后查询一下偶数之和
SELECT even_sum;
END $

DELIMITER ;

上述这个存储过程作用也很简单,首先开启一个循环遍历1~100,接着对100以内的所有偶数求和,如果num%2=0则表示为偶数,将结果累加到even_sum变量中,不为0则通过ITERATE关键字跳出本次循环,继续下次循环,最终调用结果如下:

+------------+
|  even_sum  |
+------------+
|   2550     |
+------------+

结果确实达到了咱们想要的效果!100内的偶数之和确实为2550。OK,最后再了解一下存储过程中的游标即可。

2.1.6、存储过程的游标

游标是所有数据库的存储过程中,很重要的一种特性,它可以对一个结果集中的数据按条处理,也就意味着原本查询出的数据是一个整体性质的集合,而使用游标可以对该集合中的数据逐条处理,在使用游标时一般都会遵循下述四步:

-- ①声明(创建)游标
DECLARE游标名称CURSORFORselect...;

-- ②打开游标
OPEN游标名称;

-- ③使用游标
FETCH游标名称INTO变量名称;

-- ④关闭游标
CLOSE 游标名称;

观察游标的声明语法应该会发现,它和创建局部变量的方式类似,但后面会加上CURSOR FOR关键字来表明创建的是游标,OK~,接着来个简单的案例感受一下游标的使用,需求如下:

计算用户表中user_id最大的前N个奇数ID之和。

这个需求听起来似乎有些不合常理,确实有些奇葩哈,但主要是为了演示游标的用法,因此就随意编造了一个需求,实现如下:

DELIMITER //

CREATE
PROCEDURE id_odd_number_sum(IN N int(8),OUT sum int(8))
BEGIN
-- 声明局部变量:
--   uid:用于记录每一个user_id
--  odd_id_count:记录奇数ID的个数
--  odd_id_sum:记录奇数ID的和
DECLARE uid int(8)DEFAULT0;
DECLARE odd_id_count int(8)DEFAULT0;
DECLARE odd_id_sum int(8)DEFAULT0;

-- 声明一个游标:存储倒序的user_id结果集
DECLARE uid_cursor CURSORFORselect user_id from zz_users orderby user_id desc;

-- 打开游标
OPEN uid_cursor;

-- 使用游标
    REPEAT
-- 将游标中的每一条user_id值,赋给user_id变量
FETCH uid_cursor INTO uid;

-- 如果当前user_id是奇数,则将ID值累加到sum中
            IF uid %2!=0THEN
SET odd_id_count = odd_id_count +1;
SET odd_id_sum = odd_id_sum + uid;
END IF;
-- 根据传入的N来决定循环的次数
    UNTIL odd_id_count >= N END REPEAT;

-- 将前N个奇数ID之和赋给外部变量:sum
SET sum = odd_id_sum;
-- 关闭游标
CLOSE uid_cursor;
END//

DELIMITER ;

代码的具体逻辑参考上述注释,最终调用结果如下:

select *from zz_users;
+---------+-----------+----------+----------+---------------------+
| user_id | user_name | user_sex | password | register_time       |
+---------+-----------+----------+----------+---------------------+
|1|熊猫|女|6666|2022-08-1415:22:01|
|2|竹子|男|1234|2022-09-1416:17:44|
|3|子竹|男|4321|2022-09-1607:42:21|
|4|黑熊|男|8888|2022-09-1723:48:29|
|8|猫熊|女|8888|2022-09-2717:22:29|
+---------+-----------+----------+----------+---------------------+

CALL id_odd_number_sum(2,@sum);
select@sum;
+------+
|  num |
+------+
|4|
+------+

表中总共存在1、3这两个奇数ID,然后调用存储过程时传入2,表示获取前两个奇数ID之和,最终结果为4(1+3),显然达到了咱们的需求,在这个过程中我们利用了游标对order by之和的结果集,其中的每个user_id进行了逐条处理、逐条判断,从而完成了前面给出的需求。

2.1.7、存储过程语法小结

到这里,咱们介绍了存储过程中的一些基本语法,但大家想要彻底熟悉每种语法,定然需要多加练习,毕竟“纸上得来终觉浅,绝知此事要躬行”,这类实操性质的知识,自己多练方能真正掌握,但其实存储过程中还有错误处理机制,就类似于Java中的异常机制一样,但略微有些鸡肋,因此不再展开讲解,感兴趣的小伙伴可自行研究~

数据库系统中除开存储过程外,还有一种名为存储函数的概念,它和存储过程类似,但又有些不同,这里也不再展开阐述,有兴趣的小伙伴也可以自己去研究一下,毕竟存储过程也好,存储函数也罢,如若并非专门做数据库开发的岗位,一般接触都比较少。

接着一起来看看,作为客户端,又该如何调用编写好的存储过程呢?下面以Java-MyBatis为例。

2.2、客户端如何调用存储过程

一般在Java项目中,都会选择MyBatis作为操作数据库的ORM框架,那在其中调用存储过程的方式也很简单,如下:

<parameterMap type="根据存储过程决定" id="自己命名"> 
    <parameter property="存储过程参数1" jdbcType="数据类型" mode="IN"/>
    <parameter property="存储过程参数2" jdbcType="数据类型" mode="IN"/>
    <parameter property="存储过程参数3" jdbcType="数据类型" mode="OUT"/>
</parameterMap>

<insert id="和Dao接口的方法同名" parameterMap="上面的ID值" statementType="CALLABLE"> 
    {call 存储过程名(?, ?, ?)} 
</insert >

当需要调用存储过程中,只需要调用该xml对应的Dao/Mapper层接口即可。

2.3、存储过程的管理

所谓的存储过程管理,也就是指存储过程的查看、修改和删除,在MySQL中也提供了一系列命令,以便于咱们完成这些工作,如下:

SHOW PROCEDURE STATUS;:查看当前数据库中的所有存储过程。

SHOW PROCEDURE STATUS WHERE db = '库名' AND NAME = '过程名';:查看指定库中的某个存储过程。

SHOW CREATE PROCEDURE 存储过程名;:查看某个存储过程的源码。

ALTER PROCEDURE 存储过程名称 ....:修改某个存储过程的特性。

DROP PROCEDURE 存储过程名;:删除某个存储过程。

当然,也可以通过下述命令来查看某张表的存储过程:

-- 查看某张表的所有存储过程
select*from表名.Routineswhere routine_type ="PROCEDURE";

-- 查看某张表的某个存储过程
select*from表名.Routineswhere routine_name ="过程名"AND routine_type ="PROCEDURE";

还有其他更多的命令就不列举了,后续会出一章《MySQL命令大全》专门来罗列各类命令和函数。

2.4、存储过程的应用场景

存储过程到底该不该用,这点在《阿里开发手册》中是强制禁止使用的:

因为存储过程难以维护,同时拓展性和移植性都很差,因此大多数的开发规范中都会明令禁止使用,但存储过程能够带来的优势也极为明显,因此到底是否该用,这点仁者见仁智者见智,它是一把双刃剑,用的好其实能够给咱们带来不小的收益,那在那些地方适合用呢?

① 插入测试数据时,一般为了测试项目,都会填充测试数据,往常是写Java-for跑数据,但现在可以用存储过程来批量插入,它的效率会比用for循环快上无数倍,毕竟从Java传递SQL需要时间,拿到SQL后还要经过解析、优化....一系列工作,而用存储过程则不会有这些问题。

② 对数据做批处理时,也可以用存储过程来跑,比如将一个表中的数据洗到另外一张表时,就可以利用存储过程来处理。

③ 一条SQL无法完成的、需要应用程序介入处理的业务,尤其是组成起来SQL比较长时,也可以编写一个存储过程,然后客户端调用即可。

三、MySQL的触发器

触发器本质上是一种特殊的存储过程,但存储过程需要人为手动调用,而触发器则不需要,它可以在执行某项数据操作后自动触发,就类似于Spring-AOP中的切面一样,当执行了某个操作时就会触发相应的切面逻辑。

但触发器是在MySQL5.0.2版本以后才开始被支持的,在此之前的MySQL并不能创建触发器,而触发器的触发条件是以事件为单位的,对于事件相信诸位一定不陌生,比如前端的按钮标签,就会经常用到它的点击事件,当用户点击某个按钮后,就会触发对应的点击函数,从而执行相应逻辑,而MySQL触发器亦是同理。

创建一个触发器的语法如下:

CREATE TRIGGER触发器名称
{BEFORE | AFTER}{INSERT|UPDATE|DELETE}ON表名
FOREACHROW
    -- 触发器的逻辑(代码块);

从上述语法结构可以看出,对于每一个触发器而言,总共有插入、修改以及删除三种触发事件可选,同时也可以选择将触发器放在事件开始前,亦或事件结束后执行,这点几乎和AOP切面的切入点一模一样,同时也要记住:每个触发器创建后,必然是附着在一张表上的,因为在创建触发器的时候必须要指定表名,它会监控这张表上发生的事件,比如举个例子:

当我对zz_users表创建了一个插入事件的后置处理器时,那么当每次表中插入数据后,都会自动触发一次相应的逻辑。

接下来依旧上个小案例,简单的感受一下触发器的用法,当然,依旧不要在乎需求是否合理,主要是感受触发器的用法:

-- 创建一张注册日志表
CREATETABLE`register_log`(
-- 注册时间
`register_time`varchar(255),
-- 注册地
`register_address`varchar(255),
-- 注册设备
`register_facility`varchar(255)
)
ENGINE =InnoDB
CHARACTERSET= utf8 
COLLATE= utf8_general_ci 
ROW_FORMAT =Compact;

-- 在用户表上创建一个触发器
DELIMITER //

CREATETRIGGER zz_users_insert_before
  BEFORE INSERTON zz_users
FOREACHROW
BEGIN
insertinto`register_log`values(NOW(),"北京市海淀区","IOS");
END//

DELIMITER ;

上述案例中,对zz_users用户表建立了一个插入后置触发器,也就是当用户表中插入一条数据时,会向注册日志表中自动添加一条注册日志,测试效果如下:

-- 向用户表插入一条用户记录
INSERTINTO`zz_users`VALUES(9,"棕熊","男","0369","2022-10-17 23:48:29");

-- 查询注册日志表
select*from`register_log`;
+---------------------+--------------------+-------------------+
| register_time       | register_address   | register_facility |
+---------------------+--------------------+-------------------+
|2022-10-1818:52:50|北京市海淀区| IOS               |
+---------------------+--------------------+-------------------+

刚刚并未手动插入注册日志表的数据,但会发现:当用户表中插入一条数据时,会自动触发创建的插入后置触发器,这个效果相信了解过切面编程的小伙伴都不陌生。

但此时有个小问题,我们可以为一张表的某个事件创建触发器,但在触发器中有没有办法拿到当前操作的数据呢?比如在insert事件中能否拿到插入的数据?update事件中能否拿到修改前后的数据?答案是可以的,在触发器中有NEW、OLD这两个关键字。

3.1、触发器的NEW、OLD关键字

在触发器中,NEW表示新数据,OLD表示老数据,各类型的事件如下:

insert插入事件:NEW表示当前插入的这条行数据。

update修改事件:NEW表示修改后的新数据,OLD表示修改前的老数据。

delete删除事件:OLD表示删除前的老数据。

这样似乎有些令人犯迷糊呀,举个简单的例子,以用户表的修改事件为例:

-- 执行的修改语句
update`zz_users`set user_name ="粉熊"and user_sex ="女"where user_id =9;

-- 用户表修改事件的触发器
DELIMITER //

CREATETRIGGER zz_users_update_before
  BEFORE UPDATEON zz_users
FOREACHROW
BEGIN
DECLARE new_name varchar(255);
DECLARE old_name varchar(255);

-- 可以通过 NEW 关键字拿到修改后的新数据(粉熊)
SET new_name := NEW.user_name;

-- 可以通过 OLD 关键字拿到修改前的老数据(棕熊)
SET old_name := OLD.user_name;
END//

DELIMITER ;

经过上述这个例子之后,大家应该更能理解NEW、OLD两个关键字,由于这两个关键字存储,它能够使触发器更为灵活~

为啥说触发器是一种特殊的存储过程呢?因为本质上触发器中所用的语法,和存储过程完全是一模一样的,只是存储过程需要手动调用,而触发器则是根据事件自动触发。

触发器的可以用于一些特殊的业务场景,比如需要在写数据前做数据安全性检测、又或者是洗数据时需要效验数据完整性、正确性、又或者是数据的备份和同步等这类需求。

3.2、触发器的管理

SHOW TRIGGERS;:查看当前数据库中定义的所有触发器。

SHOW CREATE TRIGGER 触发器名称;:查看当前库中指定名称的触发器。

SELECT * FROM information_schema.TRIGGERS;:查看MySQL所有已定义的触发器。

DROP TRIGGER IF EXISTS 触发器名称;:删除某个指定的触发器。

四、总结

OK~,本篇到这里就接近尾声了,其实原本是不打算写存储过程与触发器这一章的,毕竟更多的偏向数据库基础,因此放在《全解MySQL数据库》这个定位于数据库进阶的专栏中,略微会有些不合适,但存储过程和触发器很多小伙伴也未了解过这块知识,因此还是写了本章,补齐大家对这块的空缺。

但存储过程一般在线上要少用,或者要用在合适的位置,毕竟曾说过它是一把双刃剑,有利有弊,因此线上的存储过程尽量不要太多,主要可将其用在一些复杂、特殊的业务场景下~

关于我
loading