Mysql Join-连接查询(中)

来源：恒创科技编辑：恒创科技编辑部

2023-12-20 22:26:59

Mysql Join-连接查询(中)认识

就我平时的数据接触来看, 连接查询也没有很复杂,不够是非常需要耐心和逻辑的, 一点点将数据查出来, 拼接等. 没有什么技巧, 多练习就会了. 无非就是表之间根据共同key来连接, 查询时结合union, where, 子查询这些..., 真的不难的, 就是有点烦, 有时会嵌套很多层,会晕.

实现

这里在网上找了一些培训班的查询练习资料做演示, 其实市场面上的培训班资料, 怎么说的, 优势在于覆盖面广, 重视应用, 缺点是很肤浅,只适合入门了解.

部门表dept (id, name)员工表emp(id, name, gender, salary, join_date, dept_id)关联key: dept.id ~ dept_id (我不用外键)准备数据

-- mysql -u root -p ....
-- show database;
-- use cj;
-- show tables;
-- 新建表格测试数据
drop table if exists emp;
drop table if exists dept;

create table dept(
    id int primary key auto_increment,
    name varcahr(20)
);
-- 员工表
create table emp(
    id int primary key auto_increment,
    name varchar(20),
    gender char(1),
    salary double,
    join_date date,
    dept_id int
);

-- 插入测试数据
insert into dept(name) values
("市场部"), ("财务部"), ("研发部");

insert into emp values
(0, '老三','男',20000,'2016-02-24',1);
(0, '老二','男',18000,'2017-12-02',2);
(0, '亚洲','男',17000,'2018-08-08',1);
(0, '油油','女',14000,'2018-10-07',3);
(0, '老四','女',15000,'2014-03-14',1);
(0, '阳哥','男',3000,'2019-03-14',null);

-- 查看
select * from emp;
+----+------+--------+--------+------------+---------+
| id | name | gender | salary | join_date  | dept_id |
+----+------+--------+--------+------------+---------+
|  1 | 老三 | 男     |  20000 | 2016-02-24 |       1 |
|  2 | 老二 | 男     |  18000 | 2017-12-02 |       2 |
|  3 | 亚洲 | 男     |  17000 | 2018-08-08 |       1 |
|  4 | 油油 | 女     |  14000 | 2018-10-07 |       3 |
|  5 | 老四 | 女     |  15000 | 2014-03-14 |       1 |
|  6 | 阳哥 | 男     |   3000 | 2019-03-14 | NULL    |
+----+------+--------+--------+------------+---------+

select * from dept;
+----+--------+
| id | name   |
+----+--------+
|  1 | 市场部 |
|  2 | 财务部 |
|  3 | 研发部 |

小试join 和子查询

标量子查询

-- 查询工资最高的员工信息
-- 子查询(标量): 先查出高的工资, 然后作为where的条件
select * 
from emp e
where
    e.salary = (
        select max(salary)
        from emp
    );
  
 +----+------+--------+--------+------------+---------+
| id | name | gender | salary | join_date  | dept_id |
+----+------+--------+--------+------------+---------+
|  1 | 老三 | 男     |  20000 | 2016-02-24 |       1 |
+----+------+--------+--------+------------+---------+

列子查询,配合 in 判断

-- 查询 市场部 和 研发部 的信息

-- where (emp.dept_id) IN (dept.id 中符合条件的IDS)
select * 
from emp e
where e.dept_id in (
    select id
    from dept d
    where d.name in ("市场部", "研发部")
);

+----+------+--------+--------+------------+---------+
| id | name | gender | salary | join_date  | dept_id |
+----+------+--------+--------+------------+---------+
|  1 | 老三 | 男     |  20000 | 2016-02-24 |       1 |
|  3 | 亚洲 | 男     |  17000 | 2018-08-08 |       1 |
|  4 | 油油 | 女     |  14000 | 2018-10-07 |       3 |
|  5 | 老四 | 女     |  15000 | 2014-03-14 |       1 |
+----+------+--------+--------+------------+---------+

-- 方案2 表连接inner join 再进行过滤
select *
from (
    select e.*, d.name as "部门"
    from emp e, dept d
    where e.dept_id = d.id 
 ) as a
where a.部门 in ("市场部", "研发部");
    
-- 方案3 改进2
select e.*, d.name as "部门"
from emp e, dept d
where (
    (e.dept_id = d.id) and
    (d.name in ("市场部", "财务部"))
);

查询特定字段, 分别用 子查询和join实现

-- 查询2018年后入职的员工id, 姓名, 日期, 部门名称

-- 技巧: 先连接表 as别名, 通过别名where... , 最后再写查询字段
select * 
from 
  emp as e
  dept d -- as 可省略
where 
  e.xxx 
  d.xxx 
  
-- 最后再写要查询的字段
select e.xx, e.xx, d.xx

select e.id, e.name, e.join_date, d.name as "部门"
from 
    emp e,
    dept d
where 
    e.dept_id = d.id  -- 没有部门的不算哦
    and e.join_date >= "2018/1/1";
    
+----+------+------------+--------+
| id | name | join_date  | 部门   |
+----+------+------------+--------+
|  3 | 亚洲 | 2018-08-08 | 市场部 |
|  4 | 油油 | 2018-10-07 | 研发部 |
+----+------+------------+--------+

-- 方案2 子查询
select e.id, e.name, e.join_date, d.name
from (
    -- 先提前筛选出来
    select * 
    from emp
    where join_date >="2018/1/1"
) as e,
dept as d
where e.dept_id = d.id;

强化join练习准备数据部门表 dept(id, d_ame, location)岗位表 job(id, j_name, description)员工表 emp(id, e_name, job_id, leader, join_date, salary, bonus, dept_id)工资等级表 salary_grade(grade, s_min, s_max)关联(坚持不用外键) job.id ~emp.job_id, emp.dept_id ~ dept.id

drop table if exists dept;
drop table if exists job;
drop table if exists emp;
drop table if exists salary_grade;

-- 部门表
create table dept(
    id int primary key,
    d_name varchar(20),
    location varchar(30)
);

-- 岗位表
create table job(
    id int primary key,
    j_name varchar(20),
    description varchar(30)  
);

-- 员工表
create table emp(
    id int primary key,
    e_name varchar(10),
    job_id int,
    leader varchar(10), -- 直属领导
    join_date date,
    salary decimal(8,2),
    bonus decimal(7,2), -- 奖金
    dept_id int
);

-- 工资等级表
create table salary_grade(
    grade int primary key, -- 级别
    s_min int, -- 下界
    s_max int -- 上界
);

-- 添加测试数据 
INSERT INTO dept VALUES 
(10,'研发部','深圳'),
(20,'产品部','深圳'),
(30,'销售部','广州'),
(40,'财务部','上海');

 INSERT INTO job (id, j_name, description) VALUES
 (1, 'CEO', '管理整个公司，接单'),
 (2, '经理', '管理部门员工'),
 (3, '销售', '向客户销售商品'),
 (4, '文员', '职能管理');
 
 
 insert into salary_grade values 
 (1,7000,12000),
 (2,12010,14000),
 (3,14010,20000),
 (4,20010,30000),
 (5,30010,99990);


INSERT INTO emp VALUES 
(1001,'孙悟空',4,1004,'2014-12-17','8000.00',NULL,20),
(1002,'卢俊义',3,1006,'2001-02-20','16000.00','3000.00',30),
(1003,'林冲',3,1006,'2001-02-22','12500.00','5000.00',30),
(1004,'唐僧',2,1009,'2018-04-02','29750.00',NULL,20),
(1005,'李逵',4,1006,'2017-09-28','12500.00','14000.00',30),
(1006,'宋江',2,1009,'2015-05-01','28500.00',NULL,30),
(1007,'刘备',2,1009,'2019-09-01','24500.00',NULL,10),
(1008,'猪八戒',4,1004,'2007-04-19','30000.00',NULL,20),
(1009,'罗贯中',1,NULL,'2016-11-17','50000.00',NULL,10),
(1010,'吴用',3,1006,'2017-09-08','15000.00','0.00',30),
(1011,'沙僧',4,1004,'2012-05-23','11000.00',NULL,20),
(1012,'李逵',4,1006,'2008-12-03','9500.00',NULL,30),
(1013,'小白龙',4,1004,'2016-12-03','30000.00',NULL,20),
(1014,'关羽',4,1007,'2019-01-23','13000.00',NULL,10);

预览一波测试数据

-- 预览一波
mysql> select * from dept;
+----+--------+----------+
| id | d_name | location |
+----+--------+----------+
| 10 | 研发部 | 深圳     |
| 20 | 产品部 | 深圳     |
| 30 | 销售部 | 广州     |
| 40 | 财务部 | 上海     |
+----+--------+----------+

mysql> select * from job;
+----+--------+--------------------+
| id | j_name | description        |
+----+--------+--------------------+
|  1 | CEO    | 管理整个公司，接单 |
|  2 | 经理   | 管理部门员工       |
|  3 | 销售   | 向客户销售商品     |
|  4 | 文员   | 职能管理           |
+----+--------+--------------------+

mysql> select * from salary_grade;
+-------+-------+-------+
| grade | s_min | s_max |
+-------+-------+-------+
|     1 |  7000 | 12000 |
|     2 | 12010 | 14000 |
|     3 | 14010 | 20000 |
|     4 | 20010 | 30000 |
|     5 | 30010 | 99990 |
+-------+-------+-------+

mysql> select * from emp limit 5;
+------+--------+--------+--------+------------+----------+----------+---------+
| id   | e_name | job_id | leader | join_date  | salary   | bonus    | dept_id |
+------+--------+--------+--------+------------+----------+----------+---------+
| 1001 | 孙悟空 |      4 | 1004   | 2014-12-17 | 8000.00  | NULL     |      20 |
| 1002 | 卢俊义 |      3 | 1006   | 2001-02-20 | 16000.00 | 3000.00  |      30 |
| 1003 | 林冲   |      3 | 1006   | 2001-02-22 | 12500.00 | 5000.00  |      30 |
| 1004 | 唐僧   |      2 | 1009   | 2018-04-02 | 29750.00 | NULL     |      20 |
| 1005 | 李逵   |      4 | 1006   | 2017-09-28 | 12500.00 | 14000.00 |      30 |
+------+--------+--------+--------+------------+----------+----------+---------+

case1: (2张表) 查询员工信息, 包括员工编号, 姓名, 工资, 职位名称, 职务描述

流程: 梳理好涉及的表及字段; 表的连接条件技巧:from > where > group by 及聚合函数 > having > order > select

分析:

emp表: id, e_name, salaryjob表: j_name, description**连接条件: left join 或内连接, emp.job_id = jop.id **

-- 用left join, 平时excel 的vlookup 就是这样玩的
select *
from emp e
  left join job d
  on e.job_id = d.id;

select 
  e.id,
  e.e_name,
  e.salary,
  d.j_name,
  d.description
from emp e
  left join job d
  on e.job_id = d.id;

-- out
+------+--------+----------+--------+--------------------+
| id   | e_name | salary   | j_name | description        |
+------+--------+----------+--------+--------------------+
| 1009 | 罗贯中 | 50000.00 | CEO    | 管理整个公司，接单 |
| 1004 | 唐僧   | 29750.00 | 经理   | 管理部门员工       |
| 1006 | 宋江   | 28500.00 | 经理   | 管理部门员工       |
| 1007 | 刘备   | 24500.00 | 经理   | 管理部门员工       |
| 1002 | 卢俊义 | 16000.00 | 销售   | 向客户销售商品     |
| 1003 | 林冲   | 12500.00 | 销售   | 向客户销售商品     |
| 1010 | 吴用   | 15000.00 | 销售   | 向客户销售商品     |
| 1001 | 孙悟空 | 8000.00  | 文员   | 职能管理           |
| 1005 | 李逵   | 12500.00 | 文员   | 职能管理           |
| 1008 | 猪八戒 | 30000.00 | 文员   | 职能管理           |
| 1011 | 沙僧   | 11000.00 | 文员   | 职能管理           |
| 1012 | 李逵   | 9500.00  | 文员   | 职能管理           |
| 1013 | 小白龙 | 30000.00 | 文员   | 职能管理           |
| 1014 | 关羽   | 13000.00 | 文员   | 职能管理           |
+------+--------+----------+--------+--------------------+

case2: (3张表) 查询员工编号, 姓名, 工资, 职位, 部门名称, 部门地点

emp表: id, e_name, salaryjob表: j_namedept表: d_name, location连接: 左连接, emp.job_id = job.id, emp.dept_id = dept.id

-- 我通常是先全部查出来, 再进行where
select * 
from emp e
  left join job j
  on e.job_id = j.id
  left join dept d  -- 继续连
  on e.dept_id = d.id;

select
  e.id,
  e.e_name,
  e.salary,
  j.j_name,
  -- d.d_name,
  d.location
from emp e
  left join job j
  on e.job_id = j.id
  -- 继续连接...
  left join dept d
  on e.dept_id = d.id
limit 3;

+------+--------+----------+--------+----------+
| id   | e_name | salary   | j_name | location |
+------+--------+----------+--------+----------+
| 1009 | 罗贯中 | 50000.00 | CEO    | 深圳     |
| 1004 | 唐僧   | 29750.00 | 经理   | 深圳     |
| 1006 | 宋江   | 28500.00 | 经理   | 广州     |
+------+--------+----------+--------+----------+

case3: 查询员工姓名, 工资, 工资等级 (between....and, 判断条件做 Join)

分析

emp表: e_name, salarysalary_grade表: grade连接条件: JOIN, e.salary BETWEEN s.s_min AND s.s_max

select 
  e.e_name,
  e.salary as "薪资",
  s.grade as "薪资等级"
from emp e
  join
  salary_grade s
  on e.salary between s.s_min and s.s_max
limit 5;
  
+--------+----------+----------+
| e_name | 薪资     | 薪资等级 |
+--------+----------+----------+
| 孙悟空 | 8000.00  |        1 |
| 卢俊义 | 16000.00 |        3 |
| 林冲   | 12500.00 |        2 |
| 唐僧   | 29750.00 |        4 |
| 李逵   | 12500.00 |        2 |
+--------+----------+----------+
5 rows in set (0.11 sec)

case4: (4张表) 查询员工姓名, 工资, 职位, 部门, 部门地点, 工资等级

分析

emp表: e_name, salaryjob表: j_namedept表: d_name, locationsalary_grade表: grade连接条件e, j, d, s:e.job_id = j.ide.dept_id = d.ide.salary BETWEEN s.s_min AND s.s_max

select *
from emp e             
  left join job j    -- 职位表
  ON e.job_id = j.id
  left join dept d   -- 部门表
  ON e.dept_id = d.id
  join salary_grade s -- 薪资等级表
  ON e.salary between s.s_min and s.s_max
  
limit 1;

left 拼接了一张超级大表

+------+--------+--------+--------+------------+----------+---------+---------+----+--------+----------------+----+--------+----------+-------+-------+-------+
| id   | e_name | job_id | leader | join_date  | salary   | bonus   | dept_id | id | j_name | description    | id | d_name | location | grade | s_min | s_max |
+------+--------+--------+--------+------------+----------+---------+---------+----+--------+----------------+----+--------+----------+-------+-------+-------+
| 1001 | 孙悟空 |      4 | 1004   | 2014-12-17 | 8000.00  | NULL    |      20 |  4 | 文员   | 职能管理       | 20 | 产品部 | 深圳     |     1 |  7000 | 12000 |

select 
  e.e_name, 
  e.salary,
  j.j_name,
  d.d_name,
  d.location,
  s.grade
from emp e             
  left join job j    -- 职位表
  ON e.job_id = j.id
  left join dept d   -- 部门表
  ON e.dept_id = d.id
  join salary_grade s -- 薪资等级表
  ON e.salary between s.s_min and s.s_max
  
limit 5;
  
+--------+----------+--------+--------+----------+-------+
| e_name | salary   | j_name | d_name | location | grade |
+--------+----------+--------+--------+----------+-------+
| 孙悟空 | 8000.00  | 文员   | 产品部 | 深圳     |     1 |
| 卢俊义 | 16000.00 | 销售   | 销售部 | 广州     |     3 |
| 林冲   | 12500.00 | 销售   | 销售部 | 广州     |     2 |
| 唐僧   | 29750.00 | 经理   | 产品部 | 深圳     |     4 |
| 李逵   | 12500.00 | 文员   | 销售部 | 广州     |     2 |
+--------+----------+--------+--------+----------+-------+

case5: 查询部门编号, 名称, 位置, 人数, join 再 group by, 聚合函数等

分析: 先连接, 然后再按部门分组+聚合即可

dept表: id, d_name, locationemp表: id (用来count的)连接条件: 做连接 dept.id = emp.dept_id

select 
  d.id,
  d.d_name,
  d.location,
  -- 不要count(*) null 不加入计算哦
  count(e.id) as "人数"
from dept d
  left join emp e
  on d.id = e.dept_id
-- 按部门分组
group by d.d_name;

+----+--------+----------+------+
| id | d_name | location | 人数 |
+----+--------+----------+------+
| 20 | 产品部 | 深圳     |    5 |
| 10 | 研发部 | 深圳     |    3 |
| 40 | 财务部 | 上海     |    0 |
| 30 | 销售部 | 广州     |    6 |
+----+--------+----------+------+

case6: (自连接) 查询员工的姓名, 及其领导

分析: 通过as取别名进行自连接(id字段和leader 字段是自相关的哦)

emp表 e1: e_nameemp表 e2: e.leader连接条件: 左连接, e1.leader = e2.id

select 
  e1.e_name as "员工姓名",
  e1.e_name as "直属领导"
from emp as e1
  left join emp as e2
  on e1.leader = e2.id;
  
limit 5;
  
+----------+----------+
| 员工姓名 | 直属领导 |
+----------+----------+
| 孙悟空   | 孙悟空   |
| 卢俊义   | 卢俊义   |
| 林冲     | 林冲     |
| 唐僧     | 唐僧     |
| 李逵     | 李逵     |
+----------+----------+
14 rows in set (0.11 sec)

总结表连接方式我用频率left join > inner join连接字段on等值或判断条件均可多表连接的关键在于分析需要哪些表, 及其字段, 确定连接方式, 是否需要嵌套或聚合...技巧上, 尽量sql语句写标准化方便阅读,from > where > group by 及聚合函数 > having > order > select下篇再加强一波自连接(省市区联动或粉丝互动) 和结合union, group by + 聚合这些吧...

耐心和恒心, 总会获得回报的.

本文地址：https://www.henghost.com/jishu/11916/