SQL概述

corresponding slide-ch11

SQL(Structured Query Language)

  • SQL(Structured Query Language)结构化查询语言,是关系数据库的标准语言
  • SQL是一个通用的、功能极强的关系数据库语言
    • 综合统一
    • 高度非过程化
      • 只关心结果,不关心语句如何实现
    • 面向集合的操作方式
    • 以同一种语法结构提供两种使用方法
    • 语言简洁,易学易用

SQL的特点

综合统一

  • 集数据定义语言(DDL),数据操纵语言(DML),数据控制语言(DCL)功能于一体
  • 可以独立完成数据库生命周期中的全部活动:
    • 定义和修改、删除关系模式,定义和删除视图,插入数据,建立数据库
    • 对数据库中的数据进行查询和更新
    • 数据库重构和维护
    • 数据库安全性、完整性控制,以及事务控制
    • 嵌入式SQL和动态SQL定义
  • 用户数据库投入运行后,可根据需要随时逐步修改模式,不影响数据库的运行
  • 数据操作符统一

高度非过程化

  • 非关系数据模型的数据操纵语言“面向过程”,必须指定存取路径
  • SQL只要提出“做什么”,无须了解存取路径
  • 存取路径的选择以及SQL的操作过程由系统自动完成

面向集合的操作方式

  • 非关系数据模型采用面向记录的操作方式,操作对象是一条记录
  • SQL采用集合操作方式
    • 操作对象、查找结果可以是元组的集合
    • 一次插入、删除、更新操作的对象可以是元组的集合

以同一种语法结构提供多种使用方式

  • SQL是独立的语言,能够独立地用于联机交互的使用方式
  • SQL又是嵌入式语言,能够嵌入到高级语言(例如C,C++,Java)程序中,供程序员设计程序时使用

语言简洁,易学易用

  • SQL功能极强,完成核心功能只用了9个动词:
    • 数据定义:CREATE,DROP,ALTER
    • 数据查询:SELECT
    • 数据操作:INSERT,UPDATE,DELETE
    • 数据控制:GRANT,REVOKE

SQL与关系数据库三级模式

基本表

  • 本身独立存在的表
  • 一个关系对应一个基本表
  • 一个(或多个)基本表对应一个存储文件
  • 一个表可以带若干索引

存储文件

  • 逻辑结构组成了关系数据库的内模式
  • 物理结构对用户是隐蔽的

视图

  • 从一个或几个基本表导出的表
  • 数据库中只存放视图的定义而不存放视图对应的数据
  • 视图是一个虚表
  • 用户可以在视图上再定义视图

SQL数据定义

corresponding slide-ch12

层次化的数据库对象命名机制

  • 一个关系数据库管理系统的实例(Instance)中可以建立多个数据库
  • 一个数据库中可以建立多个模式
    • 各个模式代表各自的应用域
  • 一个模式下通常包括多个表、视图和索引等数据库对象

数据定义

  • SQL的数据定义功能:
    • 模式定义
    • 表定义
    • 视图和索引的定义

模式(SCHEMA)

定义模式

  • 定义模式实际上定义了一个命名空间
    • 在这个空间中可以定义该模式包含的数据库对象,例如基本表、视图、索引等
  • CREATE SCHEMA中可以接受CREATE TABLECREATE VIEW和GRANT子句
1
CREATE SCHEMA <模式名> AUTHORIZATION <用户名> [<表定义子句>| <视图定义子句>|<授权定义子句>]

删除模式

  • DROP SCHEMA <模式名> <CASCADE|RESTRICT>
  • CASCADE(级联)
    • 删除模式的同时把该模式中所有的数据库对象全部删除
  • RESTRICT(限制)
    • 如果该模式中定义了下属的数据库对象(如表、视图等),则拒绝该删除语句的执行
    • 仅当该模式中没有任何下属的对象时才能执行

表(TABLE)

定义基本表

1
2
3
4
5
CREATE TABLE <表名>
(<列名> <数据类型>[ <列级完整性约束条件> ]
[,<列名> <数据类型>[ <列级完整性约束条件>] ]

[,<表级完整性约束条件> ] );
  • <表名>:所要定义的基本表的名字
  • <列名>:组成该表的各个属性(列)
  • <列级完整性约束条件>:涉及相应属性列的完整性约束条件
  • <表级完整性约束条件>:涉及一个或多个属性列的完整性约束条件
  • 如果完整性约束条件涉及到该表的多个属性列,则必须定义在表级上,否则既可以定义在列级也可以定义在表级

数据类型

  • SQL中域的概念用数据类型来实现
  • 定义表的属性时需要指明其数据类型及长度
  • 选用哪种数据类型
    • 取值范围
    • 要做哪些运算

修改基本表

1
2
3
4
5
6
ALTER TABLE <表名>
[ ADD[COLUMN] <新列名> <数据类型> [ 完整性约束 ] ]
[ ADD <表级完整性约束>]
[ DROP [ COLUMN ] <列名> [CASCADE| RESTRICT] ]
[ DROP CONSTRAINT<完整性约束名>[ RESTRICT | CASCADE ] ]
[ ALTER COLUMN <列名><数据类型> ] ;
  • <表名>是要修改的基本表
  • ADD子句用于增加新列、新的列级完整性约束条件和新的表级完整性约束条件
  • DROP COLUMN子句用于删除表中的列
    • 如果指定了CASCADE短语,则自动删除引用了该列的其他对象
    • 如果指定了RESTRICT短语,则如果该列被其他对象引用,关系数据库管理系统将拒绝删除该列
  • DROP CONSTRAINT子句用于删除指定的完整性约束条件
  • ALTER COLUMN子句用于修改原有的列定义,包括修改列名和数据类型

删除基本表

1
DROP TABLE <表名>[RESTRICT| CASCADE];
  • RESTRICT:删除表是有限制的。
    • 欲删除的基本表不能被其他表的约束所引用
    • 如果存在依赖该表的对象,则此表不能被删除
  • CASCADE:删除该表没有限制。
    • 在删除基本表的同时,相关的依赖对象一起删除

索引

  • 建立索引的目的:加快查询速度
    • 由数据库管理员或表的拥有者建立
    • 由关系数据库管理系统自动完成维护
    • 关系数据库管理系统自动使用合适的索引作为存取路径,用户不必也不能显式地选择索引
  • 关系数据库管理系统中常见索引:
    • 顺序文件上的索引
    • B+树索引
    • 散列(hash)索引
    • 位图索引

建立索引

语句格式

1
2
CREATE [UNIQUE] [CLUSTER] INDEX <索引名>
ON <表名>(<列名>[<次序>][,<列名>[<次序>] ]…);
  • <表名>:要建索引的基本表的名字
  • 索引:可以建立在该表的一列或多列上,各列名之间用逗号分隔
  • <次序>:指定索引值的排列次序,升序:ASC,降序:DESC。缺省值:ASC
  • UNIQUE:此索引的每一个索引值只对应唯一的数据记录
  • CLUSTER:表示要建立的索引是聚簇索引

SQL数据查询(单表)

corresponding slide-ch13

数据查询

语句格式

1
2
3
4
5
6
SELECT [ALL|DISTINCT] <目标列表达式>[,<目标列表达式>] …
FROM <表名或视图名>[,<表名或视图名> ]…|(SELECT 语句)     
[AS]<别名>
[ WHERE <条件表达式> ]
[GROUP BY <列名1> [ HAVING <条件表达式> ] ]
[ORDER BY <列名2> [ ASC|DESC ] ];
  • SELECT子句:指定要显示的属性列
  • FROM子句:指定查询对象(基本表或视图)
  • WHERE子句:指定查询条件
  • GROUP BY子句:对查询结果按指定列的值分组,该属性列值相等的元组为一个组。通常会在每组中作用聚集函数。
  • HAVING短语:只有满足指定条件的组才予以输出
  • ORDER BY子句:对查询结果表按指定列值的升序或降序排序

选择表中的若干列

查询指定列

  • [例3.16] 查询全体学生的学号与姓名。
1
2
SELECT Sno,Sname
FROM Student; 
  • [例3.17] 查询全体学生的姓名、学号、所在系。
1
2
SELECT Sname,Sno,Sdept
FROM Student;

查询全部列

  • [例3.18] 查询全体学生的详细记录
1
2
SELECT  Sno,Sname,Ssex,Sage,Sdept
FROM Student;
1
2
SELECT *
FROM Student;

查询经过计算的值

  • SELECT子句的<目标列表达式>不仅可以为表中的属性列,也可以是表达式

选择表中的若干元组

消除取值重复的行

  • 指定DISTINCT关键词,去掉表中重复的行
    • 如果没有指定DISTINCT关键词,则缺省为ALL

查询满足条件的元组

比较大小

确定范围

谓词:IN <值表>, NOT IN <值表>

确定集合

  • 谓词: [NOT] LIKE ‘<匹配串>’ [ESCAPE ‘ <换码字符>’]
  • <匹配串>可以是一个完整的字符串,也可以含有通配符%(任意长度(长度可以为0)的字符串)和 _(任意单个字符)
    • 例如:a%b表示以a开头,以b结尾的任意长度的字符串
    • 例如:a_b表示以a开头,以b结尾的长度为3的任意字符串
  • 匹配串为固定字符串

字符匹配

  • 匹配串为含通配符的字符串
  • 使用换码字符将通配符转义为普通字符
    • ESCAPE ‘\’ 表示“ \” 为换码字符

涉及空值的查询

  • 谓词: IS NULL 或 IS NOT NULL
    • “IS” 不能用 “=” 代替

多重条件查询

  • 逻辑运算符:AND和 OR来连接多个查询条件
    • AND的优先级高于OR
    • 可以用括号改变优先级

对查询结果排序

  • ORDER BY子句
    • 可以按一个或多个属性列排序
    • 升序:ASC;降序:DESC;缺省值为升序
    • 对于空值,排序时显示的次序由具体系统实现来决定

聚集函数

  • 聚集函数:
    • 统计元组个数COUNT(*)
    • 统计一列中值的个数COUNT([DISTINCT|ALL] <列名>)
    • 计算一列值的总和(此列必须为数值型)SUM([DISTINCT|ALL] <列名>)
    • 计算一列值的平均值(此列必须为数值型)AVG([DISTINCT|ALL] <列名>)
    • 求一列中的最大值和最小值
      • MAX([DISTINCT|ALL] <列名>)
      • MIN([DISTINCT|ALL] <列名>)

对查询结果分组

  • GROUP BY子句分组:
    • 细化聚集函数的作用对象
      • 如果未对查询结果分组,聚集函数将作用于整个查询结果
      • 对查询结果分组后,聚集函数将分别作用于每个组
      • 按指定的一列或多列值分组,值相等的为一组

SQL数据查询(连接)

corresponding slide-ch14

连接查询

  • 连接查询:同时涉及两个以上的表的查询
  • 连接条件或连接谓词:用来连接两个表的条件
  • 一般格式:
    • [<表名1>.]<列名1> <比较运算符> [<表名2>.]<列名2>
    • [<表名1>.]<列名1> BETWEEN [<表名2>.]<列名2> AND [<表名2>.]<列名3>
  • 连接字段:连接谓词中的列名称
    • 连接条件中的各连接字段类型必须是可比的,但名字不必相同

等值连接/自然连接查询

  • 等值连接:连接运算符为=

连接操作的执行过程

  • 嵌套循环法(NESTED-LOOP)
    • 首先在表1中找到第一个元组,然后从头开始扫描表2,逐一查找满足连接件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。
    • 表2全部查找完后,再找表1中第二个元组,然后再从头开始扫描表2,逐一查找满足连接条件的元组,找到后就将表1中的第二个元组与该元组拼接起来,形成结果表中一个元组。
    • 重复上述操作,直到表1中的全部元组都处理完毕
  • 排序合并法(SORT-MERGE)
    • 常用于=连接
    • 首先按连接属性对表1和表2排序
    • 对表1的第一个元组,从头开始扫描表2,顺序查找满足连接条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。当遇到表2中第一条大于表1连接字段值的元组时,对表2的查询不再继续
  • 索引连接(INDEX-JOIN)
    • 对表2按连接字段建立索引
    • 对表1中的每个元组,依次根据其连接字段值查询表2的索引,从中找到满足条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组

同时进行选择和连接

  • 一条SQL语句可以同时完成选择和连接查询,这时WHERE子句是由连接谓词和选择谓词组成的复合条件。
  • [例 3.51]查询选修2号课程且成绩在90分以上的所有学生的学号和姓名。
    *SELECT Student.Sno, Sname
    FROM     Student, SC
    WHERE  Student.Sno=SC.Sno  AND                     
    
    SC.Cno=’ 2 ‘ AND SC.Grade>90;*
  • 执行过程:
    • 先从SC中挑选出Cno=’2’并且Grade>90的元组形成一个中间关系
    • 再和Student中满足连接条件的元组进行连接得到最终的结果关系

自身连接

  • 自身连接:一个表与其自己进行连接
  • 需要给表起别名以示区别
  • 由于所有属性名都是同名属性,因此必须使用别名前缀
  • [例 3.52]查询每一门课的间接先修课(即先修课的先修课)
    SELECT FIRST.Cno, SECOND.Cpno
    FROM Course FIRST, Course SECOND
    WHERE FIRST.Cpno = SECOND.Cno;

外连接

  • 外连接与普通连接的区别
    • 普通连接操作只输出满足连接条件的元组
    • 外连接操作以指定表为连接主体,将主体表中不满足连接条件的元组一并输出
      • 左外连接
        • 列出左边关系中所有的元组
      • 右外连接
        • 列出右边关系中所有的元组

多表连接

  • 多表连接:两个以上的表进行连接
  • [例3.54]查询每个学生的学号、姓名、选修的课程名及成绩
    SELECT Student.Sno, Sname, Cname, Grade
    FROM Student, SC, Course /\
    多表连接*/
    WHERE Student.Sno = SC.Sno
    AND SC.Cno = Course.Cno;*
    

SQL数据查询(嵌套)

corresponding slide-ch15

嵌套查询概述

  • 一个SELECT-FROM-WHERE语句称为一个查询块
  • 将一个查询块嵌套在另一个查询块的WHERE子句或HAVING短语的条件中的查询称为嵌套查询
    • 上层的查询块称为外层查询或父查询
    • 下层查询块称为内层查询或子查询
    • SQL语言允许多层嵌套查询
      • 即一个子查询中还可以嵌套其他子查询
    • 子查询的限制
      • 不能使用ORDER BY子句
    • 有些嵌套查询可以用连接运算替代
      • 谨慎使用嵌套查询

嵌套查询求解方法

  • 不相关子查询:子查询的查询条件不依赖于父查询
    • 由里向外 逐层处理。即每个子查询在上一级查询处理之前求解,子查询的结果用于建立其父查询的查找条件
  • 相关子查询:子查询的查询条件依赖于父查询
    • 首先取外层查询中表的第一个元组,根据它与内层查询相关的属性值处理内层查询,若WHERE子句返回值为真,则取此元组放入结果表
    • 然后再取外层表的下一个元组
    • 重复这一过程,直至外层表全部检查完为止

带有IN谓词的子查询

  • [例 3.55] 查询与“刘晨”在同一个系学习的学生。

    • 此查询要求可以分步来完成
    1. 确定“刘晨”所在系名
      SELECT Sdept
      FROM Student
      WHERE Sname= ‘ 刘晨 ‘;

      结果为: CS
    2. 查找所有在CS系学习的学生
      SELECT Sno, Sname, Sdept
      FROM Student
      WHERE Sdept= ‘ CS ‘;

      结果为
    • 将第一步查询嵌入到第二步查询的条件中
      SELECT Sno, Sname, Sdept
      FROM Student
      WHERE Sdept IN
      (SELECT Sdept
      FROM Student
      WHERE Sname= ‘ 刘晨 ‘);
    • 此查询为不相关子查询
    • 用自身连接完成[例 3.55]查询要求
      SELECT S1.Sno, S1.Sname,S1.Sdept
      FROM Student S1,Student S2
      WHERE S1.Sdept = S2.Sdept AND
      S2.Sname = ‘刘晨’;

带有比较运算符的子查询

  • 当能确切知道内层查询返回单值时,可用比较运算符(>,<,=,>=,<=,!=或< >)。
  • 在[例 3.55]中,由于一个学生只可能在一个系学习,则可以用 = 代替IN :
    SELECT Sno,Sname,Sdept
    FROM Student
    WHERE Sdept =
    (SELECT Sdept
    FROM Student
    WHERE Sname= ‘刘晨’);

带有ANY(SOME)或ALL谓词的子查询

  • 使用ANY或ALL谓词时必须同时使用比较运算

  • 语义为:

    • ANY 大于子查询结果中的某个值

    • ALL 大于子查询结果中的所有值

    • < ANY 小于子查询结果中的某个值

    • < ALL 小于子查询结果中的所有值

    • = ANY 大于等于子查询结果中的某个值

    • = ALL 大于等于子查询结果中的所有值

    • <= ANY 小于等于子查询结果中的某个值

    • <= ALL 小于等于子查询结果中的所有值

    • = ANY 等于子查询结果中的某个值

    • = ALL 等于子查询结果中的所有值(通常没有实际意义)

    • !=(或<>)ANY 不等于子查询结果中的某个值

    • !=(或<>)ALL 不等于子查询结果中的任何一个值

  • [例 3.58] 查询非计算机科学系中比计算机科学系任意一个学生年龄小的学生姓名和年龄
    *SELECT Sname,Sage
    FROM Student
    WHERE Sage < ANY (SELECT Sage

                    FROM    Student
                WHERE Sdept= ' CS ')
    

    AND Sdept <> ‘CS ‘ ;
    /*父查询块中的条件 */*

    • 执行过程:
      • 首先处理子查询,找出CS系中所有学生的年龄,构成一个集合(20,19)
      • 处理父查询,找所有不是CS系且年龄小于 20 或19的学生
      • 也可用聚集函数实现

带有EXISTS谓词的子查询

  • EXISTS谓词
    • 存在量词$\exists$
    • 带有EXISTS谓词的子查询不返回任何数据,只产生逻辑真值“true”或逻辑假值“false”。
      • 若内层查询结果非空,则外层的WHERE子句返回真值
      • 若内层查询结果为空,则外层的WHERE子句返回假值
    • 由EXISTS引出的子查询,其目标列表达式通常都用 * ,因为带EXISTS的子查询只返回真值或假值,给出列名无实际意义。
  • NOT EXISTS谓词
    • 若内层查询结果非空,则外层的WHERE子句返回假值
    • 若内层查询结果为空,则外层的WHERE子句返回真值
  • 不同形式的查询间的替换
    • 一些带EXISTS或NOT EXISTS谓词的子查询不能被其他形式的子查询等价替换
    • 所有带IN谓词、比较运算符、ANY和ALL谓词的子查询都能用带EXISTS谓词的子查询等价替换
  • 用EXISTS/NOT EXISTS实现全称量词
    • SQL语言中没有全称量词$\forall$(For all)
    • 可以把带有全称量词的谓词转换为等价的带有存在量词的谓词:
  • 用EXISTS/NOT EXISTS实现逻辑蕴涵
    • SQL语言中没有蕴涵(Implication)逻辑运算
    • 可以利用谓词演算将逻辑蕴涵谓词等价转换为:

SQL数据查询(集合)

corresponding slide-ch16

集合查询

  • 集合操作的种类
    • 并操作UNION
    • 交操作INTERSECT
    • 差操作EXCEPT
  • 参加集合操作的各查询结果的列数必须相同;对应项的数据类型也必须相同

并操作

  • UNION:将多个查询结果合并起来时,系统自动去掉重复元组
  • UNION ALL:将多个查询结果合并起来时,保留重复元组
  • [例 3.64] 查询计算机科学系的学生及年龄不大于19岁的学生。
1
2
3
4
5
6
7
SELECT *
FROM Student
WHERE Sdept= 'CS'
UNION
SELECT *
FROM Student
WHERE Sage<=19;

交操作

  • [例3.66] 查询计算机科学系的学生与年龄不大于19岁的学生的交集
1
2
3
4
5
6
7
SELECT *
FROM Student
WHERE Sdept='CS'
INTERSECT
SELECT *
FROM Student
WHERE Sage<=19
  • [例 3.66] 实际上就是查询计算机科学系中年龄不大于19岁的学生
1
2
3
SELECT *
FROM Student
WHERE Sdept= 'CS' AND  Sage<=19;

差操作

  • [例 3.68] 查询计算机科学系的学生与年龄不大于19岁的学生的差集
1
2
3
4
5
6
7
SELECT *
FROM Student
WHERE Sdept='CS'
EXCEPT
SELECT  *
FROM Student
WHERE Sage <=19;
  • [例3.68]实际上是查询计算机科学系中年龄大于19岁的学生
1
2
3
SELECT *
FROM Student
WHERE Sdept= 'CS' AND  Sage>19;

SQL数据查询(基于派生表)

corresponding slide-ch16

基于派生表的查询

  • 子查询不仅可以出现在WHERE子句中,还可以出现在FROM子句中,这时子查询生成的临时派生表(Derived Table)成为主查询的查询对象
  • [例3.57]找出每个学生超过他自己选修课程平均成绩的课程号
1
2
3
4
5
6
7
SELECT Sno, Cno
FROM SC, (SELECT Sno, Avg(Grade)
FROM SC
GROUP BY Sno)
AS   Avg_sc(avg_sno,avg_grade)
WHERE SC.Sno = Avg_sc.avg_sno
and SC.Grade >=Avg_sc.avg_grade
  • 如果子查询中没有聚集函数,派生表可以不指定属性列,子查询SELECT子句后面的列名为其缺省属性。
  • [例3.60]查询所有选修了1号课程的学生姓名,可以用如下查询完成:
1
2
3
4
SELECT Sname
FROM   Student, 
(SELECT Sno FROM SC WHERE Cno=' 1 ') AS SC1
WHERE  Student.Sno=SC1.Sno;

SQL数据更新-插入

corresponding slides-ch18

插入元组

  • 将新元组插入指定表中,语句格式
1
2
3
INSERT
INTO <表名> [(<属性列1>[,<属性列2 >…)]
VALUES (<常量1> [,<常量2>]… );
  • INTO子句
    • 指定要插入数据的表名及属性列
    • 属性列的顺序可与表定义中的顺序不一致
    • 没有指定属性列:表示要插入的是一条完整的元组,且属性列属性与表定义中的顺序一致
    • 指定部分属性列:插入的元组在其余属性列上取空值
  • VALUES子句
    • 提供的值必须与INTO子句匹配
      • 值的个数
      • 值的类型

插入子查询结果

  • 语句格式
1
2
INSERT
INTO <表名>  [(<属性列1> [,<属性列2>…  )]

子查询;

  • INTO子句
  • 子查询
    • SELECT子句目标列必须与INTO子句匹配
      • 值的个数
      • 值的类型

SQL数据更新-修改

corresponding slides-ch19

修改数据

  • 语句格式
1
2
3
UPDATE  <表名>
SET  <列名>=<表达式>[,<列名>=<表达式>]…
[WHERE <条件>];
  • 功能
    • 修改指定表中满足WHERE子句条件的元组
    • SET子句给出<表达式>的值用于取代相应的属性列
    • 如果省略WHERE子句,表示要修改表中的所有元组

修改某一个元组的值

  • [例3.73] 将学生201215121的年龄改为22岁
1
2
3
UPDATE  Student
SET Sage=22
WHERE  Sno=' 201215121 ';

修改多个元组的值

  • [例3.74] 将所有学生的年龄增加1岁。
1
2
UPDATE Student
SET Sage= Sage+1;

带子查询的修改病句

  • [例3.75] 将计算机科学系全体学生的成绩置零。
1
2
3
4
5
6
UPDATE SC
SET     Grade=0
WHERE Sno  IN
(SELETE Sno
FROM     Student
WHERE  Sdept= 'CS' );

修改数据与完整性

  • 关系数据库管理系统在执行修改语句时会检查修改操作是否破坏表上已定义的完整性规则
    • 实体完整性
    • 参照完整性
    • 用户定义的完整性
      • NOT NULL约束
      • UNIQUE约束
      • 值域约束

SQL数据更新-删除

corresponding slides-ch20

删除数据

  • 数据格式
1
2
3
DELETE
FROM     <表名>
[WHERE <条件>];
  • 功能
    • 删除指定表中满足WHERE子句条件的元组
  • WHERE子句
    • 指定要删除的元组
    • 缺省表示要删除表中的全部元组,表的定义仍在字典中

删除某一个元组的值

  • [例3.76] 删除学号为201215128的学生记录。
1
2
3
DELETE
FROM Student
WHERE Sno= 201215128 ';

删除多个元组的值

  • [例3.77] 删除所有的学生选课记录。
1
2
DELETE
FROM SC;

带子查询的删除病句

  • [例3.78] 删除计算机科学系所有学生的选课记录。
1
2
3
4
5
6
  DELETE
  FROM  SC
  WHERE  Sno  IN
  (SELECT  Sno
    FROM   Student
    WHERE  Sdept= 'CS') ;

SQL中的空值

corresponding slides-ch21

空值的处理

  • 空值就是“不知道”或“不存在”或“无意义”的值。
  • 一般有以下几种情况:
    • 该属性应该有一个值,但目前不知道它的具体值
    • 该属性不应该有值
    • 由于某种原因不便于填写

空值的产生

  • 空值是一个很特殊的值,含有不确定性。对关系运算带来特殊的问题,需要做特殊的处理。
  • 空值的产生
    -[例 3.79]向SC表中插入一个元组,学生号是”201215126”,课程号是”1”,成绩为空。
1
2
INSERT INTO SC(Sno,Cno,Grade)
VALUES('201215126 ','1',NULL);   /*该学生还没有考试成绩,取空值*/
1
2
INSERT INTO SC(Sno,Cno)
VALUES(' 201215126 ','1');      /*没有赋值的属性,其值为空值*/

空值的判断

  • 判断一个属性的值是否为空值,用IS NULL或IS NOT NULL来表示。
  • [例 3.81] 从Student表中找出漏填了数据的学生信息
1
2
3
SELECT  *
FROM Student
WHERE Sname IS NULL OR Ssex IS NULL OR Sage IS NULL OR Sdept IS NULL;

空值的约束条件

  • 属性定义(或者域定义)中
    • 有NOT NULL约束条件的不能取空值
    • 加了UNIQUE限制的属性不能取空值
    • 码属性不能取空值

空值的算术运算、比较运算和逻辑运算

  • 空值与另一个值(包括另一个空值)的算术运算的结果为空值
  • 空值与另一个值(包括另一个空值)的比较运算的结果为UNKNOWN。
  • 有UNKNOWN后,传统二值(TRUE,FALSE)逻辑就扩展成了三值逻辑

视图

corresponding slides-ch22

视图

  • 视图的特点
    • 虚表,是从一个或几个基本表(或视图)导出的表
    • 只存放视图的定义,不存放视图对应的数据
    • 基表中的数据发生变化,从视图中查询出的数据也随之改变

定义视图-建立视图

  • 语句格式
1
2
3
4
CREATE  VIEW
<视图名>  [(<列名>  [,<列名>]…)]
AS  <子查询>
[WITH  CHECK  OPTION];
  • WITH CHECK OPTION
    • 对视图进行UPDATE,INSERT和DELETE操作时要保证更新、插入或删除的行满足视图定义中的谓词条件(即子查询中的条件表达式)
  • 子查询可以是任意的SELECT语句,是否可以含有ORDER BY子句和DISTINCT短语,则决定具体系统的实现
  • 组成视图的属性列名:全部省略或全部指定
    • 全部省略:
      • 由子查询中SELECT目标列中的诸字段组成
    • 明确指定视图的所有列名:
      • 某个目标列是聚集函数或列表达式
      • 多表连接时选出了几个同名列作为视图的字段
      • 需要在视图中为某个列启用新的更合适的名字
  • 关系数据库管理系统执行CREATE VIEW语句时只是把视图定义存入数据字典,并不执行其中的SELECT语句。
  • 在对视图查询时,按视图的定义从基本表中将数据查出。
  • [例3.84] 建立信息系学生的视图。
1
2
3
4
5
CREATE VIEW IS_Student
AS
SELECT Sno,Sname,Sage
FROM     Student
WHERE  Sdept= 'IS';
  • [例3.85]建立信息系学生的视图,并要求进行修改和插入操作时仍需保证该视图只有信息系的学生
1
2
3
4
5
6
CREATE VIEW IS_Student
AS
SELECT Sno,Sname,Sage
FROM  Student
WHERE  Sdept= 'IS'
WITH CHECK OPTION;
  • tips

    • 定义IS_Student视图时加上了WITH CHECK OPTION子句,对该视图进行插入、修改和删除操作时,RDBMS会自动加上Sdept=’IS’的条件。
    • 若一个视图是从单个基本表导出的,并且只是去掉了基本表的某些行和某些列,但保留了主码,我们称这类视图为行列子集视图。
    • IS_Student视图就是一个行列子集视图
  • 基于多个基表的视图

  • [例3.86] 建立信息系选修了1号课程的学生的视图(包括学号、姓名、成绩)
1
2
3
4
5
6
7
CREATE VIEW IS_S1(Sno,Sname,Grade)
AS
SELECT Student.Sno,Sname,Grade
FROM  Student,SC
WHERE  Sdept= 'IS' AND
Student.Sno=SC.Sno AND
SC.Cno= '1';
  • 基于视图的视图
  • [例3.87] 建立信息系选修了1号课程且成绩在90分以上的学生的视图
1
2
3
4
5
CREATE VIEW IS_S2
AS
SELECT Sno,Sname,Grade
FROM  IS_S1
WHERE  Grade>=90;
  • 带表达式的视图
  • [例3.88] 定义一个反映学生出生年份的视图。
1
2
3
4
CREATE  VIEW BT_S(Sno,Sname,Sbirth)
AS
SELECT Sno,Sname,2014-Sage
FROM  Student;
  • 分组视图
  • [例3.89] 将学生的学号及平均成绩定义为一个视图
1
2
3
4
5
CREATE  VIEW     S_G(Sno,Gavg)
AS 
SELECT Sno,AVG(Grade)
FROM  SC
GROUP BY Sno;
  • 缺点:
    • 修改基表Student的结构后,Student表与F_Student视图 的映象关系被破坏,导致该视图不能正确工作

定义视图-删除视图

  • 语句的格式:
1
DROP  VIEW  <视图名>[CASCADE];
  • tips
    • 该语句从数据字典中删除指定的视图定义
    • 如果该视图上还导出了其他视图,使用CASCADE级联删除语句,把该视图和由它导出的所有视图一起删除
    • 删除基表时,由该基表导出的所有视图定义都必须显式地使用DROP VIEW语句删除

查询视图

  • 用户角度:查询视图与查询基本表相同
  • 关系数据库管理系统实现视图查询的方法
    • 视图消解法(View Resolution)
      • 进行有效性检查
      • 转换成等价的对基本表的查询
      • 执行修正后的查询
  • 视图消解法的局限
    • 有些情况下,视图消解法不能生成正确的查询

更新视图

  • 允许对行列子集视图进行更新
  • 对其他类型视图的更新不同系统有不同限制
    • 更新视图的限制:一些视图是不可更新的,因为对这些视图的更新不能唯一地有意义地转换成对相应基本表的更新
  • 一个不允许更新的视图上定义的视图也不允许更新

视图的作用

视图能够简化用户的操作

  • 当视图中数据不是直接来自基本表时,定义视图能够简化用户的操作
    • 基于多张表连接形成的视图
    • 基于复杂嵌套查询的视图
    • 含导出属性的视图

视图使用户能以多种角度看待同一数据

  • 视图机制能使不同用户以不同方式看待同一数据,
  • 适应数据库共享的需要

视图对重构数据库提供了一定程序的逻辑独立性

  • 例:学生关系Student(Sno,Sname,Ssex,Sage,Sdept)
    • “垂直”地分成两个基本表:
1
2
SX(Sno,Sname,Sage)       
SY(Sno,Ssex,Sdept)
  • 通过建立一个视图Student:
1
2
3
4
5
CREATE VIEW  Student(Sno,Sname,Ssex,Sage,Sdept)
AS 
SELECT  SX.Sno,SX.Sname,SY.Ssex,SX.Sage,SY.Sdept
FROM  SX,SY
WHERE  SX.Sno=SY.Sno;
  • 使用户的外模式保持不变,用户的应用程序通过视图仍然能够查找数据
  • 由于对视图的更新是有条件的,因此应用程序中修改数据的语句可能仍会因基本表结构的改变而改变

视图能够对机密数据提供安全保护

  • 对不同用户定义不同视图,使每个用户只能看到他有权看到的数据

适当的利用视图可以更清晰的表达查询

  • 经常需要执行这样的查询“对每个同学找出他获得最高成绩的课程号”。
  • 可以先定义一个视图,求出每个同学获得的最高成绩
1
2
3
4
5
CREATE VIEW VMGRADE
AS
SELECT Sno, MAX(Grade)  Mgrade
FROM  SC
GROUP BY Sno;
  • 然后用如下的查询语句完成查询:
1
2
3
4
SELECT SC.Sno,Cno
FROM SC,VMGRADE
WHERE SC.Sno=VMGRADE.Sno AND      
SC.Grade=VMGRADE .Mgrade;