MosesDon

MosesDon 查看完整档案

填写现居城市  |  填写毕业院校  |  填写所在公司/组织填写个人主网站
编辑
_ | |__ _ _ __ _ | '_ \| | | |/ _` | | |_) | |_| | (_| | |_.__/ \__,_|\__, | |___/ 该用户太懒什么也没留下

个人动态

MosesDon 发布了文章 · 12月1日

hive-分区表

1 分区表

[PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)]

1.1 分区表

在建表时,指定了PARTITIONED BY ,这个表称为分区表
PARTITIONED BY 以什么分区

1.2 分区概念

MR: 在MapTask输出key-value时,为每个key-value计算一个区号,同一个分区的数据,会被同一个reduceTask处理
这个分区的数据,最终生成一个结果文件!
通过分区,将MapTask输出的key-value经过reduce后,分散到多个不同的结果文件中!
Hive: 将表中的数据,分散到表目录下的多个子目录(分区目录)中

1.3 分区意义

  • 分区的目的是为了就数据,分散到多个子目录中,在执行查询时,可以只选择查询某些子目录中的数据,加快查询效率!
  • 只有分区表才有子目录(分区目录)
  • 分区目录的名称由两部分确定: 分区列列名=分区列列值
  • 将输入导入到指定的分区之后,数据会附加上分区列的信息!
  • 分区的最终目的是在查询时,使用分区列进行过滤!

2 分区表操作

2.1 创建分区表

多级分区表,有多个分区字段
create external table if not exists learnwork.deptpart2(
deptno int,
dname string,
loc int
)
PARTITIONED BY(area string,province string)
row format delimited fields terminated by '\t';


create external table if not exists learnwork.deptpart3(
deptno int,
dname string,
loc int
)
PARTITIONED BY(area string)
row format delimited fields terminated by '\t'
location 'hdfs://hadoop101:9000/deptpart3';

2.2 分区的查询

show partitions 表名

2.3 创建分区

  1. alter table 表名 add partition(分区字段名=分区字段值) ;

    • 在hdfs上生成分区路径
    • 在mysql中metastore.partitions表中生成分区的元数据
  2. 直接使用load命令向分区加载数据,如果分区不存在,load时自动帮我们生成分区
  3. 如果数据已经按照规范的格式,上传到了HDFS,可以使用修复分区命令自动生成分区的元数据
    msck repair table 表名;

注意事项:

  1. 如果表是个分区表,在导入数据时,必须指定向哪个分区目录导入数据
  2. 如果表是多级分区表,在导入数据时,数据必须位于最后一级分区的目录
查看原文

赞 0 收藏 0 评论 0

MosesDon 发布了文章 · 11月19日

hadoop-API开发问题

报错信息

Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/tracing/SpanReceiverHos

参考链接

Hadoop Java API 简单使用

个人解决方式:

由于用的父子maven文件
2个都加了对应jar版本依赖

查看原文

赞 0 收藏 0 评论 0

MosesDon 发布了文章 · 10月19日

数据结构与算法-栈、队列

队列

题目1

数组实现队列
tips:使用环形数组

public class Code04_RingArray {
  public static class MyQueue {
    private int[] arr;
    private int pushi;
    private int polli;
    private int size;
    private final int limit;
    public MyQueue(int limit) {
      arr = new int[limit];
      pushi = 0;
      polli = 0;
      size = 0;
      this.limit = limit;
    }
    public void push(int value) {
      if (size == limit) {
        throw new RuntimeException("栈满了,不能再加了");
      }
      size++;
      arr[pushi] = value;
      pushi = nextIndex(pushi);
    }
    public int pop() {
      if (size == 0) {
        throw new RuntimeException("栈空了,不能再拿了");
    }
      size--;
      int ans = arr[polli];
      polli = nextIndex(polli);
      return ans;
    }
    public boolean isEmpty() {
      return size == 0;
    }
    // 如果现在的下标是i,返回下一个位置
    private int nextIndex(int i) {
      return i < limit - 1 ? i + 1 : 0;
    }
  }
}

题目2

栈怎么实现图?队列怎么实现图?

查看原文

赞 0 收藏 0 评论 0

MosesDon 发布了文章 · 10月19日

数据结构与算法4-异或深入理解

异或运算的性质

异或运算就记成无进位相加
0^N == N N^N == 0
异或运算满足交换律和结合率
上面的两个性质用无进位相加来理解就非常的容易

题目一

如何不用额外变量交换两个数

题目二

一个数组中有一种数出现了奇数次,其他数都出现了偶数次,怎么找到并打印这种数

题目三

怎么把一个int类型的数,提取出最右侧的1来

题目四

一个数组中有两种数出现了奇数次,其他数都出现了偶数次,怎么找到并打印这两种数

查看原文

赞 0 收藏 0 评论 0

MosesDon 发布了文章 · 10月19日

算法与数据结构2-排序算法

选择排序

过程:

arr[0~N-1]范围上,找到最小值所在的位置,然后把最小值交换到0位置。
arr[1~N-1]范围上,找到最小值所在的位置,然后把最小值交换到1位置。
arr[2~N-1]范围上,找到最小值所在的位置,然后把最小值交换到2位置。

arr[N-1~N-1]范围上,找到最小值位置,然后把最小值交换到N-1位置。

估算:

很明显,如果arr长度为N,每一步常数操作的数量,如等差数列一般
所以,总的常数操作数量 = a(N^2) + bN + c (a、b、c都是常数)

所以选择排序的时间复杂度为O(N^2)。

public static void selectionSort(int[] arr) {
 if (arr == null || arr.length < 2) {
 return;
 }
 // 0 ~ N-1
 // 1~n-1 // 2 for (int i = 0; i < arr.length - 1; i++) { // i ~ N-1
 // 最小值在哪个位置上 i~n-1
 int minIndex = i;
 for (int j = i + 1; j < arr.length; j++) { // i ~ N-1 上找最小值的下标 
minIndex = arr[j] < arr[minIndex] ? j : minIndex;
 }
 swap(arr, i, minIndex);
 }
}
public static void swap(int[] arr, int i, int j) {
 int tmp = arr[i];
 arr[i] = arr[j];
 arr[j] = tmp;
}

冒泡排序

过程:

在arr[0~N-1]范围上:
arr[0]和arr[1],谁大谁来到1位置;arr[1]和arr[2],谁大谁来到2位置…arr[N-2]和arr[N-1],谁大谁来到N-1位置

在arr[0~N-2]范围上,重复上面的过程,但最后一步是arr[N-3]和arr[N-2],谁大谁来到N-2位置
在arr[0~N-3]范围上,重复上面的过程,但最后一步是arr[N-4]和arr[N-3],谁大谁来到N-3位置

最后在arr[0~1]范围上,重复上面的过程,但最后一步是arr[0]和arr[1],谁大谁来到1位置

估算:

很明显,如果arr长度为N,每一步常数操作的数量,依然如等差数列一般
所以,总的常数操作数量 = a(N^2) + bN + c (a、b、c都是常数)

所以冒泡排序的时间复杂度为O(N^2)。

public static void bubbleSort(int[] arr) {
 if (arr == null || arr.length < 2) {
 return;
 }
 // 0 ~ N-1
 // 0 ~ N-2 // 0 ~ N-3 for (int e = arr.length - 1; e > 0; e--) { // 0 ~ e
 for (int i = 0; i < e; i++) {
 if (arr[i] > arr[i + 1]) {
 swap(arr, i, i + 1);
 }
 } }}
// 交换arr的i和j位置上的值
public static void swap(int[] arr, int i, int j) {
 arr[i] = arr[i] ^ arr[j];
 arr[j] = arr[i] ^ arr[j];
 arr[i] = arr[i] ^ arr[j];
}

插入排序

过程

很明显,在最差情况下,如果arr长度为N,插入排序的每一步常数操作的数量,还是如等差数列一般

估算

所以,总的常数操作数量 = a(N^2) + bN + c (a、b、c都是常数)
所以插入排序排序的时间复杂度为O(N^2)。

public static void insertionSort(int[] arr) {
 if (arr == null || arr.length < 2) {
 return;
 }
 // 0~0 有序的
 // 0~i 想有序
 for (int i = 1; i < arr.length; i++) { // 0 ~ i 做到有序
 for (int j = i - 1; j >= 0 && arr[j] > arr[j + 1]; j--) {
 swap(arr, j, j + 1);
 }
 }}
// i和j是一个位置的话,会出错
public static void swap(int[] arr, int i, int j) {
 arr[i] = arr[i] ^ arr[j];
 arr[j] = arr[i] ^ arr[j];
 arr[i] = arr[i] ^ arr[j];
}

二分法

  1. 在一个有序数组中,找某个数是否存在
  2. 在一个有序数组中,找>=某个数最左侧的位置
  3. 在一个有序数组中,找<=某个数最右侧的位置
  4. 局部最值问题 (不一定有序)
  5. 主要找到一个排他性的标准
public static boolean exist(int[] sortedArr, int num) {
 if (sortedArr == null || sortedArr.length == 0) {
 return false;
 }
 int L = 0;
 int R = sortedArr.length - 1;
 int mid = 0;
 // L..R
 while (L < R) {
 // mid = (L+R) / 2;
 // L 10亿 R 18亿
 // mid = L + (R - L) / 2
 // N / 2    N >> 1 mid = L + ((R - L) >> 1); // mid = (L + R) / 2
 if (sortedArr[mid] == num) {
 return true;
 } else if (sortedArr[mid] > num) {
 R = mid - 1;
 } else {
 L = mid + 1;
 }
 } return sortedArr[L] == num;
}
查看原文

赞 0 收藏 0 评论 0

MosesDon 发布了文章 · 10月19日

算法与数据结构1

评估算法优劣的核心指标是什么?

  • 时间复杂度(流程决定) 最重要
  • 额外空间复杂度(流程决定)
  • 常数项时间(实现细节决定) 最后考虑

常数时间时间操作

  • 常见算术运算
  • 位运算(>>,>>>,<<,<<<,|,&,^)
  • 赋值、比较、自增、自减
  • 数组寻址

时间复杂度

常数时间的操作
确定算法流程的总操作数量与样本数量之间的表达式关系
只看表达式最高阶项的部分

每次拆分必须拆到常数级别

额外空间复杂度

作为输入参数的空间,不算额外空间。
作为输出结果的空间,也不算额外空间。

算法流程的常数项

时间复杂度只是一个很重要的指标而已。如果两个时间复杂度一样的算法,你还要去在时间上拼优劣,就进入到拼常数时间的阶段,简称拼常数项。

常见的时间复杂度

排名从好到差:

O(1)
O(logN)
O(N)
O(N*logN)
O(N^2) O(N^3) … O(N^K)
O(2^N) O(3^N) … O(K^N)
O(N!)

算法和数据结构学习的大脉络

  1. 知道怎么算的算法
  2. 知道怎么试的算法

异或

  1. 0^N == N N^N == 0
  2. 异或运算满足交换律和结合率

用无进位相加来理解

查看原文

赞 0 收藏 0 评论 0

MosesDon 发布了文章 · 10月14日

数据结构与算法3-对数器

对数器作用

  1. 你想要测的方法a
  2. 实现复杂度不好但是容易实现的方法b
  3. 实现一个随机样本产生器
  4. 把方法a和方法b跑相同的随机样本,看看得到的结果是否一样
  5. 如果有一个随机样本使得比对结果不一致,打印样本进行人工干预,改对方法a和方法b
  6. 当样本数量很多时比对测试依然正确,可以确定方法a已经正确。

对数器的实现

// for test
public static void comparator(int[] arr) {
 Arrays.sort(arr);
}
// for test
public static int[] generateRandomArray(int maxSize, int maxValue) {
 // Math.random() ->  [0,1) 所有的小数,等概率返回一个
 // Math.random() * N -> [0,N) 所有小数,等概率返回一个
 // (int)(Math.random() * N) -> [0,N-1] 所有的整数,等概率返回一个
 int[] arr = new int[(int) ((maxSize + 1) * Math.random())]; // 长度随机 
for (int i = 0; i < arr.length; i++) {
 arr[i] = (int) ((maxValue + 1) * Math.random()) 
- (int) (maxValue * Math.random());
 }
 return arr;
}
// for test
public static int[] copyArray(int[] arr) {
 if (arr == null) {
 return null;
 }
 int[] res = new int[arr.length];
 for (int i = 0; i < arr.length; i++) {
 res[i] = arr[i];
 }
 return res;
}
// for test
public static boolean isEqual(int[] arr1, int[] arr2) {
 if ((arr1 == null && arr2 != null) || (arr1 != null && arr2 == null)) {
 return false;
 }
 if (arr1 == null && arr2 == null) {
 return true;
 }
 if (arr1.length != arr2.length) {
 return false;
 }
 for (int i = 0; i < arr1.length; i++) {
 if (arr1[i] != arr2[i]) {
 return false;
 }
 } return true;
}
// for test
public static void printArray(int[] arr) {
 if (arr == null) {
 return;
 }
 for (int i = 0; i < arr.length; i++) {
 System.out.print(arr[i] + " ");
 }
 System.out.println();
}
// for test
public static void main(String[] args) {
 int testTime = 500000;
 int maxSize = 100; // 随机数组的长度0~100
 int maxValue = 100;// 值:-100~100
 boolean succeed = true;
 for (int i = 0; i < testTime; i++) {
 int[] arr1 = generateRandomArray(maxSize, maxValue);
 int[] arr2 = copyArray(arr1);
 insertionSort(arr1);
 comparator(arr2);
 if (!isEqual(arr1, arr2)) {
 // 打印arr1
 // 打印arr2
 succeed = false;
 break; }
 } System.out.println(succeed ? "Nice!" : "Fucking fucked!");
 int[] arr = generateRandomArray(maxSize, maxValue);
 printArray(arr);
 insertionSort(arr);
 printArray(arr);
}
查看原文

赞 0 收藏 0 评论 0

MosesDon 发布了文章 · 9月30日

算法与数据结构2-排序算法

选择排序

public static void selectionSort(int[] arr) {
 if (arr == null || arr.length < 2) {
 return;
 }
 // 0 ~ N-1
 // 1~n-1 // 2 for (int i = 0; i < arr.length - 1; i++) { // i ~ N-1
 // 最小值在哪个位置上 i~n-1
 int minIndex = i;
 for (int j = i + 1; j < arr.length; j++) { // i ~ N-1 上找最小值的下标 
minIndex = arr[j] < arr[minIndex] ? j : minIndex;
 }
 swap(arr, i, minIndex);
 }
}
public static void swap(int[] arr, int i, int j) {
 int tmp = arr[i];
 arr[i] = arr[j];
 arr[j] = tmp;
}
查看原文

赞 0 收藏 0 评论 0

MosesDon 发布了文章 · 9月30日

算法与数据结构1

常数时间时间操作

  • 常见算术运算
  • 位运算(>>,>>>,<<,<<<,|,&,^)
  • 赋值、比较、自增、自减
  • 数组寻址

时间复杂度

常数时间的操作
确定算法流程的总操作数量与样本数量之间的表达式关系
只看表达式最高阶项的部分

每次拆分必须拆到常数级别

查看原文

赞 0 收藏 0 评论 0

MosesDon 发布了文章 · 9月27日

sql练习1(50附答案)

SQL练习

1、表结构

–1.学生表 
Student(s_id,s_name,s_birth,s_sex) –学生编号,学生姓名, 出生年月,学生性别 
–2.课程表 
Course(c_id,c_name,t_id) – –课程编号, 课程名称, 教师编号 
–3.教师表 
Teacher(t_id,t_name) –教师编号,教师姓名 
–4.成绩表 
Score(s_id,c_id,s_score) –学生编号,课程编号,分数

2、测试数据

-- 建表
-- 学生表
CREATE TABLE `Student`(
    `s_id` VARCHAR(20),
    `s_name` VARCHAR(20) NOT NULL DEFAULT '',
    `s_birth` VARCHAR(20) NOT NULL DEFAULT '',
    `s_sex` VARCHAR(10) NOT NULL DEFAULT '',
    PRIMARY KEY(`s_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
-- 课程表
CREATE TABLE `Course`(
    `c_id`  VARCHAR(20),
    `c_name` VARCHAR(20) NOT NULL DEFAULT '',
    `t_id` VARCHAR(20) NOT NULL,
    PRIMARY KEY(`c_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
-- 教师表
CREATE TABLE `Teacher`(
    `t_id` VARCHAR(20),
    `t_name` VARCHAR(20) NOT NULL DEFAULT '',
    PRIMARY KEY(`t_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
-- 成绩表
CREATE TABLE `Score`(
    `s_id` VARCHAR(20),
    `c_id`  VARCHAR(20),
    `s_score` INT(3),
    PRIMARY KEY(`s_id`,`c_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
-- 插入学生表测试数据
insert into Student values('01' , '赵雷' , '1990-01-01' , '男');
insert into Student values('02' , '钱电' , '1990-12-21' , '男');
insert into Student values('03' , '孙风' , '1990-05-20' , '男');
insert into Student values('04' , '李云' , '1990-08-06' , '男');
insert into Student values('05' , '周梅' , '1991-12-01' , '女');
insert into Student values('06' , '吴兰' , '1992-03-01' , '女');
insert into Student values('07' , '郑竹' , '1989-07-01' , '女');
insert into Student values('08' , '王菊' , '1990-01-20' , '女');
-- 课程表测试数据
insert into Course values('01' , '语文' , '02');
insert into Course values('02' , '数学' , '01');
insert into Course values('03' , '英语' , '03');
-- 教师表测试数据
insert into Teacher values('01' , '张三');
insert into Teacher values('02' , '李四');
insert into Teacher values('03' , '王五');
-- 成绩表测试数据
insert into Score values('01' , '01' , 80);
insert into Score values('01' , '02' , 90);
insert into Score values('01' , '03' , 99);
insert into Score values('02' , '01' , 70);
insert into Score values('02' , '02' , 60);
insert into Score values('02' , '03' , 80);
insert into Score values('03' , '01' , 80);
insert into Score values('03' , '02' , 80);
insert into Score values('03' , '03' , 80);
insert into Score values('04' , '01' , 50);
insert into Score values('04' , '02' , 30);
insert into Score values('04' , '03' , 20);
insert into Score values('05' , '01' , 76);
insert into Score values('05' , '02' , 87);
insert into Score values('06' , '01' , 31);
insert into Score values('06' , '03' , 34);
insert into Score values('07' , '02' , 89);
insert into Score values('07' , '03' , 98);

3、测试题

--  1、查询"01"课程比"02"课程成绩高的学生的信息及课程分数  
select a.* ,b.s_score as 01_score,c.s_score as 02_score from 
    Student a 
    join Score b on a.s_id=b.s_id and b.c_id='01'
    left join Score c on a.s_id=c.s_id and c.c_id='02' or c.c_id = NULL where b.s_score>c.s_score
        
--  2、查询"01"课程比"02"课程成绩低的学生的信息及课程分数 
select a.* ,b.s_score as 01_score,c.s_score as 02_score from 
    student a left join score b on a.s_id=b.s_id and b.c_id='01' or b.c_id=NULL 
     join score c on a.s_id=c.s_id and c.c_id='02' where b.s_score<c.s_score
--  3、查询平均成绩大于等于60分的同学的学生编号和学生姓名和平均成绩
select b.s_id,b.s_name,ROUND(AVG(a.s_score),2) as avg_score from 
    student b 
    join score a on b.s_id = a.s_id
    GROUP BY b.s_id,b.s_name HAVING ROUND(AVG(a.s_score),2)>=60; 
--  4、查询平均成绩小于60分的同学的学生编号和学生姓名和平均成绩
        --  (包括有成绩的和无成绩的) 
select b.s_id,b.s_name,ROUND(AVG(a.s_score),2) as avg_score from 
    student b 
    left join score a on b.s_id = a.s_id
    GROUP BY b.s_id,b.s_name HAVING ROUND(AVG(a.s_score),2)<60
    union
select a.s_id,a.s_name,0 as avg_score from 
    student a 
    where a.s_id not in (
                select distinct s_id from score);
--  5、查询所有同学的学生编号、学生姓名、选课总数、所有课程的总成绩
select a.s_id,a.s_name,count(b.c_id) as sum_course,sum(b.s_score) as sum_score from 
    student a 
    left join score b on a.s_id=b.s_id
    GROUP BY a.s_id,a.s_name;
--  6、查询"李"姓老师的数量 
select count(t_id) from teacher where t_name like '李%';
--  7、查询学过"张三"老师授课的同学的信息 
select a.* from 
    student a 
    join score b on a.s_id=b.s_id where b.c_id in(
        select c_id from course where t_id =(
            select t_id from teacher where t_name = '张三'));
--  8、查询没学过"张三"老师授课的同学的信息 
select * from 
    student c 
    where c.s_id not in(
        select a.s_id from student a join score b on a.s_id=b.s_id where b.c_id in(
            select c_id from course where t_id =(
                select t_id from teacher where t_name = '张三')));
--  9、查询学过编号为"01"并且也学过编号为"02"的课程的同学的信息 
select a.* from 
    student a,score b,score c 
    where a.s_id = b.s_id  and a.s_id = c.s_id and b.c_id='01' and c.c_id='02'; 
--  10、查询学过编号为"01"但是没有学过编号为"02"的课程的同学的信息
select a.* from 
    student a 
    where a.s_id in (select s_id from score where c_id='01' ) and a.s_id not in(select s_id from score where c_id='02')
--  11、查询没有学全所有课程的同学的信息 
select s.* from 
    student s where s.s_id in(
        select s_id from score where s_id not in(
            select a.s_id from score a 
                join score b on a.s_id = b.s_id and b.c_id='02'
                join score c on a.s_id = c.s_id and c.c_id='03'
            where a.c_id='01'))
--  12、查询至少有一门课与学号为"01"的同学所学相同的同学的信息 
select * from student where s_id in(
    select distinct a.s_id from score a where a.c_id in(select a.c_id from score a where a.s_id='01')
    );
--  13、查询和"01"号的同学学习的课程完全相同的其他同学的信息  
select a.* from student a where a.s_id in(
    select distinct s_id from score where s_id!='01' and c_id in(select c_id from score where s_id='01')
    group by s_id 
    having count(1)=(select count(1) from score where s_id='01'));
--  14、查询没学过"张三"老师讲授的任一门课程的学生姓名 
select a.s_name from student a where a.s_id not in (
    select s_id from score where c_id = 
                (select c_id from course where t_id =(
                    select t_id from teacher where t_name = '张三')) 
                group by s_id);
--  15、查询两门及其以上不及格课程的同学的学号,姓名及其平均成绩 
select a.s_id,a.s_name,ROUND(AVG(b.s_score)) from 
    student a 
    left join score b on a.s_id = b.s_id
    where a.s_id in(
            select s_id from score where s_score<60 GROUP BY  s_id having count(1)>=2)
    GROUP BY a.s_id,a.s_name 
--  16、检索"01"课程分数小于60,按分数降序排列的学生信息
select a.*,b.c_id,b.s_score from 
    student a,score b 
    where a.s_id = b.s_id and b.c_id='01' and b.s_score<60 ORDER BY b.s_score DESC;
--  17、按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩
select a.s_id,(select s_score from score where s_id=a.s_id and c_id='01') as 语文,
                (select s_score from score where s_id=a.s_id and c_id='02') as 数学,
                (select s_score from score where s_id=a.s_id and c_id='03') as 英语,
            round(avg(s_score),2) as 平均分 from score a  GROUP BY a.s_id ORDER BY 平均分 DESC;
--  18.查询各科成绩最高分、最低分和平均分:以如下形式显示:课程ID,课程name,最高分,最低分,平均分,及格率,中等率,优良率,优秀率
-- 及格为>=60,中等为:70-80,优良为:80-90,优秀为:>=90
select a.c_id,b.c_name,MAX(s_score),MIN(s_score),ROUND(AVG(s_score),2),
    ROUND(100*(SUM(case when a.s_score>=60 then 1 else 0 end)/SUM(case when a.s_score then 1 else 0 en
    d)),2) as 及格率,
    ROUND(100*(SUM(case when a.s_score>=70 and a.s_score<=80 then 1 else 0 end)/SUM(case when a.s_score then 1 else 0 end)),2) as 中等率,
    ROUND(100*(SUM(case when a.s_score>=80 and a.s_score<=90 then 1 else 0 end)/SUM(case when a.s_score then 1 else 0 end)),2) as 优良率,
    ROUND(100*(SUM(case when a.s_score>=90 then 1 else 0 end)/SUM(case when a.s_score then 1 else 0 end)),2) as 优秀率
    from score a left join course b on a.c_id = b.c_id GROUP BY a.c_id,b.c_name
--  19、按各科成绩进行排序,并显示排名(实现不完全)
--  mysql没有rank函数
    select a.s_id,a.c_id,
        @i:=@i +1 as i保留排名,
        @k:=(case when @score=a.s_score then @k else @i end) as rank不保留排名,
        @score:=a.s_score as score
    from (
        select s_id,c_id,s_score from score WHERE c_id='01' GROUP BY s_id,c_id,s_score ORDER BY s_score DESC
)a,(select @k:=0,@i:=0,@score:=0)s
    union
    select a.s_id,a.c_id,
        @i:=@i +1 as i,
        @k:=(case when @score=a.s_score then @k else @i end) as rank,
        @score:=a.s_score as score
    from (
        select s_id,c_id,s_score from score WHERE c_id='02' GROUP BY s_id,c_id,s_score ORDER BY s_score DESC
)a,(select @k:=0,@i:=0,@score:=0)s
    union
    select a.s_id,a.c_id,
        @i:=@i +1 as i,
        @k:=(case when @score=a.s_score then @k else @i end) as rank,
        @score:=a.s_score as score
    from (
        select s_id,c_id,s_score from score WHERE c_id='03' GROUP BY s_id,c_id,s_score ORDER BY s_score DESC
)a,(select @k:=0,@i:=0,@score:=0)s
--  20、查询学生的总成绩并进行排名
select a.s_id,
    @i:=@i+1 as i,
    @k:=(case when @score=a.sum_score then @k else @i end) as rank,
    @score:=a.sum_score as score
from (select s_id,SUM(s_score) as sum_score from score GROUP BY s_id ORDER BY sum_score DESC)a,
    (select @k:=0,@i:=0,@score:=0)s
--  21、查询不同老师所教不同课程平均分从高到低显示 
    select a.t_id,c.t_name,a.c_id,ROUND(avg(s_score),2) as avg_score from course a
        left join score b on a.c_id=b.c_id 
        left join teacher c on a.t_id=c.t_id
        GROUP BY a.c_id,a.t_id,c.t_name ORDER BY avg_score DESC;
--  22、查询所有课程的成绩第2名到第3名的学生信息及该课程成绩 
            select d.*,c.排名,c.s_score,c.c_id from (
                select a.s_id,a.s_score,a.c_id,@i:=@i+1 as 排名 from score a,(select @i:=0)s where a.c_id='01'    
            )c
            left join student d on c.s_id=d.s_id
            where 排名 BETWEEN 2 AND 3
            UNION
            select d.*,c.排名,c.s_score,c.c_id from (
                select a.s_id,a.s_score,a.c_id,@j:=@j+1 as 排名 from score a,(select @j:=0)s where a.c_id='02'    
            )c
            left join student d on c.s_id=d.s_id
            where 排名 BETWEEN 2 AND 3
            UNION
            select d.*,c.排名,c.s_score,c.c_id from (
                select a.s_id,a.s_score,a.c_id,@k:=@k+1 as 排名 from score a,(select @k:=0)s where a.c_id='03'    
            )c
            left join student d on c.s_id=d.s_id
            where 排名 BETWEEN 2 AND 3;
--  23、统计各科成绩各分数段人数:课程编号,课程名称,[100-85],[85-70],[70-60],[0-60]及所占百分比
        select distinct f.c_name,a.c_id,b.`85-100`,b.百分比,c.`70-85`,c.百分比,d.`60-70`,d.百分比,e.`0-60`,e.百分比 from score a
                left join (select c_id,SUM(case when s_score >85 and s_score <=100 then 1 else 0 end) as `85-100`,
                                            ROUND(100*(SUM(case when s_score >85 and s_score <=100 then 1 else 0 end)/count(*)),2) as 百分比
                                from score GROUP BY c_id)b on a.c_id=b.c_id
                left join (select c_id,SUM(case when s_score >70 and s_score <=85 then 1 else 0 end) as `70-85`,
                                            ROUND(100*(SUM(case when s_score >70 and s_score <=85 then 1 else 0 end)/count(*)),2) as 百分比
                                from score GROUP BY c_id)c on a.c_id=c.c_id
                left join (select c_id,SUM(case when s_score >60 and s_score <=70 then 1 else 0 end) as `60-70`,
                                            ROUND(100*(SUM(case when s_score >60 and s_score <=70 then 1 else 0 end)/count(*)),2) as 百分比
                                from score GROUP BY c_id)d on a.c_id=d.c_id
                left join (select c_id,SUM(case when s_score >=0 and s_score <=60 then 1 else 0 end) as `0-60`,
                                            ROUND(100*(SUM(case when s_score >=0 and s_score <=60 then 1 else 0 end)/count(*)),2) as 百分比
                                from score GROUP BY c_id)e on a.c_id=e.c_id
                left join course f on a.c_id = f.c_id
--  24、查询学生平均成绩及其名次 
        select a.s_id,
                @i:=@i+1 as '不保留空缺排名',
                @k:=(case when @avg_score=a.avg_s then @k else @i end) as '保留空缺排名',
                @avg_score:=avg_s as '平均分'
        from (select s_id,ROUND(AVG(s_score),2) as avg_s from score GROUP BY s_id)a,(select @avg_score:=0,@i:=0,@k:=0)b;
--  25、查询各科成绩前三名的记录
            --  1.选出b表比a表成绩大的所有组
            --  2.选出比当前id成绩大的 小于三个的
        select a.s_id,a.c_id,a.s_score from score a 
            left join score b on a.c_id = b.c_id and a.s_score<b.s_score
            group by a.s_id,a.c_id,a.s_score HAVING COUNT(b.s_id)<3
            ORDER BY a.c_id,a.s_score DESC 
--  26、查询每门课程被选修的学生数  
        select c_id,count(s_id) from score a GROUP BY c_id 
--  27、查询出只有两门课程的全部学生的学号和姓名 
        select s_id,s_name from student where s_id in(
                select s_id from score GROUP BY s_id HAVING COUNT(c_id)=2); 
--  28、查询男生、女生人数 
        select s_sex,COUNT(s_sex) as 人数  from student GROUP BY s_sex
--  29、查询名字中含有"风"字的学生信息
        select * from student where s_name like '%风%';
--  30、查询同名同性学生名单,并统计同名人数 
        select a.s_name,a.s_sex,count(*) from student a  JOIN 
                    student b on a.s_id !=b.s_id and a.s_name = b.s_name and a.s_sex = b.s_sex
        GROUP BY a.s_name,a.s_sex
--  31、查询1990年出生的学生名单 
        select s_name from student where s_birth like '1990%' 
--  32、查询每门课程的平均成绩,结果按平均成绩降序排列,平均成绩相同时,按课程编号升序排列 
 
    select c_id,ROUND(AVG(s_score),2) as avg_score from score GROUP BY c_id ORDER BY avg_score DESC,c_id ASC
--  33、查询平均成绩大于等于85的所有学生的学号、姓名和平均成绩 
 
    select a.s_id,b.s_name,ROUND(avg(a.s_score),2) as avg_score from score a
        left join student b on a.s_id=b.s_id GROUP BY s_id HAVING avg_score>=85
--  34、查询课程名称为"数学",且分数低于60的学生姓名和分数 
 
        select a.s_name,b.s_score from score b LEFT JOIN student a on a.s_id=b.s_id where b.c_id=(
                    select c_id from course where c_name ='数学') and b.s_score<60 
--  35、查询所有学生的课程及分数情况; 
        select a.s_id,a.s_name,
                    SUM(case c.c_name when '语文' then b.s_score else 0 end) as '语文',
                    SUM(case c.c_name when '数学' then b.s_score else 0 end) as '数学',
                    SUM(case c.c_name when '英语' then b.s_score else 0 end) as '英语',
                    SUM(b.s_score) as  '总分'
        from student a left join score b on a.s_id = b.s_id 
        left join course c on b.c_id = c.c_id 
        GROUP BY a.s_id,a.s_name  
 --  36、查询任何一门课程成绩在70分以上的姓名、课程名称和分数; 
            select a.s_name,b.c_name,c.s_score from course b left join score c on b.c_id = c.c_id
                left join student a on a.s_id=c.s_id where c.s_score>=70 
--  37、查询不及格的课程
        select a.s_id,a.c_id,b.c_name,a.s_score from score a left join course b on a.c_id = b.c_id
            where a.s_score<60 
-- 38、查询课程编号为01且课程成绩在80分以上的学生的学号和姓名; 
        select a.s_id,b.s_name from score a LEFT JOIN student b on a.s_id = b.s_id
            where a.c_id = '01' and a.s_score>80
--  39、求每门课程的学生人数 
        select count(*) from score GROUP BY c_id; 
--  40、查询选修"张三"老师所授课程的学生中,成绩最高的学生信息及其成绩
        --  查询老师id   
        select c_id from course c,teacher d where c.t_id=d.t_id and d.t_name='张三'
        --  查询最高分(可能有相同分数)
        select MAX(s_score) from score where c_id='02'
        --  查询信息
        select a.*,b.s_score,b.c_id,c.c_name from Student a
            LEFT JOIN Score b on a.s_id = b.s_id
            LEFT JOIN Course c on b.c_id=c.c_id
            where b.c_id =(select c_id from Course c,Teacher d where c.t_id=d.t_id and d.t_name='张三')
            and b.s_score in (select MAX(s_score) from Score where c_id=(select c_id from Course c,Teacher d where c.t_id=d.t_id and d.t_name='张三'))
--  41、查询不同课程成绩相同的学生的学生编号、课程编号、学生成绩 
    select DISTINCT b.s_id,b.c_id,b.s_score from score a,score b where a.c_id != b.c_id and a.s_score = b.s_score
--  42、查询每门功成绩最好的前两名 
        --  牛逼的写法
    select a.s_id,a.c_id,a.s_score from Score a
        where (select COUNT(1) from Score b where b.c_id=a.c_id and b.s_score>=a.s_score)<=2 ORDER BY a.c_id
--  43、统计每门课程的学生选修人数(超过5人的课程才统计)。要求输出课程号和选修人数,查询结果按人数降序排列,若人数相同,按课程号升序排列  
        select c_id,count(*) as total from score GROUP BY c_id HAVING total>5 ORDER BY total,c_id ASC
--  44、检索至少选修两门课程的学生学号 
        select s_id,count(*) as sel from score GROUP BY s_id HAVING sel>=2
--  45、查询选修了全部课程的学生信息 
        select * from student where s_id in(        
            select s_id from score GROUP BY s_id HAVING count(*)=(select count(*) from course))
-- 46、查询各学生的年龄
    --  按照出生日期来算,当前月日 < 出生年月的月日则,年龄减一
    select s_birth,(DATE_FORMAT(NOW(),'%Y')-DATE_FORMAT(s_birth,'%Y') - 
                (case when DATE_FORMAT(NOW(),'%m%d')>DATE_FORMAT(s_birth,'%m%d') then 0 else 1 end)) as age
        from student;
--  47、查询本周过生日的学生
    select * from student where WEEK(DATE_FORMAT(NOW(),'%Y%m%d'))=WEEK(s_birth)
    select * from student where YEARWEEK(s_birth)=YEARWEEK(DATE_FORMAT(NOW(),'%Y%m%d'))
    select WEEK(DATE_FORMAT(NOW(),'%Y%m%d')) 
--  48、查询下周过生日的学生
    select * from student where WEEK(DATE_FORMAT(NOW(),'%Y%m%d'))+1 =WEEK(s_birth) 
--  49、查询本月过生日的学生
    select * from student where MONTH(DATE_FORMAT(NOW(),'%Y%m%d')) =MONTH(s_birth)
--  50、查询下月过生日的学生
    select * from student where MONTH(DATE_FORMAT(NOW(),'%Y%m%d'))+1 =MONTH(s_birth)

练习题问题

-- 为什么用left join而且加判断 OR c.c_id = NULL? 右表数据为空为什么考虑?

总结

思路

  1. 表连接就是先join得到一个表,然后再join条件得到另一个表
  2. 一般使用left join,过滤用join
  3. 用left join时,关联条件需要判断右表数据有没有为NULL的
查看原文

赞 0 收藏 0 评论 0

认证与成就

  • 获得 1 次点赞
  • 获得 1 枚徽章 获得 0 枚金徽章, 获得 0 枚银徽章, 获得 1 枚铜徽章

擅长技能
编辑

(゚∀゚ )
暂时没有

开源项目 & 著作
编辑

(゚∀゚ )
暂时没有

注册于 5月6日
个人主页被 662 人浏览