当前位置: 首页>>名师名课>>精品教材
南强精品教材鉴读|《大数据技术原理与应用(第3版)》:开启大数据之门
发布时间:2024年06月11日 17:30

 一、教材简介

国内高校第1本大数据教材,被国内1000余所高校采用,获评“人民邮电出版社2017年度好书”和“中国工信出版传媒集团2018年优秀出版物奖”。教材有配套的实验手册《大数据基础编程、实验和案例教程》,荣获“2019年度和2021年度清华大学出版社畅销书”。教材系统介绍了大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。全书共17章,内容包含大数据的基本概念、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、MapReduce、数据仓库Hive、Spark、流计算、Flink、图计算、数据可视化以及大数据在各个行业的应用。

 二、编者简介

林子雨,厦门大学计算机科学与技术系副教授,入选“2021年高校计算机专业优秀教师奖励计划”,荣获“2022年福建省教学成果奖特等奖(排名第一)”和“2018年福建省教学成果奖二等奖(排名第一)”,以第一作者身份编著出版12本大数据系列教材,被国内1000多所高校采用,主持2门国家级线上一流本科课程,建设的大数据系列MOOC课程入选“2023年教育部国家智慧教育公共服务平台应用典型案例”。

 三、教材特色

建设了与教材配套的教学资源网站。网站免费服务于全国1000余所高校,为教师和学生开展大数据教学和学习,提供全方位、一站式“免费”在线服务(包含10+课程PPT,50+案例,300+实验指南,5000+习题,4000+技术博客),累计访问超过2500万次。

图1 与教材配套的教学资源网站

建设了与教材配套的MOOC课程。MOOC课程获评“2018年国家精品在线开放课程”、“2020年国家级线上一流本科课程”,累计学习人数超过20万,在教育部国家高等教育智慧教育平台上的大数据类课程中排名第一,入选“教育部国家高等教育智慧教育平台典型应用案例”。

图2 林子雨老师在拍摄MOOC视频

图3 国家精品在线开放课程证书

图4 国家级线上一流本科课程证书

为授课教师提供全套教学资源和教学能力持续提升服务。每年定期举办大数据教师教学研讨会(安溪论坛),已举办18期,累计有800余位教师参加了会议,共同探讨教材在各个高校实践教学中遇到的问题,并交流教学经验方法。每年定期举办“大数据教学实践分享会”,由教材作者介绍来自厦门大学大数据课堂教学的经验方法。为授课教师提供教材配套的讲义PPT、教案、教学大纲、上机实操视频、课程思政案例、题库等全套教学资源。举办大数据百家讲坛(在线讲座),持续提升大数据教师的授课能力和水平,已成功举办115期。

图5 大数据教师研讨会  

图6 大数据教学实践分享会

图7 为授课教师提供题库等教材配套资源

图8 大数据百家讲坛海报


四、教材主要内容(大纲)

第一篇 大数据基础

第1章 大数据概述

1.1 大数据时代

1.2 大数据的概念

1.3 大数据的影响

1.4 大数据的应用

1.5 大数据关键技术

1.6 大数据计算模式

1.7 大数据产业

1.8 大数据与云计算、物联网

第2章 大数据处理架构Hadoop

2.1 概述

2.2 Hadoop生态系统

2.3 Hadoop的安装与使用

实验1 熟悉常用的Linux操作和Hadoop操作

第二篇 大数据存储与管理

第3章 分布式文件系统

3.1 分布式文件系统

3.2 HDFS简介

3.3 HDFS的相关概念

3.4 HDFS体系结构

3.5 HDFS的存储原理

3.6 HDFS的数据读写过程

3.7 HDFS编程实践

实验2 熟悉常用的HDFS操作

第4章 分布式数据库HBase

4.1 概述

4.2 HBase访问接口

4.3 HBase数据模型

4.4 HBase的实现原理

4.5 HBase运行机制

4.6 HBase编程实践

实验3 熟悉常用的HBase操作

第5章 NoSQL数据库

5.1 NoSQL简介

5.2 NoSQL兴起的原因

5.3 NoSQL与关系数据库的比较

5.4 NoSQL的四大类型

5.5 NoSQL的三大基石

5.6 从NoSQL到NewSQL数据库

实验4 NoSQL和关系数据库的操作比较

第6章 云数据库

6.1 云数据库概述

6.2 云数据库产品

6.3 云数据库系统架构

第三篇 大数据处理与分析

第7章 MapReduce

7.1 概述

7.2 MapReduce的工作流程

7.3 实例分析:WordCount

7.4 MapReduce的具体应用

7.5 MapReduce编程实践

实验5 MapReduce初级编程实践

第8章 Hadoop再探讨

8.1 Hadoop的优化与发展

8.2 HDFS 2.0的新特性

8.3 新一代资源管理调度框架YARN

8.4 Hadoop生态系统中具有代表性的功能组件

第9章 数据仓库Hive

9.1 概述

9.2 Hive系统架构

9.3 Hive工作原理

9.4 Hive HA基本原理

9.5 Impala

9.6 Hive编程实践

实验6 熟悉Hive的基本操作

第10章 Spark

10.1 概述

10.2 Spark生态系统

10.3 Spark运行架构

10.4 Spark的部署和应用方式

10.5 Spark编程实践

实验7 Spark初级编程实践

第11章 流计算

11.1 流计算概述

11.2 流计算的处理流程

11.3 流计算的应用

11.4 开源流计算框架Storm

11.5 Spark Streaming

第12章 Flink

12.1 Flink简介

12.2 为什么选择Flink

12.3 Flink应用场景

12.4 Flink技术栈

12.5 Flink体系架构

12.6 Flink编程模型

12.7 Flink编程实践

实验8 Flink初级编程实践

第13章 图计算

13.1 图计算简介

13.2 Pregel简介

13.3 Pregel图计算模型

13.4 Pregel的C++ API

13.5 Pregel的体系结构

13.6 Pregel的应用实例

13.7 Pregel和MapReduce实现PageRank 算法的对比

第14章 数据可视化

14.1 可视化概述

14.2 可视化工具

14.3 可视化典型案例

第四篇 大数据应用

第15章 大数据在互联网领域的应用

15.1 推荐系统概述

15.2 协同过滤

15.3 协同过滤实践

第16章 大数据在生物医学领域的应用

16.1 流行病预测

16.2 智慧医疗

16.3 生物信息学

16.4 案例:基于大数据的综合健康服务平台

第17章 大数据的其他应用

17.1 大数据在物流领域中的应用

17.2 大数据在城市管理中的应用

17.3 大数据在金融行业中的应用

17.4 大数据在汽车行业中的应用

17.5 大数据在零售行业中的应用

17.6 大数据在餐饮行业中的应用

17.7 大数据在电信行业中的应用

17.8 大数据在能源行业中的应用

17.9 大数据在体育和娱乐领域中的应用

17.10 大数据在安全领域中的应用

17.11 大数据在政府领域中的应用

17.12 大数据在日常生活中的应用

参考文献




(信息学院)