《时空大数据分析与挖掘》课程教学大纲
一、课程基本信息
课程代码:23290013
课程名称:时空大数据分析与挖掘
英文名称:Spatiotemporal big data analysis and mining
课程类别: 专业选修课
学时:3
学分:48
考核方式:考试
先修课程:计算机基础课、概率与统计学
二、课程简介
随着智能感知、互联网和物联网、云计算等新兴信息技术的迅速发展,人们的位置、行为,甚至身体生理特征,大气、水质、环境……每一点变化,都成为了可被感知、记录、存储、分析和利用的数据,时空大数据已成为数据科学领域发展的主旋律。地理时空大数据5V特征决定了对其管理和应用并非易事,海量、多源、异构、动态的时空大数据对传统的数据管理模式提出了巨大的挑战,高效存储、高性能计算、智能分析和快速可视化的需求在传统的空间信息技术条件下无法被满足。面向大规模数据提供高效管理、高性能计算、深度分析挖掘、高效可视化能力云平台建设,成为GIS发展的重要方向。本课程将从空间数据3S技术采集、分布式数据管理、计算、挖掘和可视化等方面理论与方法出发,结合应用实践,讲述时空大数据时代GIS新发展,特别是在全球变化、资源调查、环境监测与预测、服务一带一路、长三角一体化发展等国家重大战略中的应用。为大数据管理与应用、数字经济及相关专业学生,传递时空信息科学研究前沿和最新发展,使其了解在空间信息领域世界各国发展的水平差异,激发爱国热情,科技报国情怀。了解我国北斗导航、中国遥感空间技术的发展,增强学生民族自信心、自豪感!
本课程旨在培养学生具有多学科知识背景,进行跨学科知识交叉学习,主动融通大数据、人工智能、云计算和移动互联网等技术,完成跨学科创新性复合型研究。这门课程主要讲述时空数据存储、计算、分析在大数据时代的新发展,涵盖时空大数据存储管理、计算分析挖掘及典型应用实例,前沿、系统、全面、应用参考性强。使得大数据、数字经济、信息统计等相关专业在校本科生、研究生具备使用跨学科工具技能,拓展其知识储备及研究领域,达到激发其学科交叉意识目标。
三、课程性质与教学目的
课程内容从空间信息科学发展历史及趋势出发,讲述GIScience学科理念、新方法,与人工智能、大数据、云计算相结合的地理信息科学前沿研究成果,包括面向时空大数据的分布式空间数据存储、计算和挖掘方法,空间大数据的应用案例分析等。通过课程学习,使学生具有多学科知识背景,增强其学科交叉研究的兴趣,成为掌握学科交叉创新型复合人才!通过时空大数据挖掘,清晰地传达大数据背后的信息,揭示大数据中蕴含的规律及道理,丰富学生的知识储备。为发展数字中国,为更好理解我国数据基本制度的“数据二十条”,为构筑国家竞争新优势,增强我国经济发展新动能,培养多素养综合型人才。
四、教学内容及要求
第一模块 时空大数据采集与处理
掌握时空大数据的5V特征,空间与大数据相遇所面临的挑战;理解数据驱动的新研究范式,了解我国北斗导航、中国遥感空间技术的发展,增强学生民族自信心、自豪感!
掌握3S(RS、GIS、GNSS)技术下时空多源数据采集及使用;
理解时空大数据对存储管理带来的新挑战。 重温空间特性在关系数据库的解决之道,了解新的NoSQL数据库存在的优劣,了解分布式存储方式。
理解数据倾斜和计算倾斜对高性能时空计算带来的困难。了解实现高性能时空计算所设计的策略,掌握计算任务划分的评价模型和划分方法;
第一模块 时空大数据采集与处理
主要内容
第一章 洞悉时空大数据
1.1 时空大数据时代特征
1.2 数据驱动地理学研究新范式
1.3时空大数据基础信息设施
第二章 时空大数据采集
2.1 遥感RS数据采集
2.2 我国北斗导航GNSS数据采集
2.3 GIS数据
第三章 时空大数据存储与管理
3.1 时空大数据存储管理的新挑战
3.2 关系型空间数据库
3.3 NoSQL数据库
3.4 分布式数据存储
3.5时空大数据高性能计算策略
3.6 实例-基于分布式内存计算的并行二路空间连接算法
基本概念和知识点
3S技术下时空多源数据采集使用、时空大数据对存储管理策略、NoSQL数据库性能、了解高性能时空计算所设计与划分的策略、计算任务划分的评价模型和划分方法及我国空间技术发展。
问题与应用(能力要求)
掌握3S技术下时空多源数据采集及使用;
思考与实践
会使用RS、GIS、Python软件采集处理数据
教学方法与手段
课堂讲授、多媒体教学、实验教学
第二模块 时空大数据分析与挖掘
(一)目的与要求
1.掌握时空大数据聚类的最新发展,掌握时空关联规则挖掘的重要性和新方法;
2.掌握GWR地理回归模型的发展并会使用,及如何与神经网络相结合;
3.理解海量、高维对时空可视化带来的影响,了解应对大规模特征数据加载和渲染策略,三维可视化的常用方法和框架,通过实例理解实时虚拟切片方式在大数据可视化中的应用。
4.通过案例了解从数据到知识的过程,理解时空大数据对地理学研究带来的变化。理解时空大数据平台框架如何作用于大规模时空数据的分析应用,通过案例引发对时空大数据挖掘分析与应用的兴趣。
(二)教学内容
1.主要内容
第四章 时空大数据分析挖掘
4.1 时空大数据聚类分析
4.2 时空关联规则挖掘
4.3 地统计分析
4.3.1 地统计分析概述
4.3.2 区域化变量理论
4.3.3 空间变异函数
4.3.4 克里金估计方法
4.4 GWR地理关系回归分析
4.4.1 地理加权回归分析技术
4.4.2 多尺度地理加权回归分析技术
4.4.3 R函数工具包
4.5地理大数据挖掘建模与工作流
4.5.1 空间分析建模
4.5.2 ModelBuilder建模及工作流技术
4.5.3 KNIME工作流技术
5.1 数据加载和渲染策略
5.2 三维可视化
5.3 实例-免预先切片
第六章 智能空间分析与空间决策支持
6.1基于时空信息云平台应用实例
6.1.1大规模时空热点分析并行计算
6.1.2夜光遥感分析与挖掘
6.1.3疫情期间我国人群活动分析及轨迹挖掘
6.1.4空间社会网络分析
6.2.基于流程化服务时空大数据深度挖掘:人口预测和学区预警
6.3城市计算视角下公共交通模式挖掘
6.4基于大数据城市功能区划分研究
2. 基本概念和知识点
掌握空间聚类分析、空间相关性、地统计、GWR、ModelBuilder等时空数据分析方法、建模流程及KNIME工作流技、空间大数据多维时空可视化概念、理解时空数据分析实例;
问题与应用(能力要求)
会使用空间聚类分析、空间相关性、地统计、GWR、ModelBuilder等时空数据分析方法、建模流程及KNIME工作流、可视化Tableau等技术;
(三)思考与实践
会使用GeoDa、ArcGis空间大数据分析软件解决实际问题
(四)教学方法与手段
课堂讲授、多媒体教学、网络辅助教学
五、各教学环节学时分配
教学环节 教学时数 课程内容 | 讲 课 | 习 题 课 | 讨 论 课 | 实验 | 实习 | 其他教学环节 | 小 计 |
第一章 | 3 | 3 | |||||
第二章 | 6 | 6 | 12 | ||||
第三章 | 3 | 3 | |||||
第四章 | 6 | 6 | 12 | ||||
第五章 | 3 | 6 | 9 | ||||
第六章 | 3 | 6 | 9 | ||||
合计 | 24 | 24 | 48 |
“各教学环节学时分配”中,“其它教学环节”主要指习题课、课堂讨论、课程设计、观看视频、现场参观等教学环节。
六、课程考核
(一)考核方式:考试
(二)成绩构成
平时成绩占比:30期末考试占比:70
(三)成绩考核标准
当今人类社会处于大数据时代,通过本课程学习,使学生理解掌握时空大数据的应用背景、基本原理、相关技术工具及软件。通过实际案例分析,使学生树立大数据思维模式、运用时空数据思维解决实际问题的意识及能力;使学生具有多学科知识背景,增强其学科交叉研究的兴趣,成为掌握学科交叉创新型复合人才!了解在空间信息领域世界各国发展的水平差异,激发爱国热情,科技报国情怀。
七、推荐教材和教学参考资源
1.梅宏 著.《大数据导论》.北京:高等教育出版社,2005;
2.秦昆,卢宾宾等.《空间数据分析(第二版)》,武汉:武汉大学出版社, 2023.
3.汤国安 等.《ArcGIS地理信息系统空间分析实验教程》(第二版),北京:科学出版社,2021.
4、王劲峰 等.《空间数据分析教程》,北京:科学出版社,2017.
5、刘湘南 等.《GIS空间分析原理与方法》(第二版),北京:科学出版社,2017.
6、张莉,金莹等.《Python程序设计(第2版)》,北京:高等教育出版社, 2022.9.
7、孙家抦、倪玲、周军其等著.《遥感原理与应用》(第三版),北京:武汉大学出版社, 2003.
8、(美)Andy Mitchell.《GIS空间分析指南》,北京:测绘出版社,201
八、其他说明
大纲修订人: 龙晓君 修订日期:2023.11
大纲审定人: 审定日期: