基础教育精品课
数据管理与分析方案
年 级:高二 学 科:信息技术(华师大版)
学 校某省市浦东复旦附中分校
问题背景
在信息社会中,人们可以通过网络来了解世界各地发生的事情。某
学习系统网站上发布了课程教学视频,我们如何通过分析这些数据来获
得更好的学习体验呢?
问题1:网站上一些视频的点赞量最高、评论量最高、转发量最高? 问题2
:如何根据评分向用户进行个性化推荐?
数据管理与分析方案
1 数据管理与分析方案的基本过程
2 数据需求分析与管理
3 数据分析与科学决策
1.数据管理与分析方案的基本过程
评价和优化
数
据
需
求
分
析
数
据
管
理
数
据
分
析
科
学
决
策
2.数据需求分析与管理
数
据
需
求
分
析
需要输入的数据
输出的结果
输出方式
2.数据需求分析与管理
问题1
问题2
任务1:以小组为单位讨论,填写表格1数据需求分析表。
表1 数据需求分析表
视频的编号、名称、类
型、点赞量、评论量、
转发量
解决的问题 需要输入的数据 输出的结果 输出方式
问题1
视频的编号、名称、发
布时间、类型、点赞量、
评论量、转发量
一赞量最高的视 频、
评论量最高的视频 转
发量最高的视频
图表可视
化
问题2
视频的编号、用户编号、
用户对视频的访问数据
(是否浏览、点赞、评
论、转发、收藏)
为不同用户推荐的解说
视频
推荐视频
的编号
2.数据需求分析与管理
数
据
管
理
数据采集
数据存储和管理
人工、设备、程序
文件、数据库
关系型数据库
2.数据需求分析与管理
� 发布当天的数据 ✔ 累计一据
任务2:继续小组讨论,思考数据采集的方法及组织管理方式,填写表2和表4。
表2 采集并整理的视频数据
1267次 1345次 1123次
2245次 2365次 2103次
1876次 1768次 1689次
视频编号 视频名称 发布时间 类型
点赞量
(次)
评论量
(次)
转发量
(次)
0001 **** 历史 6896次 3227次 3905次
0002 **** 英语 万次 4567次 4605次
0003 **** 数学 5789次 3125次 2349次
2.数据需求分析与管理
表3 用户对视频的访问数据表
视频编号 用户编号 浏览 点赞 转发 评论 收藏 评分
0001 a 是 是 是 3
0002 a 是 是 是 是 4
0003 a 是 1
2.数据需求分析与管理
0001 0002 0003
a 3 4 1
b 3 5 3
c 1 3 4
表4 用户对视频的评分表
小结
需要输入的数据
输出的结果
输出方式
数据采集
数据存储与管理
数据需求分析
数据管理
方
案
的
评
价
与
优
化
3.数据分析与科学决策
分析方法选择 分析结果呈现
数据分析
数据准备
万
编号 点赞量 评论量 转发量
0001 6896 3227 3905
0002 11000 4567 4605
0003 5789 3125 2349
数据统计技术 排序、筛选、
汇总、统计
关联规则挖掘算法
数据挖掘技术
协同过滤推荐算法
数据分析
数据准备 分析方法选择 分析结果呈现
3.数据分析与科学决策
数据分析
数据准备 分析方法选择 分析结果呈现
柱状图 饼图 散点图 折线图 箱型图
3.数据分析与科学决策
3.数据分析与科学决策
编号 点赞量
0001 6896
0002 11000
0003 5789
编号 点赞量
0002 11000
0001 6896
0003 5789
排序
任务3:选择合适的数据分析方法和工具,分析一赞量最高、转发量最高、 评论
量最高的视频,并进行可视化呈现。
3.数据分析与科学决策
3.数据分析与科学决策
• 基于用户的协同过滤推荐算法
步骤1 •计算用户间
相似度
步骤2
•计算未评分物
品的预测评分
3.数据分析与科学决策
任务4:基于用户的协同过滤推荐算法,利用A I大模型生成推荐算法,分别输出
用户间相似度和用户a对三个视频的预测评分。
H
3.数据分析与科学决策
总结
明确数据需求分析的目标
采集完整且真实有效的数据
选择正确高效的数据分析方法
选择有效的数据分析工具
依靠数据分析的结果进行科学决策
作业
在信息社会中,一切皆可数据化。请同学们从以下几个问题中选择一个进
行数据需求分析,建立数据管理与分析方案,并对其进行评价和优化。
1 图书管理系统中哪些书籍的借阅量最高、点赞量最高?
2 如何向用户进行书籍的个性化推荐,方便学生更快地找到感兴趣的 书籍?
3 音乐平台上哪些歌曲的播发量最高、收藏量最多?
4 如何向用户进行音乐的个性化推荐,方便学生更快地找到感兴趣的 音乐?