全国高校数据采集分析与可视化师资研修班(5月线上)
时间:2021-05-23 09:00 至 2021-05-31 23:00
地点:线上活动
- 参会报名
- 会议介绍
- 会议日程
- 会议嘉宾
- 参会指南
全国高校数据采集分析与可视化师资研修班(5月线上) 已过期会议时间:2021-05-23 09:00至 2021-05-31 23:00结束 会议地点: 线上活动 详细地址会前通知 会议规模:300人 主办单位: 泰迪杯数据挖掘挑战赛组委会
|
会议介绍
会议内容 主办方介绍
全国高校数据采集分析与可视化师资研修班(5月线上)宣传图
互联网、云计算、大数据等现代信息技术深刻改变着人类的思维、生产、生活、学习方式,深刻展示了世界发展的前景。目前各院校的大数据专业教师匮乏、相关落地动手实战应用能力欠缺、授课过程中相关行业实战案例项目缺失等,为加快建设大数据专业教师队伍,推动各院校建立大数据人才培训体系和评价体系,特推出全国高校大数据与人工智能师资研修班,每年在全国范围内滚动开展八期,截止目前已在全国巡回举办40余场,参训教师近5000人次。2021年第三期全国高校数据采集分析与可视化师资研修班采用线上以云课堂形式举办,现将有关详细安排通知如下
课程介绍
数据可视化,是关于数据视觉表现形式的科学技术研究。可视化的意义在于,可视化作为人脑的辅助工具,可以替我们保留一部分信息。其次,图形化的符号可以将用户的注意力引导到重要的目标。一个好的可视化,能够带给人们不仅仅是视觉上的冲击,还能够揭示蕴含在数据中的规律和道理。
本次培训采用“云课堂线上精讲+专家技术在线答疑指导+学员群内实操答疑+助教指导”结合的方式,主要讲解了使用Python实现数据可视化,绘制各种精美分析图表,通过讲解企业级案例,真正的让各位老师可以了解到所学内容如何和实际结合,做到更好的进行教育教学工作。
课程特色
- 本课程全程强调动手实操;内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解企业级案例,真正的让学员把所学内容和工作实际有效结合,做到更好的进行教育教学工作。视频制作精良,讲师真人出镜,系统梳理课程知识框架,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。
- 核心课程部分由讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作、实际动手的能力。通过讲解具体应用,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。
- 全面实践数据可视化分析流程,可掌握Matplotlib绘图、Seaborn进阶绘图、Bokeh交互式绘图、Pyecharts绘图的主要方法和技能,注重案例实战,提供在线答疑等服务,助力夯实理论基础,掌握核心技术,全面提升专业授课能力。
- 培训期间助教全程辅助教学,每天提供10小时的实时在线答疑辅导,并进行答疑文档汇总,更好地总结学习。
- 无论是前置学习篇还是案例集训篇,相关代码、源数据、PPT、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持六个月内免费回看,以便复习和参考。
- 参加线上课程学习的学员,如后续本人参加线下课程继续深造,持线上缴费凭证可享受一次免费学习机会(仅限参加同一培训专题方向的线下课程)。
证书颁发
学员经在线培训并考试合格后,可以获得由工业和信息化部教育与考试中心颁发“高级Python技术应用职业技术证书”,证书可登录工业和信息化部教育与考试中心官网查询。
查看更多
会议日程 (最终日程以会议现场为准)
1 课程大纲
基础篇(报名成功后即可开始学习) |
|||
时间 |
课程内容 |
学习平台 |
|
正式培训前 |
Python编程基础 1准备工作 2列表操作 3程序流程控制语句 4字符串操作 4.1字符串及其索引&切片 4.2字符串的常见方法 4.3字典的创建及索引 4.4字典常用操作 4.5字典推导式 5Python文件读取操作 5.1Python读取文件 5.2练习3:统计小说中的单词频次 6函数 6.1Python函数自定义 6.2练习4:自定义求序列偶数个数的函数 7面向对象与模块 7.1Python方法与函数对比介绍 7.2Python面向对象示例 7.3Python模块使用 7.4第三方库的安装与调用 8注意事项 8.1Python工作路径说明 8.2模块命名及存放路径的注意事项 8.3结语 |
泰迪云课堂 |
|
正式培训前 |
Python数据分析与应用 1 Python数据分析概述 1.1 认识数据分析 1.2 熟悉Python数据分析的工具 1.3 安装anaconda与掌握Jupyter Notebook常用功能 2 NumPy数值计算基础 2.1 掌握NumPy数组对象 2.1.1NumPy简介 2.1.2 数组创建及基础属性 2.1.3 初识数组的特点 2.1.4 创建常用数组 2.1.5 数组数据类型 2.1.6 生成随机数 2.1.7 一维数组的索引 2.1.8 逻辑型索引 2.1.9 多维数组的索引 2.1.10 求解距离矩阵 2.1.11 变化数组shape 2.2 掌握NumPy矩阵与通用函数 2.2.1 NumPy矩阵介绍 2.2.2 NumPy通用函数介绍 2.2.3 通用函数的广播机制 2.3 利用NumPy进行统计分析 2.3.1 NumPy读写二进制文件 2.3.2 NumPy读写txt文件 2.3.3 利用NumPy对数据进行简单统计分析 3 Pandas统计分析基础 3.1 Pandas简介 3.2 读写不同数据源的数据 3.2.1 Pandas读取文本数据 3.2.2 存储数据框 3.2.3 Pandas读取excel文件 3.2.4 将数据框存储为excel文件 3.3 数据框与数据框元素 3.3.1 构建数据框 3.3.2 查看数据框的常用属性 3.3.3 按行列顺序访问数据框中的元素 3.3.4 按行列名称访问数据框中的元素 3.3.5 修改数据框中的元素 3.3.6 删除数据框中的元素 3.3.7 描述分析数据框中的元素 3.4 转换与处理时间序列数据 3.4.1 转换成时间类型数据 3.4.2 时间类型数据的常用操作 4.5 使用分组聚合进行组内计算 4.5.1 groupby分组操作 4.5.2 agg聚合操作 4.6 创建透视表与交叉表 4.6.1 生成透视表 4.6.2 生成交叉表 5 使用Pandas进行数据预处理 5.1 合并数据 5.1.1 表堆叠 5.1.2 主键合并 5.1.3 重叠合并 5.2 清洗数据 5.2.1 检测与处理重复值 5.2.2 检测与处理缺失值 5.2.3 检测与处理异常值 5.3 标准化数据 5.4 转换数据 5.4.1 哑变量处理 5.4.2 离散化连续型数据 |
泰迪云课堂 |
|
核心课程篇 |
|||
时间 |
课程内容 |
学习平台 |
|
第一课 Matplotlib基础绘图 |
|||
5月23日 18:30-22:00 |
1 Matplotlib绘图基础 1.1 Matplotlib绘制流程说明 1.2 文本标准与绘图风格 1.3 rc参数说明 2 Matplotlib绘制基础图形 2.1 Matplotlib绘制散点图 2.2 Matplotlib绘制折线图 2.3 Matplotlib任务实现 2.4 Matplotlib绘制柱状图 2.5 Matplotlib绘制饼图 2.6 Matplotlib绘制箱线图 2.7 分析人口数据特征间的关系 2.8 分析人口数据各个特征的分布与分散情况 |
|
|
操作演练/作业 |
个人PC |
||
在线答疑 |
微信群 |
||
第二课 Seaborn进阶绘图 |
|||
5月24日 18:30-22:00 |
1 Seaborn基础介绍 2 Seaborn简单绘图 3 Seaborn绘图风格 4 Seaborn调色板1 5 Seaborn调色板2 6 Seaborn绘制关系图 7 Seaborn绘制分类图 8 Seaborn绘制分布图 9 Seaborn绘制回归图 10 Seaborn绘制矩阵图 11 Seaborn绘制网格图 |
泰迪云课堂 |
|
操作演练/作业 |
个人PC |
||
在线答疑 |
微信群 |
||
第三课 Bokeh交互式绘图 |
|||
5月25日 18:30-22:00 |
1 Bokeh库介绍 2 Bokeh基本绘图 3 Bokeh风格与主题 4 Bokeh数据源与转换 5 Bokeh布局 6 Bokeh绘制条形图 7 Bokeh绘制网络图 8 Bokeh导出与嵌入1 9 Bokeh导出与嵌入2 10 运行Bokeh应用程序 |
泰迪云课堂 |
|
操作演练/作业 |
个人PC |
||
在线答疑 |
微信群 |
||
第四课 Pyecharts绘图 |
|||
5月26日 18:30-22:00 |
1 Pyecharts简介 1.1 Pyecharts介绍 1.2 Pyecharts安装 1.3 Pyecharts绘图逻辑 2 Pyecharts基本图表绘制 2.1 Pyecharts绘制日历图 2.2使用Pyecharts绘制主题河流图 2.3使用Pyecharts绘制词云图 2.4 Pyecharts绘制漏斗图 2.5 Pyecharts绘制仪表盘 2.6 Pyecharts绘制水球图 2.7 Pyecharts绘制关系图 2.8 Pyecharts绘制平行坐标系 2.9 使用Pyecharts绘制饼图 2.10 使用Pyecharts绘制雷达图 2.11 使用Pyecharts绘制词云图 2.12 Pyecharts绘制直角坐标系图表 2.13 使用Pyecharts绘制树图 2.14 使用Pyecharts绘制矩阵树图 2.15 Pyecharts绘制地理图表 2.16 Pyecharts绘制3D图表 |
泰迪云课堂 |
|
操作演练/作业 |
个人PC |
||
在线答疑 |
微信群 |
||
第五课 Python网络爬虫实战 |
|||
5月27日 18:30-22:00 |
1 认识网络爬虫 1.1 Python网络爬虫实战介绍 1.2 认识爬虫 1.3 认识反爬虫 1.4 Python爬虫环境 2 网页前端概述 2.1 概述 2.2 HTTP请求方法与过程 2.3 常见HTTP状态码 2.4 HTTP头部信息 2.5 认识cookies 2.6 小结 3 静态网页爬取 3.1 静态网页爬取概述 3.2 使用urllib3实现HTTP请求 3.3 使用requests库实现HTTP请求 3.4 谷歌开发者工具介绍 3.5.1 正则表达式介绍 3.5.2 使用正则表达式获取网页标题信息 3.6 使用XPath进行网页解析 3.7 使用BeautifulSoup进行网页解析 3.8 数据存储 3.9 小结 4 动态网页爬取 4.1 常规动态网页爬取概述 4.2 逆向分析爬取动态网页 4.3.1 使用Selenium打开浏览对象 4.3.2 Selenium页面等待 4.3.3 使用Selenium获取图书信息 4.4 小结 |
泰迪云课堂 |
|
操作演练/作业 |
个人PC |
||
在线答疑 |
微信群 |
||
第六课 《红海行动》B站弹幕采集与分析 |
|||
5月28日 18:30-22:00 |
1 案例背景与挖掘目标 2 获取弹幕数据 2.1 数据采集流程与获取影片cid 2.2 发送HTTP请求 2.3 网页解析 2.4 数据保存 3 弹幕数据可视化 3.1 词云绘制 3.2 弹幕关键信息分析 4 弹幕数据分析 4.1 时间戳处理与用户发送弹幕数量分析 4.2 弹幕数量与日期、星期的关系分析 4.3 弹幕数量与时间的关系分析 4.4 弹幕数量与影片时间节点的关系分析 5.1 小结 |
泰迪云课堂 |
|
操作演练/作业 |
个人PC |
||
在线答疑 |
微信群 |
||
第七课 某品牌手机的京东评论数据采集与分析 |
|||
5月29日 18:30-22:00 |
1 项目背景与挖掘目标 2 获取京东评论数据 2.1 通过谷歌开发者工具获取URL 2.2 发送HTTP请求与转换成JSON数据 2.3 提取信息并保存到本地 2.4 循环采集数据:自定义函数 2.5 循环采集数据:保存数据 3 对评论数据进行数据预处理 3.1 数据预处理 3.2 数据预处理实现 4 对评论数据进行可视化分析 4.1 评论数据词云绘制 4.2 好评、差评词云绘制与分析 4.3 不同颜色商品购买比例分析 4.4 不同配置商品购买比例分析 4.5 销售数量和评论数量和日期的关系 4.6 销售数量和评论数量和时间的关系 4.7 购买与评论时间间隔统计分析 4.8 不同渠道的销售比例 |
泰迪云课堂 |
|
操作演练/作业 |
个人PC |
||
在线答疑 |
微信群 |
||
第八课 大数据岗位人才招聘信息的分析与挖掘 |
|||
5月30日 18:30-22:00 |
1背景 1.1背景与目标 2数据获取 2.1信息爬取介绍 2.2获取岗位名称数据 2.3获取目录页的所有字段信息 2.4获取二级网址的网页链接 2.5获取二级网址的所有字段信息 2.6对单一目录页中的所有二级网页信息进行抓取 2.7将第一个目录页的数据进行保存 2.8批量爬取及数据保存 3数据处理 3.1已爬取数据介绍 3.2根据岗位名筛选招聘信息 3.3统一岗位名称 3.4根据工资列筛选数据 3.5完成工资数据处理 3.6工作地点字段处理 3.7公司类型字段处理 3.8行业字段数据处理 3.9工作描述字段处理 3.10公司规模字段处理 3.11数据预处理小结 4可视化分析 4.1热门招聘岗位可视化 4.2热门行业及公司招聘分析 4.3热门岗位的工资水平 4.4可视化综合分析 4.5岗位技能分析 5总结 |
泰迪云课堂 |
|
操作演练/作业 |
个人PC |
||
在线答疑 |
微信群 |
||
第九课 在线考试 |
|||
5月31日 |
高级Python技术应用工程师职业技术在线考试 |
泰迪云课堂 |
|
部分实操结果展示:
查看更多
会议嘉宾 (最终出席嘉宾以会议现场为准)
樊老师,广东泰迪智能科技股份有限公司特聘讲师,某国际银行大数据开发工程师,Hortonworks授权Apache Hadoop开发者认证培训讲师,Hadoop、Mahout技术实践者和研究者;对Hadoop的MapReduce编程模型有深刻理解,同时对Mahout技术有较深认识和理解,对Mahout源码有深入研究,擅于Mahout中数据挖掘的K均值聚类算法、贝叶斯分类算法、FP树关联规则算法的应用;主编《Mahout算法解析与案例实战》、《Hadoop数据分析与挖掘实战》、《Hadoop与大数据挖掘》等图书专著;具有电信行业和银行业的项目经验和行业知识,主持中国电科院电力大数据平台、电能量数据挖掘与智能分析、客户服务智能分析系统等项目。
张敏,广东泰迪智能科技股份有限公司、培训总监,从事用户数据分析和数据挖掘工作六年,具有丰富的大数据挖掘理论及实践培训经验,对数据具有较高的敏感度,根据数据对其进行全面的统计分析。精通Python、R语言、Matlab等多种数据挖掘工具。擅长市场发展情况监控、精确营销方面的数据挖掘工作。有为南方电网、珠江数码等大型企业长期提供实施服务的经验,主导了电子商务网站用户行为分析及网页智能推荐服务、中医证型关联规则挖掘、电信业务话单量预测、航空公司客户价值分析等多个项目。2017年“泰迪杯数据挖掘挑战赛教练员培训”主讲讲师,2018年广东省Python与深度学习技术师资培训班主讲讲师,2018年第一/三/五期全国高校大数据核心技术与应用师资研修班主讲讲师、2019年第一/二/三期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北、湖南省、甘肃省电力系统培训班主讲讲师,先后负责过西安理工大学、广东工业大学、广西师范学院、广西科技大学、闽江学院、广东石油化工学院、上海健康医学院等高校实训课程及德生科技等企业内训和数据挖掘就业班的课程。组织、参与编写图书《Python编程基础》、《Python数据分析与应用》、《R语言编程基础》等。
律波,广东泰迪智能科技有限公司高级数据分析工程师,应用统计学硕士,有较强的统计学、数学、数据挖掘理论功底;精通R、Python、Power BI、Excel等数据挖掘分析工具,具有丰富的培训和项目经验,擅长从数据中发掘规律,对数据具有较高的敏感度,逻辑思维能力强,擅长数据可视化,机器学习、深度学习等算法原理的实现,如神经网络、SVM、决策树、贝叶斯等;负责“珠江数码大数据营销推荐应用”项目,完成标签库的构建及产品推荐模型;负责“京东电商产品评论情感分析”项目,完成了评论数据情感评价模型、LDA主题模型的构建;通过项目案例的转换;负责多个本科类院校数据分析软件培训和毕业生数据分析培训,先后负责广西科技大学、闽江学院、广东石油化工、韩山师范学院、广西师范大学等数据分析软件培训及实训等。多次负责“泰迪杯”数据挖掘大赛题目的构思和实现、赛前培训。大数据专业系列图书编写委员会成员,负责《R语言与数据挖掘》、《python实训案例》、《Excel可视化案例》等书籍编写工作。
杨惠,广东泰迪智能科技股份有限公司高级数据分析师,从事人工智能工作多年,擅长计算机视觉和自然语言处理,熟悉常用深度学习算法原理及应用,如神经网络、SVM、强化学习等算法;精通TensorFlow、Python、MATLAB等常用数据挖掘处理工具。具有丰富的实践项目经验。如“智能聊天客服”项目,“车牌智能识别”项目,“京东电商产品评论情感分析”项目,“珠江数码大数据营销推荐应用”项目;“电子商务网站智能推荐服务”项目;“基于Seq2Seq注意力模型实现聊天机器人”项目。具备丰富的培训经验,曾为多家企业、院校服务过专业培训工作。如PPV商业培训、泰迪大数据师资培训、珠海城职院数据分析培训;2018年第一、三、五期全国高校大数据核心技术与应用师资研修班主讲讲师、2019年第一、三、五期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北省电力系统培训班主讲讲师。大数据专业系列图书编写委员会成员,负责《Python数据分析与应用》、《R语言编程基础》、《TensorFlow2深度学习实战》、《深度学习与计算机视觉实战》等书籍编写工作。
郑素铃,广东泰迪智能科技股份有限公司大数据研发工程师、大数据讲师。从事大数据项目研发工作,对Hadoop大数据技术有较深的研究,熟练掌握Hadoop环境部署和Hadoop核心计算框架MapReduce的原理和应用。掌握Spark原理及编程,熟练使用Spark的图计算Graphx和算法库MLlib。对非结构化数据库HBase以及结构化数据库Hive有深刻的了解。掌握数据挖掘和机器学习的常用算法,熟悉数据挖掘流程,具备项目开发经验,如“数睿思网站用户画像研究”和“法律服务智能推荐系统”项目,在推荐系统方面比较有研究。先后参与了《Hadoop大数据开发基础》、《Spark大数据技术与应用》等图书编写工作。负责过韩山师范学院、西安铁路职业技术学院等高校和教师的大数据培训课程。
焦正升,广东泰迪智能科技股份有限公司资深项目研发工程师、高级信息系统项目经理、高级软件开发工程师,拥有7年相关从业经验;致力于信息技术的应用与传播,信息系统产业的发展。精通JAVA编程语言,熟悉Spring Boot、Spring Cloud等主流开发框架、MySQL数据库、VUE数据驱动渐进式框架等主流技术。参与《Hadoop与大数据挖掘》、《Hadoop大数据分析与挖掘实战》等图书的编写。拥有电力、电子政务、轻工环保、交通运输等多项领域的项目管理研发经验,项目团队为北京市信访办研发的“大数据助力智慧信访”系统获得第七届金铃奖-公共服务类"智能决策奖"。
查看更多
参会指南
会议门票
培训费用1980元:包含报名费、学习费、资料费、证书费等,本次培训共计9天(2021年5月23日-31日)共72课时;
报名材料:报名申请表、身份证复印件、两寸近期正面免冠彩色半身证件照电子版(要求:背景:白色,格式:JPG,大小:14-20K)。
查看更多
温馨提示
酒店与住宿:
为防止极端情况下活动延期或取消,建议“异地客户”与活动家客服确认参会信息后,再安排出行与住宿。
退款规则:
活动各项资源需提前采购,购票后不支持退款,可以换人参加。
您可能还会关注
会议支持:
-
会员折扣
该会议支持会员折扣
具体折扣标准请参见plus会员页面 -
会员返积分
每消费1元累积1个会员积分。
仅PC站支持。 -
会员积分抵现
根据会员等级的不同,每抵用1元可使用的积分也不一样,具体可参见PLUS会员页面。 仅PC站支持。
部分参会单位
邮件提醒通知