• 参会报名
  • 会议通知
  • 会议日程
  • 会议嘉宾
  • 参会指南
  • 邀请函下载

首页 > 商务会议 > IT互联网会议 > 2019Python爬虫与文本挖掘核心技术培训班(8月北京班) 更新时间:2019-09-06T09:07:49

2019Python爬虫与文本挖掘核心技术培训班(8月北京班)
收藏人
分享到

2019Python爬虫与文本挖掘核心技术培训班(8月北京班) 已过期

会议时间:2019-08-16 09:00至 2019-08-19 16:30结束

会议地点: 北京  北京科技大学  北京市海淀区学院路30号

会议规模:50人

主办单位: 北京软数信息技术研究院

发票类型:增值税专用发票 增值税普通发票
领取方式:现场领取 
发票内容: 会议费 会务费 会议服务费 培训费 资料费 服务费 
参会凭证:邮件/短信发送参会通知 电子票

行业热销热门关注看了又看 换一换

        会议通知

        会议内容 主办方介绍


        2019Python爬虫与文本挖掘核心技术培训班(8月北京班)

        2019Python爬虫与文本挖掘核心技术培训班(8月北京班)宣传图

         “Python爬虫与文本挖掘核心技术”培训班通知

        随着互联网的发展,网络信息呈现指数式增长,要在短时间内获取大量信息,网络爬虫无疑是一种最适合的方法。通过爬虫获取的海量信息,我们可以对其进行进一步的分析:市场预测、文本分析、机器学习方法等。

        Python作为一门脚本语言,它灵活、易用、易学、适用场景多,实现程序快捷便利,早已经成为程序员们的一门编程利器。Python这门编程语言包罗万象,可以说掌握了python,除了一些特殊环境和高度的性能要求,你可以用它做任何事。为提升相关科技工作者的技术水平,北京软数信息技术研究院特举办“Python爬虫与文本挖掘核心技术”培训班,本次培训从爬虫的基本知识入手,使用Python作为实现工具,一步步地讲述网络爬虫的实现,具体内容如下:

        【培训目标】

        1、让学员快速掌握python语言基础及Python爬虫项目的编写,学会独立开发常见的爬虫项目,并能胜任相关工作;2、解决学员实际工作中的疑难问题。

        【时间地点】

        2019年08月16日——2019年08月19日   北京

        (时间安排:第一天报到,授课三天)

        【培训对象】

         各省市、自治区从事为电信、电力、政府、互联网、生产制造、零售、银行、生物、化工、医药等与数据分析、挖掘相关的企事业单位技术骨干、科研院所研究人员和大专院校相关专业教学人员及在校研究生、硕士、博士等相关人员。

        【颁发证书】

        参加相关培训并通过考试的学员可获得由工业和信息化部通信和信息技术创新人才培养工程颁发《数据挖掘应用》职业水平证书。


        北京软数信息技术研究院

        2019年07月17日 

        查看更多

        会议日程

        (最终日程以会议现场为准)


        python爬虫与文本挖掘核心技术课程大纲

        第一天:python基础   与爬虫入门

        第一章:Python基础

        <1.0>初识Python与Anaconda

        <1.1>变量类型、数据结构

        <1.2> Python控制流语句

        <1.3> Python函数与类

        第二章:Python数据分析常用库

        <2.0>使用Numpy进行数值计算

        <2.1>使用Matplotlib进行数据可视化

        <2.2>使用Pandas进行数据分析

        <2.3>使用Sci-Kit Learn进行模型构建

        第三章:Python爬虫技术入门

        <3.0>认识爬虫与反爬虫

        <3.1>配置环境变量

        <3.2>Python爬虫的基本流程

        <3.3>正则表达式

        案例1:航空公司客户价值分析

        案例2:使用正则表达式提取电话号码

        第二天:python爬虫进阶

        第四章:Python爬虫核心技术

        <4.0> urllib3, requests模块实现HTTP请求

        <4.1>网页解析(正则表达式、XPath、BeautifulSoup)

        <4.2>数据存储

        <4.3>模拟登陆(表单登陆、Cookies登陆)

        <4.4>验证码识别

        第五章:Python爬虫技术进阶

        <5.0>安装Selenium库及浏览器补丁

        <5.1>打开浏览器对象并访问网页

        <5.2>页面等待

        <5.3>页面操作

        <5.4>预期条件

        <5.5>信息提取

        案例1:前程无忧招聘信息提取

        案例2:模拟登陆数睿思网站

        案例3:《流浪地球》豆瓣影评分析 

        第第三天:文本分析基础和进阶

         

        第六章:文本挖掘入门

        <6.0>文本挖掘概述

        <6.1>分词(jieba库)

        <6.2>去除停用词

        <6.3>词云(WordCloud)绘制

        <6.4>文本的向量表示

        第七章:文本挖掘进阶

        <7.0>文本分类(Text Classifier)

        <7.1>文本聚类(Text Clustering)

        <7.2>主题模型(Topic Model)

        案例1: 基于文本挖掘的垃圾短信识别

        案例2:电商评论主题模型构建

        查看更多

        会议嘉宾

        (最终出席嘉宾以会议现场为准)


        【主讲专家】

        杨老师:北京软数信息技术研究院特邀讲师,具备丰富的培训经验,曾为多家企业、院校服务过专业培训工作。从事数据挖掘工作五年,擅长文本挖掘及深度神经网络RNN,熟悉常用机器学习算法原理及应用,如神经网络、SVM、决策树、贝叶斯等算法;精通R、Python、Matlab等常用数据挖掘处理工具。具有丰富的实践项目经验。如“京东电商产品评论情感分析”项目;“珠江数码大数据营销推荐应用”项目;“电子商务网站智能推荐服务”项目。

        查看更多

        参会指南

        会议门票 场馆介绍


        【培训费用】

        A类:¥RMB:3900/人(含报名费、培训费、教材资料费、场地费、午餐费、证书费等)

        B类:¥RMB:3500/人(含报名费、培训费、教材资料费、场地费、午餐费、证书费等)

        此费用为学生优惠价,需签到时出示学生证;

        食宿可统一安排,费用自理。

        颁发证书:参加相关培训并通过考试的学员可获得由工业和信息化部通信和信息技术创新人才培养工程颁发《数据挖掘应用》职业水平证书。

        查看更多

        北京科技大学 北京科技大学

        交通指南:

        北京市海淀区学院路30号

        北京科技大学(University of Science & Technology Beijing,USTB)是教育部直属全国重点大学,为国家“211工程”、“985工程优势学科创新平台”重点建设院校,入选“2011计划”、“卓越工程师教育培养计划”、“高等学校学科创新引智计划(111计划)“、“国家建设高水平大学公派研究生项目”,设有研究生院,是北京高科大学联盟成员 。

        学校于1952年由原北洋大学、清华大学等6所国内著名大学的矿冶科系组建而成,初名北京钢铁工业学院,1960年更名北京钢铁学院,是全国首批成立研究生院的22所高校之一。1988年定名北京科技大学,1997年5月,学校首批进入国家211工程”建设高校行列。2006年,学校成为首批“985工程”优势学科创新平台建设项目高校。2014年,入选国家“2011计划”。现已发展成为一所以工科为主,工学、理学、管理学、文学、经济学、法学等多学科协调发展的研究型重点大学。


        温馨提示
        酒店与住宿: 为防止极端情况下活动延期或取消,建议“异地客户”与活动家客服确认参会信息后,再安排出行与住宿。
        退款规则: 活动各项资源需提前采购,购票后不支持退款,可以换人参加。

        活动家为本会议官方合作
        报名平台,您可在线购票

        会议支持:

        • 会员折扣
          该会议支持会员折扣
          具体折扣标准请参见plus会员页面
        • 会员返积分
          每消费1元累积1个会员积分。
          仅PC站支持。
        • 会员积分抵现
          根据会员等级的不同,每抵用1元可使用的积分也不一样,具体可参见PLUS会员页面。 仅PC站支持。

        部分参会单位

        • 乐元素科技(北京)股份有限公司
        • 上海体育学院

        邮件提醒通知

        分享到微信 ×

        打开微信,点击底部的“发现”,
        使用“扫一扫”即可将网页分享至朋友圈。

        录入信息

        请录入信息,方便生成邀请函