查看原文
其他

爬虫俱乐部2019十一Python编程技术培训报名啦!

爬虫俱乐部 Stata and Python数据分析 2022-03-15

爬虫俱乐部将于2019年10月2日至10月5日在武汉举行Python编程技术培训。本次培训采用理论与案例相结合的方式,旨在帮助零基础学员轻松入门Python,由浅入深学习和掌握Python的编程技术,特别是爬虫技术和文本分析技术。本课程共四天,第一天是Python编程入门,带领学员迅速了解Python的原生语法规则、Jupyter编程环境与代码规范,使得学员能使用Python编写和执行最基本的程序;第二天将介绍简单的Python爬虫技术,深入了解HTTP协议、HTML语言、BeautifulSoup和Requests等Python第三方库的运用;第三天将学习基于selenium模拟登陆的爬虫案例以及爬虫数据处理;第四天学习使用Python进行文本分析

爬虫俱乐部已多次举办Stata和Python的编程课程,也曾经在武汉大学、华中科技大学、中央财经大学、华中农业大学、西南财经大学、西南政法大学、郑州大学、河南大学、福州大学、长沙理工大学、广西大学、石河子大学、新疆财经大学和湖北大学等进行针对教师和研究生的实证方法培训。爬虫俱乐部的公开培训也进行了十几场。

2019年7月,爬虫俱乐部的“首期Python编程技术培训”圆满结束,课程赢得了广大学员的赞赏,大家纷纷表示通过这次培训学习到了Python相关知识和技巧,受益匪浅。

python学员评价图

我们在课程期间和课程以后,均对我们的学员提供了长期的答疑解惑和技术支持。因为我们采取的是严格的小班教学,导致后期有很多学员因为人数限制而没有办法报名参加第一期的Python培训。所以,应广大粉丝以及往期学员的要求,爬虫俱乐部将于2019年10月重磅推出第二期的Python编程技术培训。

在针对市面上现有的Python线下课程进行了调研评估后,爬虫俱乐部精心编制了此次课程,内容包含当前主流的数据处理与网络爬虫技术。课程沿袭爬虫俱乐部全案例教学的光荣传统,并辅以知识图谱文档,保证知识全面性、实用性的同时兼顾趣味性。同时为了最大程度保证教学效果,课程安排了相当部分的练习时间与课后的技术答疑。课程的初衷是通过短期的课程,可以使学员迅速掌握爬虫的基本技术与知识背景,可以独立自主地开发爬虫为自身研究服务。

主讲人简介

培训内容


第一天 认识Python、熟悉Python的基础知识

导论

    Python的简介、应用前景

    Python在数据处理与爬虫上的优势

    Python环境安装与脚本运行

    Jupyter编程环境简介

    第一个Python程序

    我们应当如何高效地学习Python爬虫

基础入门

    常用数据类型

        ①数值型变量

        ②字符串变量

        ③布尔型变量

    运算符

    三种流程控制结构

        ①for

        ②while

        ③if

基础升级

    常用数据类型

        ①列表

        ②字典

    函数及方法

第二天 Python基础爬虫

课前知识

    pandas简介与基础

    第三方库json介绍

爬虫案例

    爬虫初步:抓取爬虫俱乐部官网推文(get方式)

    爬虫伪装:抓取深交所信息披露考评信息

    post型请求页面:抓取和讯网基金经理人信息

    抓取基金从业人员资格信息公示网站

配套知识/工具

    requests第三方库

    服务器请求原理与爬虫的本质工作

    HTML文档树概念

    网页信息解析库:BeautifulSoup

第三天 Python爬虫

XPath

    路径表达式

        ①使用XPath确定元素

        ②获取文本内容与文本节点

        ③获取属性

    XPath运算符

    使用XPath提取网页信息

        ①爬取新浪财经上市公司高管任职信息

        ②爬取新浪财经上市公司公告信息

selenium模拟登录

    当前业界反爬措施的总介绍

    selenium爬虫的代码理念与爬虫的工程控制

    使用selenium抓取深交所信息披露考评数据

    使用selenium爬取企查查数据 

第四天 文本分析

文本分析基础内容

    分词原理

    分词实现

    高频词统计

    图形可视化

案例分析

    日料店评论的情感分析

    基于TFIDF进行语调分析

    上市公司公告的主题模型分析

培训目的


本次培训通过具体的案例对每部分技术进行讲解,力图使大家掌握Python的基本命令、编程、数据处理以及抓取网络数据的方法。专题式的讲解使你能在短时间内掌握Python的精髓,精选的实例和翔实的配套资料能让你在课后快速拓展所学,为进一步学习和科研打下扎实的基础。

培训对象

国内高校教师、硕士生、博士生、科研所科研人员、社会团体及网络爬虫技术爱好者。

报名方式

即日起扫描下方二维码点击文末阅读原文获得报名表提交报名信息,发送“Python报名表+支付截图”至邮箱:statatraining@163.com,邮件主题为“爬虫俱乐部2019Python十一培训+姓名+单位”。


报名费用及优惠


注:1.费用包含报名费、培训费,食宿自理

2.学生报名需提供有效学生证件

支付方式

对公转账

    开户名:武汉字符串数据科技有限公司

    开户行:中国银行股份有限公司武汉中南财经政法大学分理处

    对公账号:579473738265

对私转账

    胡婧 15549490989

相关单位

武汉字符串数据科技有限公司

爬虫俱乐部

其他事项及培训安排

  • 请学员自带笔记本电脑。

  • 本次培训食宿及往返交通费用学员自理。

  • 即日起开始正式报名和收费。

培训时间地点

报到及软件安装:2019.10.1

上课时间:2019.10.2-2019.10.5

地点:湖北-武汉

联系方式

联系人:胡婧

微信:15549490989

手机:15549490989

QQ :1654896349

邮箱:1654896349@qq.com

对爬虫俱乐部的推文累计打赏超过1000元我们即可给您开具发票,发票类别为“咨询费”。用心做事,只为做您更贴心的小爬虫!

往期推文推荐

用Stata实现数据标准化

字符串方法介绍

Jupyter Notebook的使用

Stata16新功能之“框架”——frlink连接多个数据集(3)

Stata16新功能之“框架”——基础命令大合集(2)

三分钟教你读懂Python报错

解析XML文件

命令更新之reg2docx:将回归结果输出到word

命令更新之t2docx——报告分组均值t检验

爬虫俱乐部2019十一Python编程技术培训报名啦!

数据类型——Dict、Set与Frozenset简析

数据类型介绍——tuple、list和range对象
把pdf文件批量转成docx文件
格式化字符串方法的比较
朝花夕拾—— 如何输出内存中的矩阵与绘图
Stata16新功能——定义图形元素的绝对大小
将数值型计算“一网打尽”——(1)
Stata16新功能之“框架”——读入多个数据集(1)
手持Python,斗图不输!

关于我们

微信公众号“爬虫俱乐部”分享实用的stata命令,欢迎转载、打赏。爬虫俱乐部是由李春涛教授领导下的研究生及本科生组成的大数据分析和数据挖掘团队。


此外,欢迎大家踊跃投稿,介绍一些关于stata的数据处理和分析技巧。

投稿邮箱:statatraining@163.com

投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到关于stata分析数据的问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存