查看原文
其他

覆盖北交所的“cnstock”复工了!

爬虫俱乐部 Stata and Python数据分析 2023-01-01

本文作者:孙一博,中南财经政法大学金融学院

本文编辑:智淼

技术总编:方一卓

Stata&Python云端课程来啦!

      好消息好消息,爬虫俱乐部开辟小鹅通战场!!爬虫俱乐部隆重推出小鹅通网络课程,将Stata基础课程Stata进阶课程Python课程都上传至小鹅通平台,欢迎大家多多支持订阅!报名课程即可加入答疑群,对报名有任何疑问欢迎在公众号后台留言哦。如需了解详情,可以通过课程链(https://appbqiqpzi66527.h5.xiaoeknow.com/homepage/10)或课程二维码进行访问哦~

引言

为了方便大家获取上市公司的数据,爬虫俱乐部之前发布了一系列Stata命令。近日,我们接到很多用户的反馈,使用cnstock命令获取A股上市公司股票代码和公司简称时出现了问题,dta文件中并没有代码和简称这些信息。

这是因为cnstock命令数据来源的网页源代码发生了变化,导致跑出来的数据为空。且原来网站的数据变少了,爬取之后仅有三千多家上市公司的信息,与实际数量不符。爬虫俱乐部的博士研究生薛原随后对cnstock进行“康复治疗”,更新了这个命令的源代码,换用了新的数据来源(东方财富网),并提高了命令的执行速度。命令已经上传到ssc,大家可以通过ssc install cnstock, replace更新该命令。如果需要ado文件,可以在小鹅通平台搜索爬虫俱乐部免费获取。

1

命令回顾及新增选项

cnstock命令能够下载最新上市公司的公司简称以及股票代码,原本只有中国沪深两市,这次的更新加上了北交所。同时还将板块划分地更加细致,增加的命令有全部A股市场(A)、全部B股市场(B)、深圳A股市场(SZA)和上海科创板市场(SHSTAR)。

大家使用这个命令之前,首先要进行安装或者更新,命令为:

1ssc install cnstock, replace

cnstock命令的语法结构为:cnstock exchange,[options]。

cnstock命令之后加证券交易市场(exchange)的缩写,就能够得到该交易市场的上市公司的公司名称以及股票代码,更新后的证券交易市场缩写如下:

A:全部A股市场(Shanghai, Shenzhen and Beijing A-share)

SHA:上海A股市场(Shanghai A-share)

SZA:深圳A股市场(Shenzhen A-share)

BJA:北交所A股市场(Beijing A-share)

SZGE:深圳创业板市场(Growth Enterprise Market of Shenzhen)

SHSTAR:上海科创板市场(Shanghai STAR Market)

B:全部B股市场(Shanghai and Shenzhen B-share)

SHB:上海B股市场(Shanghai B-share)

SZB:深圳B股市场(Shenzhen B-share)


我们也可以使用cnstock all下载当前所有上市公司的简称与股票代码。cnstock命令只有唯一的选项path(),这个选项定义保存数据的路径,在默认情况下保存到当前工作路径。

另外,需要注意的是:在同一路径下,每次cnstock会替换掉之前的cnstock.dta文件。

2

例子说明

1. 单个交易市场

例如我们要下载上海A股(SHA)的上市公司名称及股票代码,可以输入命令:

1clear
2cap mkdir D:\cnstock
3cd D:\cnstock
4
cnstock SHA

得到结果的如下:(部分展示)

这样,我们就下载到了上海A股市场的上市公司名称(stknm)及股票代码(stkcd)。这个文件在我们指定的路径下面保存成cnstock的dta文件。

2. 多个交易市场

当我们希望下载多个交易市场的上市公司名称以及股票代码,可在cnstock命令后直接跟上这些交易市场的名称,并以空格来分隔。

例如我们希望得到上海科创板市场(SHSTAR)、深圳创业板市场(SZGE)、北交所A股市场(BJA)的上市公司名称以及股票代码,可以输入命令:

1cnstock SHSTAR SZGE BJA

得到文件如下:

这样,我们就下载到了上海科创板市场、深圳创业板市场、北交所A股市场的上市公司名称(stknm)及股票代码(stkcd)。

当我们希望得到所有的上海A股市场、深圳A股市场、北交所A股市场、深圳创业板市场、上海科创板市场、上海B股市场、深圳B股市场的上市公司名称与股票代码。不需要在cnstock命令后跟这些市场的缩写,可在命令后直接跟all,并保存在路径为D:/temp/的文件下。命令如下:

1cnstock all,path(D:/temp/)

这样,我们就下载到了中国沪深两市以及北交所的全部上市公司名称(stknm)及股票代码(stkcd)。这个文件在D:/temp/下保存成cnstock的dta文件。

以上就是cnstock命令的更新介绍啦!在公司金融和财务会计的实证研究路上,有爬虫俱乐部开发的命令为您保驾护航,提供便利!

  END

最后,我们为大家揭秘雪球网(https://xueqiu.com/)最新所展示的沪深证券和港股关注人数增长Top10。



对我们的推文累计打赏超过1000元,我们即可给您开具发票,发票类别为“咨询费”。用心做事,不负您的支持!








往期推文推荐

       高考热度大数据爬虫——谁才是院校顶流

跨框架数据操作

      河南大学经济学院2022年Stata数据处理与爬虫技术开班仪式顺利召开

爬虫俱乐部的精彩答疑——local function

爬虫俱乐部精彩答疑——Python中的三种文件读取方法爬虫俱乐部的精彩答疑--认真仔细方能写出好程序
爬虫俱乐部Python精彩答疑——更换Jupyter Notebook浏览器及dropna()参数详解
       爬虫俱乐部的精彩答疑--如何打开Excel中扩展名与文件源码不符的文件

解锁《梦华录》之东京繁华生活

爬虫俱乐部的精彩答疑——DOS命令

爬虫俱乐部的精彩答疑之换行问题

爬虫俱乐部的精彩答疑--路径设置乱码怎么破?

爬虫俱乐部的精彩答疑--putdocx的二三事

爬虫俱乐部精彩答疑之Python篇

爬虫俱乐部的精彩答疑--花式重命名变量

      今天你还是“刘畊宏女孩”吗?

爬虫俱乐部在山东财经大学金融学院暑期Stata网课上的精彩答疑

JupyterNotebook——如何更换默认文档目录

Stata绘图系列——玩转绘图通用选项(一)

出人意料!这所大学的A级学科总数竟超越清华北大!

关于我们 


   微信公众号“Stata and Python数据分析”分享实用的Stata、Python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。

   武汉字符串数据科技有限公司一直为广大用户提供数据采集和分析的服务工作,如果您有这方面的需求,请发邮件到statatraining@163.com,或者直接联系我们的数据中台总工程司海涛先生,电话:18203668525,wechat: super4ht。海涛先生曾长期在香港大学从事研究工作,现为知名985大学的博士生,爬虫俱乐部网络爬虫技术和正则表达式的课程负责人。



此外,欢迎大家踊跃投稿,介绍一些关于Stata和Python的数据处理和分析技巧。

投稿邮箱:statatraining@163.com投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里
为作者署名,并有赏金分成。

2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众
号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。







您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存