查看原文
其他

“狗大户”疯狂投币!中东基金加速布局A股

爬虫俱乐部 Stata and Python数据分析 2023-10-24

本文作者:何   疆 河南大学经济学院

本文编辑:陈梦鹭

技术总编:李婷婷







Stata and Python 数据分析

爬虫俱乐部Stata基础课程Stata进阶课程Python课程可在小鹅通平台查看,欢迎大家多多支持订阅!如需了解详情,可以通过课程链接(https://appbqiqpzi66527.h5.xiaoeknow.com/homepage/10)或课程二维码进行访问哦~

一、引言

散户能否跟着机构的投资脚步赚钱呢?近期有学者发表论文称散户追随机构投资者的交易来进行投资,无论是长期或是短期都很难追踪机构的脚步从而分得一部分蛋糕,当然这也并不意味着“跟着反向买,别墅靠大海”,在我们变幻莫测的A股市场中,谁又一定能做到韭菜丛中过,片叶不沾身呢?合格境外机构投资者作为外汇管制下资本市场制度创新的产物,具有重业绩、重分红和重企业增长性等理性的投资理念,拥有专业的投资团队,并积极参与企业的监管,他们的交易行为或许能为普通投资者提供一定的参考。
      自2022年末开始,以阿布扎比投资局和科威特政府投资局为首的中东主权财富基金就开始大量投资A股上市公司,并在今年第一季度继续加仓,加速布局A股市场。众所周知,中东的土豪的钱也不是天上飘来的,而是从地下冒出来的!“狗大户”的投资机构疯狂投币,他们能够在A股市场赚得盆满钵满呢?还是铩羽而归,让中东地区成为一片“绿”洲呢?这个问题交给时间来给我们答案,我们可以先看看这些机构的资金都流向何处。

二、爬取十大股东数据

我们使用Stata来爬取A股上市公司的十大股东信息,首先要安装cnstock命令,该命令可以获取最新上市公司的股票代码以及公司简称,该命令还提供了不同的选项,比如我们只要A股上市公司的数据,仅需在后面输入A即可,还有其他更加细致的板块划分,详情见推文覆盖北交所的“cnstock”复工了!

ssc install cnstock

有了cnstock的帮助,接下来我们正式开始爬取A股上市公司十大股东数据,输入以下代码:

clear all
cap mkdir d:/十大股东
cd d:/十大股东
cnstock A
levelsof stkcd,local(levels)
foreach stkcd of local levels{
copy"https://vip.stock.finance.sina.com.cn/corp/go.php/vCI_StockHolder/stockid/`stkcd'.phtml"temp.txt, replace
infix strL v 1-20000 using temp.txt, clear
replace v = ustrfrom(v,"gb18030",1)
keep if index(v,"</a></div></td>")
split v, p(`"target="_blank">"' "</a></div></td>")
keep v2
gen stkcd=`stkcd'
save `stkcd'_top10,replace
}

这样我们就能获取所有A股上市公司全部的十大股东信息,如下图所示:

随后我们将爬取下来的数据合并,就能够将所有A股上市公司的十大股东信息汇集到一起,输入:

fs *top10.dta
foreach f in `r(files)'{
append using `f'
}
save 十大股东,replace

当然,想爬取目前所有A股上市公司的十大股东信息,也十分容易,只需对以上代码稍作改动即可:

cap mkdir d:/当前十大股东
cd d:/当前十大股东
cnstock A
levelsof stkcd,local(levels)
foreach stkcd of local levels{
copy"https://vip.stock.finance.sina.com.cn/corp/go.php/vCI_StockHolder/stockid/`stkcd'.phtml"temp.txt, replace
infix strL v 1-20000 using temp.txt, clear
replace v = ustrfrom(v,"gb18030",1)

keep if index(v,"</a></div></td>")

split v, p(`"target="_blank">"' "</a></div></td>")

keep v2

keep if _n<11

gen stkcd=`stkcd'

save `stkcd'_top10,replace
}

这样就可以获得所有A股上市公司目前的十大股东,如图所示:

同样的,将其合并:

fs *top10.dta
foreach f in `r(files)'{
append using `f'
}
save 当前十大股东,replace

所有A股上市公司的十大股东信息已经爬取下来,那么接下来我们就可以看一下“狗大户”将金币都撒向了何处。

三、“狗大户”金币去向

我们将爬取下来的数据中包含阿布扎比投资局的公司保留下来,就可以看出中东主权财富基金的资金都投资了哪些公司,输入以下代码:

keep if index(十大股东,"阿布达比投资局")

就能够获得所有十大股东中包含阿布扎比投资局的A股上市公司,如图:

最终我们得到的数据中,共有110家公司目前或者曾经的十大股东中有阿布扎比投资局,其中有医药制造行业的企业最多,占12.7%,其次是专用设备制造业,占比9%,有色金属矿采业以及计算机行业也占据了5%,可见阿布扎比投资局十分看好医药行业以及专用设备制造业的公司。
     最后我们将目前十大股东中包含阿布扎比投资局和科威特政府投资局的公司爬取出来,如图所示:

截止到目前,分别有11家企业十大股东中有阿布扎比投资局,18家企业十大股东中有科威特政府投资局。
     通过上市公司的十大股东信息我们可以看出中东土豪们的资金都投入到哪些公司,哪些行业,且看他们能否在A股市场中创造较高的收益率。

END

重磅福利!为了更好地服务各位同学的研究,爬虫俱乐部将在小鹅通平台上持续提供金融研究所需要的各类指标,包括上市公司十大股东、股价崩盘、投资效率、融资约束、企业避税、分析师跟踪、净资产收益率、资产回报率、国际四大审计、托宾Q值、第一大股东持股比例、账面市值比、沪深A股上市公司研究常用控制变量等一系列深加工数据,基于各交易所信息披露的数据利用Stata在实现数据实时更新的同时还将不断上线更多的数据指标。我们以最前沿的数据处理技术、最好的服务质量、最大的诚意望能助力大家的研究工作!相关数据链接,请大家访问:(https://appbqiqpzi66527.h5.xiaoeknow.com/homepage/10)或扫描二维码:


对我们的推文累计打赏超过1000元,我们即可给您开具发票,发票类别为“咨询费”。用心做事,不负您的支持!







往期推文推荐【python可视化】立秋!酷热天气就此结束?全国各地高温地图一探究竟
Python爬取暑期票房排行
给文件搬家——copy&XCOPY
NLTK,全面的Python基础NLP库
爬取A股上市公司指定年份年报
机器学习——监督学习入门‍‍禁忌魔法解封,击穿专业壁垒:ChatGPT code interpreter暑期来啦~⼀起看⼀看近期的天⽓情况【命令重磅更新】在Stata中深入使用ChatGPT
爬虫俱乐部2023第一期编程训练营开始报名啦!
【爬虫基础】Scrapy爬虫框架迈向交互式编程,ChatGPT更新!一个简单又好玩的Python库——MyQR
replace命令的“加强版”!——如何使用ereplace,结合egen
XML 轻松读取:用 Python 发现数据宝藏

爬虫俱乐部重磅推出cnstata.com.cn

Markdown:让数学公式输入更方便!

处理日期的好手:pendulum
定制属于自己的“贾维斯”——Python调用Chat
学会format,数据格式任你拿捏     关于我们 

   微信公众号“Stata and Python数据分析”分享实用的Stata、Python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。

   武汉字符串数据科技有限公司一直为广大用户提供数据采集和分析的服务工作,如果您有这方面的需求,请发邮件到statatraining@163.com,或者直接联系我们的数据中台总工程司海涛先生,电话:18203668525,wechat: super4ht。海涛先生曾长期在香港大学从事研究工作,现为知名985大学的博士生,爬虫俱乐部网络爬虫技术和正则表达式的课程负责人。



此外,欢迎大家踊跃投稿,介绍一些关于Stata和Python的数据处理和分析技巧。

投稿邮箱:statatraining@163.com投稿要求:1)必须原创,禁止抄袭;2)必须准确,详细,有例子,有截图;注意事项:1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存