查看原文
其他

善用dataex命令,高效沟通你我他

爬虫俱乐部 Stata and Python数据分析 2022-03-15

本文作者:刘子艳,河南大学经济学院

本文编辑:陈梦华

技术总编:李婷婷

Stata&Python云端课程来啦!

为了感谢大家长久以来的支持和信任,爬虫俱乐部为大家送福利啦!!!Stata&Python特惠课程双双上线腾讯课堂~原价2400元的Python编程培训课程,现在仅需100元,详情请查看推文《Python云端课程福利大放送!0基础也能学~》。关于Stata,爬虫俱乐部推出了系列课程,内容包括字符串函数、正则表达式、爬虫专题和文本分析,可以随心搭配,价格美丽,物超所值,更多信息可查看Stata系列推文《与春天有个约会,爬虫俱乐部重磅推出正则表达式网络课程!》《与春天有个约会,爬虫俱乐部重磅推出基本字符串函数网络课程》等。变的是价格,不变的是课程质量和答疑服务。对报名有任何疑问欢迎在公众号后台和腾讯课堂留言哦!

导读

应该不会有什么比下面这种情况更烦人了:

如若你也遇到过这种情况,一定要继续阅读这篇推文!下次再有人不知道怎么生成范例数据,直接将本推文抛给他,让他学到这个生成范例数据的dataex小命令~

  首先在使用前,在 Stata 命令窗口中执行ssc install dataex,下载 dataex 命令。

  然后如何使用嘞?输入 help dataex查看帮助文件~

奈何看到满页的英文,饶是头也秃了心也烦了,还是看的云里雾里不知所云!

  不愁不愁,本“哆啦A梦”就是这么善解人意,给看官带来了dataex命令简单清晰的“食用”说明书~

1.dataex语法及选项介绍
  • 语法:

dataex [varlist] [if] [in] [, varlabel elsewhere count(#)]
  • 选项介绍

选项作用
varlabel指明示例数据中要包含变量的标签
elsewhere加上这一选项,则代码分隔符code将不会显示出来
count(#)指明需要列出的变量观察值的个数,默认为count(100)
2.实用例子,加深理解小编使用sp500.dta来给各位具体介绍dataex命令:
sysuse sp500, clear //打开sp500数据dataex date ,var count(5) //生成一段Stata命令,运行即可得到5条日期数据(包含变量标签)

通过var选项,使得生成的范例数据包含变量的标签,通过count(#)选项可以指明想要的观测值的个数

dataex date open high ,count(5) elsewhere //生成一段Stata命令,运行即可得到5条date open high的数据(不包含变量标签)

由于加了elsewhere选项,生成的代码不显示code分隔符

如果数据集很大,可以考虑选择随机样本。下面这个例子使用 randomtag来选择10个随机观测值。

ssc install randomtag //randomtag是个外部命令,使用前需要下载sysuse icd9_cod.dta, clearrandomtag if length(__code9) == 4, count(10) gen(pick)dataex __code9 __desc9 if pick

将上面的命令复制(不要复制[CODE]和[/CODE]哦),发送出去,别人运行即可得到如下数据:

  通过dataex命令简洁快速的得到实例数据,与发一张数据截图相比简直不要太巴适~

  好了,内容至此,dataex这个生成范例数据的命令也给大家介绍完毕,大家可以按照里面的例子实际操作一番。下次遇到开头的情况,就可以将本篇推文推送给对方,让对方能学到这个方便好用的小命令。如果喜欢这篇推文,可以评论、点赞、关注我们哟~

最后,我们为大家揭秘雪球网(https://xueqiu.com/)最新所展示的沪深证券和港股关注人数增长Top10。



对我们的推文累计打赏超过1000元,我们即可给您开具发票,发票类别为“咨询费”。用心做事,不负您的支持!

往期推文推荐 

  用Markdown制作简历,强力助力你的求职季

大数据下的大学分数线排行榜,快来围观!

《觉醒年代》—带你回到百年前

用Stata画的三维图很奇怪怎么办?

如何随机生成满足特定数据特征的新变量?

爬取无法翻页网页——自然科学基金项目及可视化

爬取京东评论数据进行情感分类

Stata与音乐之间的酷炫连接

这些年,爬虫俱乐部走出的博士们!
         看这里,近五年各校高被引论文上榜名单!

高校经管类核心期刊发文排行榜

疯狂的科研创新加速器——Stata!

  可盐可甜,“粽”有所爱,快来pick你最爱的粽子吧!

  好玩有趣的手绘图形库——cutecharts

  爬虫实战|摩尔庄园微博话题讨论

  一季度财报出炉,哪些公司最烧钱?

  一季度财报出炉,哪些公司最赚钱?

  技能篇 | 图片合并大法

  批量空气质量数据文件合并分析

  Stata17之日期时间新功能

  Stata17之Lasso新功能

        爱奇艺视频弹幕爬取之《小舍得》         数据可视化利器——Matplotlib

  从第七次人口普查看中国人口变化|Stata与Python交互绘图

  200万投资者关注!!哪家公司这么牛?

  
带你领略一天天气之变化

  利用pyecharts看微博粉丝地区分布

  零值太多怎么办?解锁Stata17新命令ziologit

  Stata17新功能之Python API

关于我们 


微信公众号“Stata and Python数据分析”分享实用的Stata、Python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。



此外,欢迎大家踊跃投稿,介绍一些关于Stata和Python的数据处理和分析技巧。

投稿邮箱:statatraining@163.com投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存