查看原文
其他

Python常见内置函数用法(四)

爬虫俱乐部 Stata and Python数据分析 2022-03-15

本文作者:高金凤

文字编辑:宁刘莹

技术总编:张   邯

重大通知!!!2019年7月5日至7月8日在武汉举行的首期Python编程技术定制培训招生工作已经圆满结束另外爬虫俱乐部将于2019年8月22日至28日湖北武汉举行为期一周的Stata编程技术定制培训,此次采取初级班和高级班分批次培训,仍在火热招生中。

详细培训大纲及报名方式,请点击文末阅读原文呦~


继往期推文《Python常见内置函数用法》系列,今天我们继续为大家介绍Python中常见的内置函数。

1、 内置函数input()

input()函数:该函数用于接收一个字符串,并自动忽略末尾的换行符。其实在python2中有input()和raw_input()两个函数,其中raw_input()函数将所有输入内容作为字符串看待。而Input()函数支持接收表达式、数字类型、字符串类型的数据,且若为表达式时,只返回其执行结果。在python3中对将input()和raw_input()函数进行了整合,仅保留了input函数。同时改变了input()函数的用法——将所有输入的内容按照字符串进行处理,并返回一个字符串。如果想要得到其他类型的数据只能进行类型转化。

举例如下(Python3为例):

(1) 输入一行字符串

(2) 输入一行中间有换行符的字符串

(3) 输入一行末尾带换行符的字符串


(4) 输入一个数字


     由上图可知,输入的数字是字符型的,如果需要输入数值型数据,比如int型,可以执行如下程序进行转换:

2、 内置函数int()

intint(x)函数:语法结构为class int(x, base=10),base 为进制数,默认十进制,允许的进制有 0、2-36,其中2、8、16 进制的数字可以在代码中用 0b/0B、0o/0O 、0x/0X 前缀来表示。

(1) 不写任何参数


(2) 写任意数字


(3) 带参数base(输入的数值是字符串形式)

3、 内置函数len()

len(s)函数:返回对象的长度(元素个数)。实参s可以是序列(如 string、bytes、tuple、list 或 range 等)或集合(如dictionary、set 或 frozen set 等)。

举例如下:

(1) 返回字符串长度

(2) 计算列表的元素个数


(3) 计算字典的总长度(即键值对总数)


(4) 计算元组元素个数


爬虫俱乐部将于2019年8月22日至28日湖北武汉举行为期一周的Stata编程技术定制培训,此次采取初级班和高级班分批次培训。课程通过案例教学模式,旨在帮助大家在短期内掌握Stata软件编程、金融计量知识和实证分析方法,使大家熟悉Stata核心的爬虫技术,以及Stata与其他软件交互的高端技术。

初级班主要是为了让学员掌握Stata数据分析技巧,并能独立撰写相关的程序。涉及内容包括多种数据格式的读取和输出、数据的合并、实证结果的输出以及爬虫俱乐部编写的命令介绍等。

高级班主要是为了让学员掌握Stata软件进阶操作,涉及内容包括正则表达式、网络爬虫技巧、文本分析等技术。经过团队精心策划,此次课程新增北大法宝裁判文书信息提取和百度地图api调用两大案例,以及新兴实证研究方法介绍,相信定能让学员受益匪浅!

扫描下方二维码或点击阅读原文提交报名信息→缴费→发送缴费截图至statatraining@163.com(邮件主题为“爬虫俱乐部2019暑期Stata培训+姓名+单位+班次”)→报名成功。

               



4、 内置函数list()

list()函数将可迭代对象转化为列表类型变量,可以不写任何参数,结果返回一个空列表;也可以传入一个可迭代对象,如字符串,字节数组、元组、列表、range对象,结果将返回可迭代对象中元素组成的列表。

举例如下:

    (1)  不写任何参数,创建空列表


    (2) 用字符串创建新的列表


    (3) 用字节数组创建新的列表


    (4)  用元组创建新的列表


    (5) 用列表创建新的列表


    (6) 用range对象创建新的列表


    注:若内存中含有以list为名的变量,在使用list() 函数时,先删除该变量。但就变量命名规则而言,我们强烈不推荐以list作为名字命名一个变量。

5、 内置函数max()和min()

这两个函数分别返回可迭代对象中最大的元素或最小的元素,或者返回两个及以上实参中最大或最小的。语法结构为:max/min(iterable, *[, key, default])或max/min(arg1, arg2, *args[, key]),key 是指定排序函数用的参数,default是当可迭代对象为空时返回的值。如果可迭代对象为空,并且没有default参数,则会报错。

注:如果有多个最大或最小元素,将返回第一个找到的。

举例如下:

(1) 简单用法


(2) 可迭代对象


(3) key属性的使用

当key参数不为空时,就以key的函数对象为判断的标准。比如,若我们想找出一组数中绝对值最大的数,就可以配合lamda先进行处理,再找出最大值。


找出字典中值最大或最小的那组数据。比如,若有一组参加绘画比赛的选手,其姓名和评分都存在一个字典scores中,可以用下面的方法快速找到评分最高或最低的选手。


因为在对字典进行数据操作的时候,默认只会处理key,而不是value。因此,在上面的处理中我们先使用zip把字典的keys和values交换顺序,再用max/min求出值最大/最小的数据。而当字典中的value相同的时候,才会比较key,如下所示:



对爬虫俱乐部的推文累计打赏超过1000元我们即可给您开具发票,发票类别为“咨询费”。用心做事,只为做您更贴心的小爬虫!

往期推文推荐

        xhtml2pdf生成PDF

关于我们

微信公众号“爬虫俱乐部”分享实用的stata命令,欢迎转载、打赏。爬虫俱乐部是由李春涛教授领导下的研究生及本科生组成的大数据分析和数据挖掘团队。

此外,欢迎大家踊跃投稿,介绍一些关于stata的数据处理和分析技巧。

投稿邮箱:statatraining@163.com

投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到关于stata分析数据的问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存