




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章Python基础1.1Python简介1.2配置环境1.3Python基础语法1.4Python编码1.5函数1.6文件操作1.7异常处理try...except...finally1.8模块1.9面向对象1.10正则表达式习题
1.1Python简介
Python是一种简单易学却又功能十分强大的脚本语言。近年来随着信息安全、人工智能和机器学习的快速发展,学习和使用该语言的用户不断增加。Python是一种解释型语言,其运行速度相对较慢,但是它拥有极高的开发效率和极其强大的内置与外置第三方库,利用Python可以在短时间内开发出满足要求的程序,因此Python在程序开发阶段节省的时间足以弥补其解释型语言运行速度低的缺陷。另外,Python开发的程序通常都以源码形式发布,用户可以根据自己的需求修改代码,扩展性很强。
1.2配置环境
1.2.1Kali安装
Kali目前的最新版本是2.0,其官方下载网址为/downloads/。建议将Kali安装在虚拟机上,此时只需要在官方网站下载相应的虚拟机镜像文件。目前常用的Kali安装版本如图1-1所示,读者自行选择相应版本下载,然后在VM(虚拟机软件)中导入就可以使用了。登录时使用Kali系统初始的用户名“root”和密码“toor”。图1-1常用的Kali安装版本
下载Kali后将其解压,并在安装完VM的情况下点击目录下后缀名为vmx的文件,即可运行Kali系统。打开虚拟机,出现图1-2所示的弹窗,点击“我已移动该虚拟机(M)”,即可继续开启虚拟机。
图1-2打开虚拟机
打开虚拟机后,以初始的用户名root、密码toor登录进入Kali系统。如果需要对Kali进行更新以获得最新版本的软件及各种组件,可以使用apt-get命令对系统和软件包进行管理,参见图1-3。
图1-3更新Kali系统中的软件
注:Kali系统中软件包安装和管理命令apt-get的用法如下:
apt-getinstallpackage:安装包。
apt-getremovepackage:删除包。
apt-getupdate:更新源。
apt-getupgrade:更新已安装的包。
apt-getdist-upgrade:升级系统。
同时,为便于Python中各种第三方库的管理,建议安装pip工具。其操作步骤如下:
(1)下载pip安装包:wgethttps://bootstrap.pypa.io/get-pip.py--no-check-certificate。
(2)以root用户运行命令pythonget-pip.py,即可完成安装。
(3)如果执行pip命令后出现文件或者目录不存在的问题,可以通过建立符号链接来解决。
1.2.2WingIDE安装
对于初学者,也可以选择付费软件WingIDE作为开发环境。WingIDE本身使用Python语言开发且功能丰富、易于编程。在Kali中安装WingIDE,首先需要下载其最新的deb安装包(下载网址为/pub/wingide),下载完成后在相应目录下执行dpkg-iwingide6_6.0.6-1_amd64.deb即可完成安装,如图1-4所示。
图1-4安装WingIDE
WingIDE安装完成后,可以在虚拟机的“Applications”→“Usualapplications”→“Programming”中找到安装好的WingIDE,如图1-5所示。
图1-5WingIDE位置
在Kali中经常会出现WingIDE使用一段时间后在界面上方导航栏中找不到的情况。为了防止这种情况的出现,可以在其安装完成之后将启动快捷方式备份一份在桌面上。在“Files”→“OtherLocations”→“Computer”中搜索“wingide”,将搜索结果中的“WingPro6.0”置于桌面以备后用,如图1-6所示。
图1-6启动快捷方式
1.3Python基础语法
1.3.1数据类型与变量在计算机中,不同的数据需要用不同的数据类型来表示。Python支持动态数据类型,程序员不需要提前声明数据类型,解释器会自动识别变量的数据类型。在Python中能够直接处理的数据类型包括整数、浮点数、字符串和布尔值,除此之外还有一些复杂的数据类型,比如列表、数组等。
注:本书演示代码采用Python2.7编写。
程序中的变量都由一个名字来表示。变量名必须是大小写英文、数字和下划线的组合,且不能以数字开头。变量可以是任意的数据类型,它对应的数据存储在内存中,而内存中又可以存储不同类型的值。在下面的代码中,可通过str(
)函数将整数转换成字符串,然后把两个字符串连接成一个字符串。
1.3.2字符串
Python中的字符串是以单引号 ‘、双引号 “ 或者三引号(
’‘’、”“”)括起来的任意文本,如:‘helloworld’、“code” 等。单引号和双引号本质上是等价的,单、双引号都支持的好处在于字符串中一旦出现单引号或者双引号时无需用转义字符,而是用另一种引号括起来即可。单引号 ‘
’定义字符串时,会认为字符串里面的双引号 “
” 是普通字符,从而不需要转义;反之用双引号定义字符串时,就会认为字符串里面的单引号是普通字符无需转义。
>>>print'hell\'o'
Python的字符串模块提供了强大的字符串处理能力。下面通过举例来介绍一些常用的字符串处理功能:
1.3.3列表
Python语言不像C语言,并没有专用的数组类型,与其相似的概念有以下几个。
(1)
list:普通的列表,初始化后可以通过特定方法动态增加元素。
定义方式:
arr=[元素]
(2)
Tuple:元组,固定的数组,一旦定义后,其元素是不能修改的。
定义方式:
arr=(元素)
(3)
Dictionary:字典类型,即Hash数组,采用键-值对的形式。
定义方式:
arr={元素key:values}
列表(list)是Python内置的一种数据类型,可以用来存储一组不同类型的数据。列表通过使用方括号括起来逗号隔开的不同的数据项即可,核心概念如图1-7所示。
图1-7Python中的list数组
与字符串的索引一样,列表索引从0开始。列表可以通过下标索引或者方括号进行截取、切片、组合等,如:
Python数组实际上是一个链表,因此定义后不能像PHP之类的语言一样,直接在后面追加元素,而是需要用操作链表的方法操作。常用的方法如表1-1所示。
1.3.4元组
元组与列表类似,最大的不同之处在于它不允许修改元组内的元素,如下所示:
1.3.5字典
除了列表外,字典也是Python的一种内置数据类型,用 {} 来表示,其元素为键-值形式,通过键来找其对应的值,字典中没有索引。字典的有关语法点如图1-8所示。
图1-8Python中的字典
可通过以下面代码来学习字典的用法:
1.3.6控制语句
和其他计算机语言一样,Python语言的控制语句主要有分支语句和循环语句两种。
1.分支语句
Python中条件选择语句的关键字为if、elif和else,其基本形式如下:
例如,if基本用法如下:
如果判断需要多个条件同时判断时,可以使用or(或)表示两个条件有一个成立时判断条件成功;使用and(与)时,表示只有两个条件同时成立的情况下,判断条件才成功。
注:Python不允许在if语句的条件中赋值,所以if1 =
2会报错。至于区别,在编程语言中 '==' 表示相等;'=' 用于赋值。
2.循环语句
for循环的语法如下:
例如,以下代码可计算数组所有元素的和:
和循环语句经常配合使用的有一个range(
)内置函数,它可以生成某个范围内的数字列表。比如,range(1,5)就会生成[1,2,3,4]这样一个列表,而range(5)会生成[0,1,2,3,4]这样一个列表。例如:
for和while循环语句还可以同if...elif...else结合起来实现各种控制,例如以下代码可找出100以内的素数(注意for...else表达的意思):
3. for...[if]... 构建List
Python中,for...[if]... 语句可简洁地构建List。从for给定的List中选择出满足if条件的元素组成新的List,其中if是可以省略的。下面举几个简单的例子进行说明。
1.4Python编码
1.4.1Python字符编码与解码通常Python程序需要处理多种字符,如英文字符、中文字符等,例如以下代码:
print"你好"
如果在终端直接运行Pythoncode.py,那么程序会报错。这是因为Python中默认的编码是ASCII码,ASCII只支持256个字符,不支持中文。在Python编码中,为了支持其他字符,必须在源文件的第一行显式指定编码的格式:
#-*-coding:utf-8-*-
或者
#coding=utf-8
注:#coding=utf-8的“=”号两边不要有空格。
在Python中,str和unicode这两种字符串类型之间的转换,是由decode函数和encode函数来完成的,如图1-9所示。
图1-9编码与解码
另外,Python中可用的字符编码有很多,并且还有各种别名,不区分英文大小写,比如UTF-8可以写成u8或者utf8,详细信息可以参考网址:/library/codecs.
html#standard-encodings。
如果一个字符串已经是unicode了,再进行解码则将出错,因此通常要对其编码方式是否为unicode进行判断,如下所示:
1.4.2数据编码
在使用Python处理密码学问题时,经常需要将一段文本转化为二进制或者十六进制进行一些位操作。Python自带的binascii模块可以很好地满足上述需求。
binascii模块除了上述ASCII编码和十六进制编码以外,还可以实现base64、crc32等编码功能。例如,Base64对应的函数分别是:
注(/wiki/Base64):
base64是一种基于64个可打印字符来表示二进制数据的表示方法。base64中的可打印字符包括字母A~Z、a~z,数字0~9,'+'、'\'
等共64个字符。每个字符可以表示6个比特信息,也就是每6个比特为一个单元,分别对应某个可打印字符。编码时每3个字节(24个比特)切分为4个base64单元,即3个字节数据需要用4个可打印字符来表示。
实际上,Python语言专门有个base64模块实现base64编码和解码,具体例子如下:
1.5函数
1.5.1函数定义
Python函数定义的基本形式如下:
其中:
(1)
def是函数定义的关键词,定义时不用指定返回值的类型。
(2)函数参数params可以是零个、一个或者多个。函数参数同样也不用指定参数类型,因为在Python中变量都是弱类型的,Python会自动根据值来维护其类型。
(3)
return返回语句是可选的,它可以在函数体内任何地方出现,表示函数的调用执行到此结束。如果没有return语句,那么会自动返回NONE;如果有return语句,但是在return后面没有接表达式或者值,那么也是返回NONE。
举例:
1.5.2函数参数
函数可以有默认参数。例如:
Python函数中,不可变参数(例如数字、字符串、元组)是通过“值”进行传递的,可变对象(例如列表和字典)是通过“指针”进行传递的。例如:
Python函数的返回值可以有多个变量,相当于返回的是一个元组,只是圆括号()被省略了。例如:
Python还支持函数的任意参数。第一种方法是在元组中收集不匹配的任意参数。第二种方法是在字典中收集不匹配的关键字参数。'*' 和 '**' 表示能够接受0到任意多个参数,'*' 表示将没有匹配的值都放在同一个元组中,'**' 表示将没有匹配的键和值都放在一个字典中。以下代码给出了Python中4种参数传递的情况:
举例:在渗透测试过程中获得了管理员口令的md5哈希值。众所周知md5是不可逆的,无法解密。唯一的办法就是从以往积累的口令字典中,逐个取出口令然后计算其md5值,再和管理员的md5哈希值进行比较,若两值相同则对应的口令就是管理员的口令。假设管理员的md5值为'21232f297a57a5a743894a0e4a801fc3',则穷举破解代码如下:
通过运行crack函数可以得知管理员密码为 'admin'。上述代码中还使用了md5模块,你可以使用help()、dir()函数来快速了解相关模块的函数。
1.5.3匿名函数
lambda函数也叫匿名函数,即该函数没有具体的名称:
f=lambda参数1,参数2:返回的计算值
例如:
>>>add=lambdax,y:x+y
>>>printadd(1,2)
3
lambda语句中,冒号前是参数,可以有多个,参数之间用逗号隔开;冒号右边是返回值。lambda语句构建的其实是一个函数对象,如下所示:
匿名函数可以作为表达式出现Python语句的任何地方,例如:
1.5.4Python中的模块
1.模块的引入
在Python中用关键字import来引入某个模块,比如要引用math模块,就可以在文件最开始的地方用importmath来引入。在调用math模块中的函数时,必须这样引用:
模块名.函数名
在函数名前必须加上模块名,是为了避免在多个模块中含有相同名称的函数情况下,解释器可以无歧义地确定要调用的函数:
有时候我们只需要用到模块中的某个函数,那么只需要引入该函数即可,此时可以通过以下语句来实现:
from模块名import函数名1,函数名2...
如果想一次性引入math中所有的函数或者常量,可以通过frommathimport* 来实现,但通常不建议这么做。
2.定义自己的模块
在Python中,每个Python文件都可以作为一个模块,模块的名字就是文件的名字。
比如有这样一个文件test.py,在test.py中定义了add函数:
3.在引入模块时的默认代码执行
先看一个例子,在文件test.py中的代码如下:
1.5.5
Python脚本框架
编写Python代码有一定的框架样式。在Python代码的开始部分(起始行),告诉系统需要使用哪一个解释器,如 "#!/usr/bin/envpython";然后通过 "defmain():" 声明一个main函数,通过main函数调用其他的函数。main函数相当于程序的主入口,通常在命令行下执行Python代码时,都是从main函数开始执行的。Python判断文件是被执行还是被调用(例如通过import方式),依靠的是 __name__ 变量。所以代码最后2行有一个if判断,其目的就在于此。
需要注意的是,Python使用缩进来对齐和组织代码的执行,所有没有缩进的代码(非函数定义和类定义),都会在载入时自动执行。这些代码,也可以认为是Python的main函数。
1.6文件操作
在上一节的crack函数中枚举了5个口令用于爆破,由于密码数量较少,因此可以很方便地将其放于列表中来遍历。在实际爆破时,可能要枚举成千上万个密码甚至更多,此时不便将这些密码置于列表中。解决此问题的方法就是密码保存在文件中,通过文件操作获得密码。接下来我们改进上面的crack函数,使其获取磁盘中保存有常见弱口令的password.txt来获得密码。
1.字符编码
要读取非UTF-8编码的文本文件,需要给open( )函数传入encoding参数,例如,读取GBK编码的文件:
>>>f=open('d:\gbk.txt','r',encoding='gbk')
>>>f.read()
'测试'
遇到有些编码不规范的文件,可能会遇到UnicodeDecodeError,因为在文本文件中可能夹杂了一些非法编码的字符。遇到这种情况,open( )函数还接收一个errors参数,表示如果遇到编码错误后如何处理。最简单的处理方式是直接忽略:
>>>f=open('d:\gbk.txt','r',encoding='gbk',errors='ignore')
2.二进制文件
前面介绍的默认都是读取文本文件,并且是UTF-8编码的文本文件。要读取二进制文件,比如图片、视频等,用 ‘rb’ 模式打开文件即可,如下所示:
>>>f=open('d:\test.jpg','rb')
>>>f.read()
b'\xff\xd8\xff\xe1\x00\x18Exif\x00\x00...'
1.7异常处理try...except...finally
异常处理在任何一门编程语言里都是值得关注的一个话题,良好的异常处理可以让程序更加健壮,清晰的错误信息有助于快速修复问题。从本章第一节到本小节,相信读者已经手敲了不少代码。代码多了难免会遇到错误,比如读者在编辑上一页中的代码时,是不是遇到了下面这种状况:
以上情况就属于IOError异常,后面的英文解释是告诉我们没有找到所谓的'D:\\password.txt' 文件或目录,遇到这种情况的读者,肯定是在D盘没有创建password.txt文件的基础上执行了上面的代码。
1.
try...except语法
通过上面例子可以知道,当程序出现异常时,程序抛出异常并终止。这就导致两个问题,首先是直接抛出异常看上去不是很友好,其次是程序出现异常无法继续执行后续代码。
接下来将介绍如何通过异常处理来解决这个问题。还是以crack函数为例,可修改crack函数如下所示:
在上述异常处理代码中:
(1)
except语句不是必需的,finally语句也不是必需的,但是二者必须要有一个,否则就没有try的意义了。
(2)
except语句可以有多个,Python会按except语句的顺序依次匹配所指定的异常,如果异常已经处理就不会再进入后面的except语句。
(3)
except语句可以以元组形式同时指定多个异常,如:
(4)
except语句后面如果不指定异常类型,则默认捕获所有异常,可以通过sys模块获取当前异常。
(5)
raise语句表示需要自主抛出一个异常类型,等同于C#和Java语言中的throw语句,其语法规则如下:
接下来进一步介绍异常处理,这里给出两个例子进行说明,一个是语句不出现异常,另一个是语句出现异常。首先介绍语句出现异常的例子,如下所示:
语句不出现异常的例子,其代码的执行如下所示:
通过比较上面两个例子可以发现,except下面的语句只有出现异常且异常与except后面指定异常类型相同时执行(本例中的Exception用于捕获所有异常),else下面的语句在不存在异常的情况下执行,finally下面的语句在两种情况下均会执行。
2.配合try...except错误控制使用
在异常处理语句中,当try代码块没有出现任何的异常时,else语句块会被执行。
结果如下:
123
convert123tointegersuccessfully
cannotconvertme123toainteger
1.8模块
1.8.1sys模块
Python内置的sys模块提供了对Python解释器和环境有关信息的访问使用与维护函数。sys.argv是一个列表,用于脚本程序从命令行获取参数信息。下面通过简单代码介绍如何通过命令行把参数传递给Python脚本,如下所示:
1.8.2os模块
os的含义为操作系统,也就是说Python内置的os模块提供了与操作系统进行交互的功能,包括系统类型、文件和目录操作、命令执行、进程操作等。下面通过一个ping扫描的例子来了解一下os模块。
1.9面向对象
Python语言可以通过class关键字创建类,下面通过将crack函数的功能拓展为一个Crack类作为示例,介绍如何在Python中创建类,具体代码如下所示:
上述Crack类中定义了密码文件路径及破解目标的set和get方法,并实现了用crack方法来实施破解的过程。通过观察可以发现,所涉及的每个方法都要传入“self”参数。该类中定义的第一个“__init__”方法实现了对类对象的初始化。
1.10正则表达式
1.10.1正则表达式的通用语法正则表达式本身也算是一种语言,有自己的语法规则。正则表达式可以包含普通字符和特殊字符。普通字符(比如数字或者字母)可以直接对目标字符串进行匹配;而特殊字符可以表示某一类普通字符,或者是改变其周围的正则表达式的含义。表1-2列举了部分正规表达式中的通用字符匹配规则。
在正则表达式中,包含“ \ ”的特殊序列的意义如表1-3所示。
1.10.2
Python的re模块
Python的re模块提供各种正则表达式的匹配操作,能够在绝大多数情况下有效地实现对复杂字符串的分析并提取出相关信息。
Python的re模块正则表达式定义了一系列函数、常量以及异常;同时,正则表达式被编译成RegexObject实例,其本身可以为不同的操作提供方法。接下来简要介绍这些函数的功能和用法。
1.
pile(pattern[,flags])
该函数把正则表达式的模式和标识转化成正则表达式对象,供match(
)和search( )两个函数使用。
re模块所定义的flag包括:
(1)
re.I:忽略大小写。
(2)
re.L:表示特殊字符集 \w,\W,\b,\B,\s,\S依赖于当前环境。
(3)
re.M:多行模式。
(4)
re.S:即为 ‘.’,并且包括换行符在内的任意字符(
‘.’
不包括换行符)。
(5)
re.U:表示特殊字符集 \w,\W,\b,\B,\d,\D,\s,\S依赖于Unicode字符属性数据库。
(6)
re.X:为了增加可读性,忽略空格和'#'后面的注释。
例如,以下两种用法的结果相同:
用法一:
用法二:
2. re.search(pattern,string[,flags])
该函数在字符串string中查找匹配正则表达式模式的位置,如果找到一个匹配就返回MatchObject的实例(并不会匹配所有的);如果没有找到匹配的位置,则返回None。
对于已编译的正则表达式对象(re.RegexObject)来说,有以下search的方法:
search(string[,pos[,endpos]])
若regex是已编译好的正则表达式对象,则regex.search(string,0,50)等同于regex.search(string[:50],0)。
具体示例如下:
3. re.match(pattern,string[,flags])
该函数用于判断pattern是否在字符串开头位置有匹配项。对于RegexObject,有函数:
match(string[,pos[,endpos]])
match( )函数只在字符串的开始位置尝试匹配正则表达式,也就是只报告从位置0开始的匹配情况;而search( )函数是扫描整个字符串来查找匹配的。如果想要搜索整个字符串来寻找匹配,应当用search( )。
4. re.split(pattern,string[,maxsplit=0,flags=0])
该函数将字符串匹配正则表达式的部分割开并返回一个列表。对于RegexObje
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度人才选拔及委托培养合同书模板
- 2025年建筑施工场地安全管理合同
- 2025年办公楼租赁合同标准协议
- 维修合同样本-合同范本-维修合同6篇
- 2025年企业股权置换策划合同模板
- 2025年金融行业劳动合同范例样本
- 2025年产品销售合同书
- 2025年无房产证房产买卖合同范本
- 2025年工程项目中标后合同范例
- 2025年股权转让合同
- 生鲜处员工培训教材
- 电子商务文案写作教学ppt课件(完整版)
- JJF 1445-2014落锤式冲击试验机校准规范
- GB/T 7024-2008电梯、自动扶梯、自动人行道术语
- GB/T 35714-2017船舶推进电动机
- GB/T 3077-2015合金结构钢
- GB/T 18179-2000金属覆盖层孔隙率试验潮湿硫(硫华)试验
- 导尿管的护理
- 妇科外阴鳞状上皮内瘤样病变诊疗常规
- 眼科基础知识完整版本课件
- 中医养生学-课件
评论
0/150
提交评论