




已阅读5页,还剩92页未读, 继续免费阅读
(计算机系统结构专业论文)基于ldap的智能邮件头信息分析机制的设计与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
曩 一【 一 i , | i i i rl|i|ll f l | l i i | i t i lii|i|ffiiilli|llii!lffll0 y 1 8 4 2 6 9 2 a t h e s i sf o rt h ed e g r e eo fm a s t e ri nc o m p u t e ra r c h i t e c t u r e d e s i g na n di m p l e m e n t a t i o no ft h ei n t e l l i g e n tm a i l h e a d a n a l y s i sm e c h a n i s m sb a s e do nl d a p s u p e r v i n o b yh a nl i n 瞻叮 誓 d - i 矗 独创性声明 本人声明所呈交的学位论文是在导师的指导下完成的。论文中取得的 研究成果除加以标注和致谢的地方外,不包含其他人已经发表或撰写过的 研究成果,也不包括本人为获得其他学位而使用过的材料。与我一同工作 的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示诚挚 的谢意。 学位论文作者签名:端 签字日期:弘彬扩i 2 , o 学位论文版权使用授权书 本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论 文的规定:即学校有权保留并向国家有关部门或机构送交论文的复印件和 磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学位论文的全部 或部分内容编入有关数据库进行检索、交流。 ( 如作者和导师同意网上交流,请在下方签名:否则视为不同意) 学位论文作者签名:韩谢采 导师签名: 签字日期:现形多7 矽签字日期: 1 别 渤g f ,7 1 0 l , 二 东北大学硕士学位论文 摘要 基于l d a p 的智能邮件头信息分析机制的设计与实现 摘要 随着i n t e m e t 的发展,电子邮件以其经济快捷的特点,成为网络时代人们最基本最常 用的信息交换手段之一。但电子邮件给用户带来便利的同时,也遭到了一些人的滥用, 结果就是有大量的垃圾邮件充斥i n t e m e t 。这些垃圾邮件不但影响了正常的网络应用,也 影响了人们正常的工作和学习,给用户和网络服务提供商i s p ( i n t e m e ts e r v i c ep r o v i d e r ) 造成了巨大的损失。因此,如何对垃圾邮件进行有效地过滤是当前网络应用研究中的一 个重要方向。 本文对垃圾邮件的主要过滤技术进行了总结和分析,发现近年来垃圾邮件的防治工 作主要是依靠技术方式来实现,一种很有效的手段就是在邮件传输代理m t a ( m a i l t r a n s f e ra g e n t ) 处判断出垃圾邮件并进行过滤。电子邮件有很多特点,其中邮件结构是 由邮件头和邮件主体组成的,而邮件头有很多信息可以被用作判断垃圾邮件的重要依 据,并可以根据部分头信息追踪出垃圾邮件的源头j 、对垃圾邮件发送者给以治裁和处理。 l d a p 目录服务被设计为对读密集型操作进行优化,使用l d a p 来存储信息会大大 提高服务器的响应能力,所以本文选择o p e n l d a p 数据库服务器。从邮件样本中提取邮 件头信息将其存入数据库,利用向量空间模型生成邮件头信息向量,对这些向量进行分 析。针对样本集规模、分类精度、发生类别增量时离线训练时间和敏感词汇等问题,文 中分别设计了四种智能邮件头信息分析机制,分别基于可伸缩决策树算法、变精度粗糙 集决策树算法、适应类别增量的决策树算法和一种新的快速b p 神经网络算法( b a c k p r o p a g a t i o n ) 。利用这四种算法对邮件头信息进行分析,提取特征,得到垃圾邮件过滤 规则,这样就可以把分析得到的结果直接应用到m t a 处,实现对垃圾邮件的阻挡。 为了验证设计的四种邮件头信息分析机制的可行性和有效性,本文对这些机制进行 了实现,并对以下几个方面的性能进行测试:获取规则的时间,发现垃圾邮件的能力, 正确判断垃圾邮件的能力,将正常邮件误判为垃圾邮件的比例。在对四个机制分别测试 后还进行了综合比较,从测试结果可以看到,这些机制在性能上取得了比较令人满意的 结果,在过滤垃圾邮件的应用中是可行的和有效的。 关键词:垃圾邮件;邮件头;特征选择;l d a p ;智能算法 一一 一 、, 七 妇 j , d e s i g na n di m p l e m e n t a t i o no f t h ei n t e l l i g e n tm a i l h e a da n a l y s i s m e c h a n i s m sb a s e do nl d a p a b s t r a c t w i t ht h ed e v e l o p m e n to fi n t e m e t ,e m a i lh a sb e c o m e o n eo ft h em o s tb a s i ca n dt h em o s t m l i v e r s a li n f o 姗a t i o nc o m m u t a t i o nm e t h o d sf o rp e o p l ei ni n t e r n e te r ab e c a u s eo fr a p i d i t ya n d c h e a p n e s s e m a i lb r i n g su sc o n v e n i e n c e ;h o w e v e r , i ti sa b u s e db ys o m ep e o p l e a tt h es a m e t i m e a sar e s u l t i n t e m e ti so f t e nf l o o d e dw i t hs p a m s p a m h a sa f f e c t e dn o to n l yt h en o r m a l h l t e m e ta p p l i c a t i o nb u ta l s op e o p l e sn o r m a lw o r ka n ds t u d y i th a sb r o u g h tg r e a tl o s st o e m a i lu s e ra n di n t e m e ts e r v i c ep r o v i d e r t h u s ,h o wt of i l t e rs p a me f f e c t i v e l yi sa ni m p o r t a n t d i r e c t i o ni nt h ec u r r e n ti n t e m e ta p p l i c a t i o nr e s e a r c h i nt h i st h e s i s ,t h ep r i m a r yt e c h n o l o g yo fs p a mf i l t e r i n ga r es u m m e du pa n da n a l y z e da n d t h ec o n c l u s i o nt h a ts p a mp r e v e n t i o ni sm a i n l yd e p e n d i n go nt e c h n i q u e m e t h o di nr e c e n ty e a r s c a nb eg o t t o n i ti sav a l i dm e t h o dt oj u d g ea n df i l t e rs p a mi nm t a ( m a i lt r a n s f e ra g e n t ) e m a i lh 舔m a n yc h a r a c t e r i s t i c s ;i ti sc o m p o s e do fm a i l h e a da n dm a i l _ b o d y t h e r ei s m u c h i i l f o m a t i o no ft 1 1 em a i l h e a dc a nb eu s e da si m p o r t a n tf o u n d a t i o n t oj u d g es p a m a n d a c c o r d i n gt op a r to f t h em a i l h e a di n f o r m a t i o n ,t h es o u r c eo fs p a mc a r la l s ob et r a c k e d ,t h u s t h es p a m e rc a nb ei m p o s e ds a n c t i o n s l d a pd i r e c t o r ys e r v i c ei sd e s i g n e dt oo p t i m i z er e a d - i n t e n s i v eo p e r a t i o n t h er e s p o n s e c a p a b i l i t vo f s e r v e rc a nb ei n c r e a s e dg r e a t l yb yu s i n gl d a p t h u s ,o p e n l d a p d a t a b a s es e r v e r i sd h o s e ni nt h i st h e s i s m a i l h e a d i n f o r m a t i o no fe m a i ls a m p l e si sg o t t o n ,v e c t o r so f m a i l h e a di n f b n l l a t i o na r eg e n e r a t e du s i n gv e c t o rs p a c em o d e l a n da n a l y s e du s i n gi n t e l l i g e n t a 1 留o r i t h n s c o n s i d e r i n gt h es i z e so fs a m p l e s ,c l a s s i f i c a t i o np r e c i s i o n ,o f f - l i n et r a i n i n gt i m e w h e nt h en 咖曲e ro fs o r ti n c r e a s e da n ds e n s i t i v ew o r d s ,f o u ri n t e l l i g e n tm a i l - h e a da n a l y s i s m e c h a n i s m sa r ed e s i g n e d ,r e s p e c t i v e l yb a s e do ns c a l a b l ed e c i s i o nt r e ea l g o r i t h m ,v a r i a b l e p r e c i s i o nr o u g hs e td e c i s i o nt r e ea l g o r i t h m ,c l a s si n c r e m e n t a ld e c i s i o nt r e ea l g o r i t h m 锄d q u i c kb p ( b a c kp r o p a g a t i o n ) n e u r a ln e t w o r ka l g o r i t h m a c c o r d i n g t ot h ef o u ra l g o r i t h m s , m a i l h e a dv e c t o r sa r ea n a l y z e d ,f e a t u r e sa r es e l e c t e d ,a n df i l t e r i n gr u l e s a r eg o t t o n t h e s e r u l e sc a r lb ed i r e c t l yu s e da tm t a t ob l o c kt h es p a m t ov e r i f yt h ef e a s i b i l i t ya n dv a l i d i t yo ft h e f o u rm a i l - h e a di n f o r m a t i o na n a l y s i s m e c h a n i s m s t h e s em e c h a n i s m sa r ei m p l e m e n t e d , a n dp e r f o r m a n c e sa r et e s t e dmm e f o l l o w i n gs i d e s :t h et i m eo fg e t t i n gr u l e s ,t h ec a p a b i l i t yo ff i n d i n gs p a m ,t h ea c c u r a c yo f j u d g i n gs p a m ,a n dt h er a t eo ft a k i n gh a mf o rs p a m a f t e rt h a t ,t h ep e r f o r m a n c e so ft h e s e m e c h a n i s m sa r ec o m p a r e d ,a n dt h et e s t i n gr e s u l t sh a v es h o w nt h a tt h e s em e c h a n i s m sh a v e s a t i s f y i n gp e r f o r m a n c e s t h u s ,t h em e c h a n i s m sd e s i g n e db y t h i sp a p e ra r eb o t hf e a s i b l ea n d 一一 东北大学硕士学位论文 a b s t r a c t e f f e c t i v ei ns p a mf i l t e r i n ga p p l i c a t i o n k e y w o r d s :s p a m ;m a i l h e a d ;f e a t u r es e l e c t i o n ;l d a p ;i n t e l l i g e n ta l g o r i t h m 一 r r 气 _ 东北大学硕士学位论文 目录 目录 独创性声明i 摘要: a b s t r a c t h i 第一章绪论1 1 1 电子邮件1 1 1 1 电子邮件发展历史1 1 1 2 电子邮件格式2 1 1 3 邮件头的格式和结构2 1 1 4 电子邮件传输过程。5 1 1 5p o pj ! ii m t p 6 1 1 6s m t p 协议概述7 1 2 垃圾邮件9 1 2 1 垃圾邮件的定义和产生的原因9 1 2 2 垃圾邮件危害和反垃圾邮件研究现状1 0 1 3 垃圾邮件过滤技术1 1 1 3 1 服务器端和用户端邮件过滤1 1 1 3 2 白名单和黑名单1 2 1 3 3 基于规则的垃圾邮件过滤技术1 2 1 3 4 基于内容的垃圾邮件过滤技术。一1 3 1 3 4 1 基于规则的方法1 3 1 3 4 2 基于统计的方法1 4 1 4 课题来源及主要内容1 6 第二章相关知识和技术1 7 2 1l d a p 17 2 1 1l d a p 概述l7 2 1 2l d a p 模型l8 2 1 2 1 信息模型18 2 1 2 2 命名模型18 2 1 2 3 功能模型19 2 1 2 4 安全模型2 0 2 2 向量空间模型2 0 v 一 东北大学硕士学位论文目录 2 3 智能算法2 1 2 3 1 基于信息熵的可伸缩决策树算法2 1 2 3 2 基于变精度粗糙集决策树算法2 5 2 - 3 3 适应类别增量的决策树算法2 8 2 3 4 快速b p 神经网络算法3 0 第三章系统设计3 7 3 1 设计目标3 7 3 2 总体设计。3 7 3 2 1 基于l d a p 的系统模型设计3 7 3 2 2l d a p 目录设计3 8 3 2 3 邮件头向量设计3 8 3 2 4 基于信息熵的可伸缩决策树算法的邮件头信息分析机制4 0 3 2 5 基于变精度粗糙集决策树算法的邮件头信息分析机制4 0 3 2 6 基于适应类别增量决策树算法的邮件头信息分析机制4 0 3 2 7 基于快速b p 神经网络算法的邮件头信息分析机制4 0 3 3 详细设计4 1 3 3 1l d a p 目录详细设计4 1 3 3 1 1 信息模型设计,4 1 3 3 1 2 命名模型的设计:。:一4 2 3 3 2 基于l d a p 的邮件头信息提取入库模块4 3 3 3 3 生成邮件头信息向量模块4 4 3 3 4 基于信息熵的可伸缩决策树算法的邮件头信息分析机制模块4 5 3 3 5 基于变精度粗糙集决策树算法的邮件头信息分析机制模块4 6 3 3 6 基于适应类别增量决策树算法的邮件头信息分析机制模块4 7 3 3 7 基于快速b p 神经网络算法的邮件头信息分析机制模块4 8 第四章系统实现4 9 4 1 实现环境4 9 4 1 1l i n u x 平台4 9 4 1 2l i n u xc 5 0 4 1 3o p e n l d a p 服务器。5 0 4 1 4w i n d o w s h s 服务器和p h p 5l 4 2 系统实现51 4 2 1 基于l d a p 的邮件头信息提取入库功能的实现5 1 4 2 2 生成邮件头信息向量模块的实现5 3 4 2 3 基于信息熵的可伸缩决策树算法的邮件头信息分析机制的实现5 3 一 丐 一 东北大学硕士学位论文目录 4 2 4 基于变精度粗糙集决策树算法的邮件头信息分析机制的实现5 5 4 2 5 基于适应类别增量决策树算法的邮件头信息分析机制的实现5 7 4 2 6 基于快速b p 神经网络算法的邮件头信息分析机制的实现5 9 第五章性能评价6 1 5 1 样本来源6 l 5 2 性能评价6 l 5 2 1 性能指标6 1 5 2 2 基于l d a p 的邮件头信息入库性能评价6 2 5 2 3 基于信息熵的可伸缩决策树算法的邮件头信息分析机制性能评价6 4 5 2 4 基于变精度粗糙集决策树算法的邮件头信息分析机制性能评价6 5 5 2 5 基于适应类别增量决策树算法的邮件头信息分析机制性能评价6 7 5 2 6 基于快速b p 神经网络算法的邮件头信息分析机制性能评价6 9 5 2 7 四种机制性能比较7 0 第六章结束语7 5 参考文献一- 。7 7 致谢8 1 攻读硕士期间发表的论文一8 3 一v 一 东北大学硕士学位论文 目录 东北大学硕士学位论文第一章绪论 第一章绪论 1 1 电子邮件 1 1 1 电子邮件发展历史 电子邮件( e m a i l 或e m a i l ) ,是互联网上最受欢迎的功能之一。由于电子邮件的使用 简易、投递迅速、收费低廉、易于保存、全球畅通无阻,使得电子邮件被广泛地应用。 在7 0 年代,当时已经有一种可传输文件的电脑程序以及一种原始的信息程序。但 两个程序存在极大的使用局限例如:使用信息程序的人只能给接收方发送公报,接 收方的电脑还必须与发送方一致。 电子邮件的发明人雷汤姆林森( r a yt o m l i n s o n ) 是马萨诸塞州剑桥的博尔特贝拉尼 克纽曼研究公司( b b n ) 公司的重要工程师。当时,这家企业受聘于美国军方,参与 a r p a n e t 网络( 互联网的前身) 的建设和维护工作。1 9 7 1 年,汤姆林森对已有的传输文 件程序以及信息程序进行研究,研制出一套新程序,它可通过电脑网络发送和接收信息。 为了让人们都拥有易识别的电子邮箱地址,汤姆林森决定采用 符号,符号前面加用户 名,后面加上用户邮箱所在的地址。电子邮件由此诞生。第二年,同一公司的l a r r y r o b e r t s 写了第一个基于a r p a n e t 的e m a i l 管理程序,它能够列表、选择、转发和回复邮件。 。虽然电子邮件是在7 0 年代发明的,它却是在8 0 年代才得以兴起。7 0 年代的沉寂主 要是由于当时使用a r p a n e t 网络的人太少,网络的速度也仅为目前5 6 k b p s 标准速度 的二十分之一。受网络速度的限制,那时的用户只能发送些简短的信息,根本别想象现 在那样发送大量照片。8 0 年代中期,个人电脑兴起,在1 9 8 8 年史蒂夫道纳尔编写了第 一个有图形界面的电子邮件管理程序e u r o d a ,使电子邮件成为主流。 然而e u r o d a 的地位并没维持太长时间。到9 0 年代中期,互联网浏览器诞生,随着 互联网的兴起,全球网民人数激增,电子邮件被广为使用。n e t s c a p e 和微软相续推出了 它们的浏览器和相关程序。微软和它开发的o u t l o o k 使e u r o d a 逐渐走向衰落。1 9 9 6 年 一些新的公司开始提供免费的可以随地使用的i n t e m e te m a i l 。到了1 9 9 7 年,世界上大 约一千万用户拥有免费电子邮件账户。 到了今天,电子邮件已经演变成为一个更加复杂并丰富得多的系统,可以传送声音、 图片、图像、文档等多媒体信息,以至于如数据库或者账目报告等更加专业化的文件都 可以电子邮件附件的形式在网上分发。用户可以通过电子邮件的讨论会进行项目管理, 并且有时要根据快速,或洲际的电子邮件信息交换进行重要的决策行动。可见电子邮件 已成为许多商家和组织机构经验管理中必不可少的工具。 东北大学硕士学位论文 1 1 2 电子邮件格式 1f r o m :u s e r l d o m a i n l c o m l ;stubo:juser:2domain2comecte x p l a i n a t i o no fm a i lf o r m a t 邮件头部分 3s u b i: l i 4d a t e :t h u ,1a p r l 9 9 9 ,1 0 :0 0 :0 0g m t j 6h i ,j a c k 7t h i sm a i li st oe x p l a i ny o ut h em a i lf o r m a t 8 9t h a n k s 1 0b o b 信体 其中1 4 行为邮件头部分( m a i l h e a d ) ;6 1 0 行描述邮件要表达的内 ( m a i l b o d y ) ;第5 行是空行,这是在r f c 8 2 2 协议中定义的用来区分邮件头和信体。 r f c 8 2 2 协议定义了基本的邮件头的格式和结构,而m i m e ( m u l t i p u r p o s ei n t e m e t m a i le x t e n s i o n s ) 雾;用途因特网邮件扩展协议则对r f c 8 2 2 中定义的邮件头字段进行了扩 充。 1 1 3 邮件头的格式和结构 电子邮件由一个基本的信封( 在r f c 8 2 1 中定义) 、一些头字段、一个空行和消息 主体组成。每个头字段由一行a s c i i 文本组成,包括字段名、冒号以及字段值。r f c 8 2 2 为信头定义了2 0 多个标准的字段,包括d a t a 、f r o m 、t o 、c o 等一些必须字段和一些可 选字段,另外,在信件的传输过程中,头上还会被加入一些路径信息,它们合在一起构 成了收到邮件的邮件头部分,下面是一个完整的邮件头: r e c e i v e d :( e y o us e n dp r o g r a m ) ;t u e ,0 9a p r2 0 0 211 :0 2 :0 3 + 0 8 0 0 r e c e i v e d :f r o m u n k n o w n ( h e l od n s c c e r t e d u c n ) ( u n k n o w n 2 0 2 1 12 ,5 7 ,6 ) b y 1 6 6 1 1 1 8 1 6w i t hs m t p ;t u e ,0 9a p r2 0 0 21 1 :0 2 :0 3 + 0 8 0 0 r e c e i v e d :f o r mk y l i n t p ( 2 0 2 1 1 2 5 0 2 3 】) b yd n s c c e r t e d u c n ( 8 1 0 2 + s u n 8 1 0 2 ) w i t h e s t m pi d 9 3 9 3 e p 0 0 4 5 6 2f o r ;t u e ,0 9i p r 2 0 0 211 :1 4 :2 6 + 0 8 0 0 ( c s t ) r e p l y - t o :c a o q l d n s c c e r t e d u e n f r o m :c a o q l d n s c c e r t e d u c n t o :c a o q l 0 0 m a i l s t s i n g h u a e d u c n s u b j e c t := ? g b 2 31 2 7 b ? 0 8 q 8 r x e v e g 5 u q = = ? = 一2 一 东北大学硕士学位论文第一章绪论 d a t e :t u e , 0 9a p r2 0 0 211 :1 4 :2 6 + 0 8 0 0 o r g a n i z a t i o n :c c e r t m e s s a g e - - i d : m i m e v e r s i o n :1 0 c o n t e n t t y p e :t e x t p l a i n ;c h a r s e t = g b 2 312 c o n t e n t - t r a n s f e r - e n c o d i n g :b a s e 6 4 x p r i o r i t y :3 ( n o r m a l ) x - - m s m a i l p r i o r i t y :n o r m a l x - - m m l e r :m i c r o s o f to u t l o o k ,b u i l d1 0 0 2 6 1 6 i m p o r t a n c e :n o r m a l x - m i m e o l e :p r o d u c eb ym i c r o s o f tm i m e o l ev 6 0 0 2 6 0 0 0 0 0 0 下面列出了与邮件传输有关的r f c 8 2 2 主要字段: “d a t a : 字段表示邮件发送的日期和时间。 “t o :”字段给出第一收件人的d n s 地址。允许包含多个收件人。 “c c :”字段给出了其他的收件人的地址。在邮件术语中,第一收件人和第二收件 人没有区别。 “b c c : ( 隐含抄送) 字段,该字段与c c 字段类似,只是这一行被从所有发送给第 一收件人和第二收件人的拷贝中删除。这个特征允许人们在第一收件人和第二收件人不 知道的情况下把拷贝发给第三者( 相当于抄送) 。 “f r o m : 字段指出写信人邮箱地址,可以包括多个地址。该字段中不应包括不属 于发件人的地址。 “s e n d e r :字段指出发送邮件的人,这个字段的取值可能与“f r o m :字段不同。 例如,一个公司经理写了封邮件,但是他的秘书是实际的发信者,在这种情况下,必需 包含“f r o m :字段;但是如果“s e n d e r :”字段与“f r o m :”字段一样的话则前者可省略。 如果“f r o m : 字段包括多个邮箱地址,则“s e n d e r : 字段中必须指定唯一的一个地址。 “r e p l y - t o :字段给出回复邮件的邮箱地址,可以包含多个邮箱地址。如果没有 “r e p l y - t o : 则回复的地址默认为“f r o m :”中的地址。 “r e c e i v e d :字段。在邮件的传输途中每个邮件转发代理都添加一行包含的信息, 即“r e c e i v e d :字段。这一行包含代理的名称、邮件收到的日期和时间,以及其他一些 用来在路由选择系统中查错的信息。 “r e c e i v e d p a t h :”字段由最后一个邮件传输代理添加,用来说明如何回到发信人。 理论上,该信息能从所有的“r e c e i v e d : 头部获取( 除了发件人的信箱名之外) ,但实 际上很少这样填写,通常只包含发件人的地址。 “m e s s a g e i d : 字段给出的是邮件的唯一标识号。由产生消息的主机来确定,是机 一3 一 东北大学硕士学位论文 第一章绪论 器可识别的。 r f c 8 2 2 文档还规定,用户可以为自己的私人用途设计新的头部,不过这些头部必 须以字符串x 打头。 在早期的a r p a n e t 时代,电于邮件只包含用英文书写用的以a s c h 码表示的文本 信息。在这种环境中,完全由r f c 8 2 2 承担工作,它只说明头部而把具体的内容留给用 户。现在,在全球的因特网上,这种方法就不能满足要求了。问题包括发送和接收两方 面: ( 1 ) 有重音的语言书写的消息( 例如法语和德语) 。 ( 2 ) 非拉丁字母的消息( 例如希伯莱语和俄语) 。 ( 3 ) 非字母语言的消息( 例如中文和日文) 。 ( 4 ) 完全不包括文本的消息( 例如声音和图像) 。 为此r f c1 3 4 1 提出了一个解决方案多用途因特网邮件扩展m i m e ,最新的修改文 档是r f c 2 0 4 5 心c 2 0 4 9 ,现在该方案己被广泛使用。 m i m e 定义了5 种新的邮件头字段,如表1 1 所示。 表1 1m i m e 定义的邮件头字段 1 a b l e1 】m a i l - h e a df i e l d sd e f i n e di nm i m e 头字段含义 m i m e v e r s i o n : c o n t e n t d e s c r i p t i o n : 7 c o n t e n t i d : c o n t e n t t r a n s f e r - e n c o d i n g : c o n t e n t - t y p e : 标识m i m e 版本 人能阅读的串,说明邮件中的内容 唯一的标识 说明传送时如何包装邮件主体 说明邮件的类型 “m i m e 。v e r s i o n :”字段简单地告诉接收邮件的用户代理它在处理一条m i m e 邮件, 用的是m i m e 的哪个版本。不包括“m i m e v e r s i o n : 字段的邮件被认为是英语明文邮 件,按普通方式处理。 “c o n t e n t d e s c r i p t i o n : 字段是一个a s c h 字符串,它说明邮件的内容。该头部是 必要的,有了它接收者才知道是否值得解码并阅读该邮件。 “c o n t e n t i d :字段和“m e s s a g e i d : 字段类似,它的值也是唯一。 “c o n t e n t t r a n s f e r - e n c o d i n g : 字段指定邮件的编码类型。 “c o n t e n t t y p e :”字段说明邮件的类型,预定值包括以下几种:t e x t 、m u l t i p a r t 、 m e s s a g e 、a p p l i c a t i o n 、i m a g e 、a u d i o 和v i d e o 。每种类型都有一种或几种子类型。类型和 子类型以斜杠分开,例如:c o n t e m t y p e :t e x t p l a i n 。 子类型必须在头部明确给出,不提供缺省值。 一4 一 东北大学硕士学位论文 第一章绪论 表1 2m i m e 类型和子类型 t a b l e1 2m i m et y p ea n ds u b - t y p e 1 1 4 电子邮件传输过程 。 电子邮件与普通邮件有类似的地方,发信者注明收件人的姓名与地址,发送方服务 器把邮件传到接收方服务器,接收方服务器再把邮件发到收件人邮箱中。如图1 1 所示: 、l j l 一、 图1 1 邮件传输的过程 f i g 1 1e m a i lt r a n s m i s s i o np r o c e s s 整个邮件传输过程如图1 2 所示。其中m u a - - m a i lu s e r a g e n t ,邮件用户代理,帮 助用户读写邮件;m t a - - m a i lt r a n s p o r ta g e n t ,邮件传输代理,负责把邮件由一个服务 器传到另一个服务器或邮件投递代理;m d a - - m a i ld e l i v e r ya g e n t ,邮件投递代理,把 邮件放到用户的邮箱里。 策 s 耵p 紧 发件方 l 皿a 图1 2 邮件传输中的代理 f i g 1 2e m a i lt r a n s m i s s i o na g e n t 目前使用的s m t p 协议是存储转发协议,它允许邮件通过一系列的服务器发送到最 - - 5 _ _ 。 东北大学硕士学位论文 一 一一二i 一 _ - _ _ - _ _ - _ _ - - _ _ _ _ _ - _ _ _ _ _ 。_ _ - _ - 。- 。一一一 一一一。 终目的地。服务器在一个队列中存储到达的邮件,等待发送到下一个目的地。下一个目 的地可以是本地用户,或者是另一个邮件服务器,如图1 3 所示。如果下游的服务器暂 时不可用,m t a 就暂时在队列中保存信件,并在以后尝试发送。 ,由由崮 图1 3 邮件的存储转发 f i g 1 3s t o r ea n d t r a n s m i to f e m a i l 1 1 5p o p 与i m t p 当具备了两个s m t p 服务器,就可以实现异地的邮件通信。实际中为了方便,通常 用到p o p ( p o s to f f i c ep r o t o c 0 1 ) 和i m a p ( i n t e m e tm e s s a g e a c c e s sp r o t o e 0 1 ) 服务器,以及供 用户编辑和阅读邮件的应用程序,如o u t l o o k 、f o x m a i l 等。 p o p 服务器主要是为了解决用户的终端不能总连接在网上等问题。为了随时接收可 能发来的邮件和传出邮件,s m t p 服务器必须时刻处于工作状态。个人终端,如便携机 或者拨号上网,可能无法满足此要求。而且也没有必要为每个用户的终端都安装一个复 杂的s m t p 服务器。另一方面,随着网络的发展,许多用户不愿意学习使用复杂的服务 器来从服务器端壹接读取邮件。他们希望能够把信件下载到本地,使用简单方便的应用 程序编辑和阅读。p o p 就是为了解决这些问题而设计的。m t a 把邮件投递给p o p 服务 器,暂时存放所有收到的邮件,等待用户来取。用户取信时使用p o p 客户端,把信件 下载到本地机器上。简单地讲,s m t p 服务器好比一个完整的邮政系统中的各个邮局, 负责传送信件:p o p 服务器仿佛一个收发室,负责暂时保管信件和发送信件。 最新的p o p 协议是在r f c l 9 3 9 ( p o s to f f i c ep r o t o c o l v e r s i o n3 ) 中加以详细定义的 比较完整的p o p 接口模型如图1 4 所示: 图1 4 p o p 接1 2 模型 f i g 1 4p o p c o n n e c t i o nm o d e l i m a pl - t ;p o p 提供了更多的功能,也更复杂一些。p o p 3 缺乏严格的邮件处理 通常邮件被从服务器下载到客户端后,邮件就会从服务器上删除。这有利于节省 硬盘空间,但对于可能使用多个终端的用户却不方便。例如用户在家、办公室和 一6 一 东北大学硕士学位论文第一章绪论 可能需要使用不同的终端,它需要从不同的客户端上看到相同的内容,但使用p o p 邮 箱就会被分割成3 个不同的部分。i m a p 通过维护服务器上的邮箱并允许客户端的计算 机对服务器上的邮件进行操作,允许使用者从多个地点访问邮箱而不会出现邮件被分割 的情况。i m a p 的接口模型如图1 5 所示: i m
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 脑干出血术后护理查房
- 山西省晋源区第七小学2025年三年级数学第二学期期末经典模拟试题含解析
- 四川音乐学院《设计素描(1)》2023-2024学年第二学期期末试卷
- 中央司法警官学院《文化哲学》2023-2024学年第二学期期末试卷
- 襄樊市南漳县2025届数学五下期末教学质量检测试题含答案
- 辽宁理工学院《化工应用软件实践》2023-2024学年第二学期期末试卷
- 浙江理工大学《商务英语写作(二)》2023-2024学年第二学期期末试卷
- 重庆护理职业学院《数据结构》2023-2024学年第二学期期末试卷
- 延安大学《数据分析与数据挖掘》2023-2024学年第二学期期末试卷
- 娄底职业技术学院《导演学》2023-2024学年第二学期期末试卷
- 2024年瓦斯检查工国家考试题库
- 2024 年江苏公务员行测(C 类)真题及答案
- 2024年河南机电职业学院高职单招职业技能测验历年参考题库(频考版)含答案解析
- 《企业安全生产培训课件:个人防护装备及使用》
- 新人教版八年级下册初中生物第七单元检测试卷
- 2025年辽宁省丹东市公安局招聘辅警22人历年高频重点提升(共500题)附带答案详解
- 2025年山东海运股份有限公司招聘笔试参考题库含答案解析
- 2025年社会治安综合治理工作计划范文
- 《四川省声环境质量自动监测系统质量保 证及质量控制技术规范》 编制说明
- 商场分级管理制度内容
- 《货币的前世今生》课件
评论
0/150
提交评论