WinWebmail新版本3.8.0.1发布 业内首次将聚类分析算法反垃圾邮件

邮件邮箱   2019-12-14 12:35  

通过不断努力WinWebMail Server终于在行业内首次将聚类分析算法合成到邮件系统,并且真正地将其实际应用于垃圾邮件防治中。

WinWebMail Server系统所采用的聚类分析算法简单的说就是比较样本中各语句之间的性质,将性质相近的归为一类,而将性质差别较大的分在不同的类。通过对类的处理将有相似特性的数据集合到一起,进而可以用来对邮件内容进行分析和归类,以达到垃圾邮件识别的目的。

举一个实际操作的例子,以下是一封很常见的垃圾邮件内容:
您好!我公司有发票可以代开,价格优惠,验证后付款,欢迎来电洽谈。联系人:钟先生:158 2832 4051

相信大家都对此类邮件头痛不已,因为如果管理员将“发票”做为关键字进行处理,很快此类垃圾邮件的内容会变异为“fa piao”。如果用“钟先生”做关键字,不久也会变异为“李先生”、“王先生”之类。而电话号码更可以随意变化。

事实上,更让管理员头痛的是通常垃圾邮件会对邮件服务器实施欺骗,常见的方法包括:

您*好*!*我*公*司*有*发*票*可*以*代*开*,*价*格*优*惠*,*验*证*后*付*款*,*欢*迎*来*电*洽*谈*。*联*系*人*:*钟*先*生*:15*8* *2*8*3*2* *4*0*5*1

或在有效内容之前或之后加一段随机信息,比如:

KQNSOWY93DOV您好!我公司有发票可以代开,价格优惠,验证后付款,欢迎来电洽谈。联系人:钟先生:158 2832 4051

更复杂的则是远期内容的可能变异,比如:

大家好!我们公司有全国各地发票可以代开,价格实惠,可以验证后付款,欢迎洽谈。 王生:139,6454,5728

截止2009年,行业内对于此类垃圾邮件的处理,特别是对于最后的几种欺骗以及远期内容变异的识别基本上是非常困难,并且要面对巨大的误判风险。

而聚类分析算法则可以通过分析轻易找出关键类簇之间的频率和距离等信息,从而有效识别此类欺骗,特别是对于远期内容的变异可以做出预测模型,进而可以在WinWebMail Server系统内对此垃圾邮件及其变种全部免疫。

您或许对下面这些文章有兴趣:                     本月吐槽辛苦排行榜

部落快速搜索栏

各类专题梳理

网站导航栏

订阅本站

联系部落首领^_^

  有关于免费资源部
  落的问题、意见、
  建议、推荐免费资
  源、交换链接等,
  欢迎与我联系

  QQ:123456789

  Q群:123456789

  邮箱:123456@163.com

返回顶部