上期我们提到,263智能内容分析技术主要攻克的是那些外表没有丝毫破绽.让人难以根据信封与邮戳辨别真伪的垃圾邮件.那么,给邮件“打分”的依据就成为一个做出判断的重要基础.这个依据又从何而来呢?这就是本期要谈到的内容——样本库的收集.
出现不断更新与扩充的,也就是我们所说的‘自学习能力’.”263反垃圾攻防实验室负责人tony一脸严肃,“只有样本库是与时俱进的,才能适应不断演进的垃圾邮件,提高判断的准确率.” 【程序编程相关:智能SFP光模块数据诊断功能的应用】
“首先,你们要明白:样本库是一个动态的概念.它的内容是随着新垃圾邮件内容的 【推荐阅读:三款模块化光通信测试平台细考量】
听到我这个还算靠谱的问题,tony满意地接着解释道:“在样本库的采集上,263主要采取两种渠道来获取.第一种是通过用户端举报来进行的采集:用户在使用webmail(即:通过mail.263.net网站接收邮件)的时候,如果认为某封邮件是垃圾邮件,可以在网站上点击‘举报垃圾邮件’按钮,直接将其举报到垃圾邮件样本库.当然,能够主动这么做的用户为数并不多.因此,更多的还要依靠样本库的自学习能力,而这种学习是通过“探针邮件”实现的.” 【扩展信息:40Gb/s光模块的研究与开发】
“那么,这个样本库是如何实现自学习的呢?”
“探针邮件”就是我们在系统里面故意部署大量的陷阱,这些虚拟邮件地址的拼写非常短.都是容易被猜到的邮箱,比如liming@263.net之类的(当然我们也会有意公布一些).... 下一页