基于时间和地域构建一个申博备用网站网络诈骗

时间:2017-06-09 14:39 点击:87
基于时间和地域构建一个网络诈骗形势模型

*本文原创作者:西角边的MR,本文属FreeBuf原创奖励计划,未经允许制止转载

电信诈骗,网络诈骗层出不穷,花样翻新,是当前公安部重点打击的对象。本文从网络中爬取相干的讯休,议定对时域和数目的统计与分析,实现对网络诈骗模型中时间参量的优化,进而达到挑高对于网络诈骗的识别成果的目标。

一、数据的准备

对于网络电信诈骗的发生率,作者要议定讯休中对其挑及的次数和对答日期进走统计,以此来外示当前社会对电信网络诈骗的关注炎度。肇端作者确定统计的参量——时间和地域。对于时间参量,作者以月为分度值,对于地域参量,作者以省为分度值申博备用网站。作者操纵正则外达式并计算匹配的次数来对文本进走统计,正则外达式的组成是由设置的时间列外和地域列外单独和两两组相符组成申博备用网站。

如何从讯休中识别骗子的幼套路

如何构建一个逆电信网络诈骗基础模型

下面是统计最后和局部代码:

统计的总内容:

二、数据分析及模型构建

作者对获取的数据进走了归纳,并以月份为单位计算同比添长率,环比添长率,以此来分析网络电信诈骗的特性,从而议定对添长率的分析来构建一个关于时间序列和添长水平的模型申博备用网站。

这是实现添长率统计的局部代码和最后:

为了可以或许更加正确的确定电信网络诈骗差别月份之间的相互联系,作者决定对环比添长率进走聚类分析,对时间序列进走回归分析。

肇端作者对添长率进走了聚类分析,将其分为五类,对答四级预警模式,由矮到高分别为平常、蓝色预警、黄色预警、橙色预警和红色预警。原由在网络诈骗案件中,当前月份和前一月份之间存在必定的联系,因而作者操纵无监督聚类的Kmeans算法,保留数据之间的相干性。具体实现手段是将添长率为负的月份确定为平常类别,将添长率大于0的月份分为矮速添长,中速添长和高速添长,并进走聚类,下图是实当代码:

对于时间序列的模型构建,肇端作者对差别月份添长之间的相互影响进走了分析

议定分析作者发现当正添长率大于1的时候,在下一个月去去会出现负添长情况,当负添长率绝对值大于0.5时,在下一个月去去会出现正添长。因此,作者对比操纵了平凡最幼二乘法(OLS)模型和加权最幼二乘法模型(WLS)模型。在WLS模型中,经过继续测试,确定束缚条件为当正添长率大于1和负添长率绝对值大0.5时将 其权值缩幼为原本的100倍,对于其他情况则以当月添长率为权值,下图为测试最后:

下面是实当代码:

经确定,WLS模型更接近统计平均值,展望值为0.21旁边。

三、数据可视化

图外数据不克直不美观的逆映出电信诈骗的地域分布特点,为了确定电信诈骗的分布地域情况,作者操纵了excel中的power map和tableau进走可视化统计。Power map和tableau的操纵手段可以参照它们的说明。下面是作者的可视化模型:

差别颜色深度代外了网络电信诈骗差别的关注水平。

接下来作者对预警模型进走可视化处理:

四、结论

议定模型逆映的趋势,吾们发现:

1、从时间模型来望吾国当前网络诈骗短期内将显现矮速添长的态势。

2、从地域角度分析南部沿海省份和京津冀是网络诈骗案件的主要受灾区域。

3、从地域角度分析网络电信诈骗高发区域渐渐由南部沿海省份向中部和北部沿海省份,由东部沿海省份向内陆迁移的趋势。

五、总结

作者议定构建时间序列的回归模型和地域模型,在必定水平上确定了时间和地域对网络诈骗的影响,目标是优化计算诈骗概率时的时间参量,同时增众地域参量,挑高逆诈骗模型对于信休判断的正确性。在构建时间模型的时候,着首要注意的是差别时间之间的相互影响,改变差别添长率月份对于回归模型的影响权值,议定参数调节来得到一个较为相符理的值。在地域分析的时候,重视操纵差别的可视化工具对数据进走展示,以便于直不美观的发现数据的转折趋势。


当前网址:http://www.908vns.com/shenbobeiyongwangzhan/16570.html
tag:彩尊线上娱乐是黑彩吗,suncity288,申博备用网站,娱

发表评论 (87人查看0条评论)
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
昵称: 验证码:点击我更换图片
最新评论

Powered by 彩尊线上娱乐是黑彩吗 @2014 RSS地图 html地图

Copyright 站群系统 © 2013-2018 365建站器 版权所有