当前位置: 首页 > news >正文

做网站都需要买什么问题/网络推广的平台

做网站都需要买什么问题,网络推广的平台,接网站开发做多少钱,热可可怎么做视频网站单规则算法体系算法体系由多个规则构成,规则之间相互独立,产出结果由规则独立判定。这种算法体系的好处与应用范围:算法体系结构简单;方便算法改良,比如上新的算法,下线旧算法;可理解性强&#…

单规则算法体系

算法体系由多个规则构成,规则之间相互独立,产出结果由规则独立判定。

这种算法体系的好处与应用范围:算法体系结构简单;方便算法改良,比如上新的算法,下线旧算法;可理解性强,所以可控性强。比如,在电商环境里,识别炒信刷单的商品或店铺就适合这样的体系。

数据说明

数据来源于某大型电商平台上的虚假交易用户的识别算法多年前的产出数据(数据已经脱敏)。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import json
from pandas.io.json import json_normalize
from collections import Counter
import pyecharts as pe
from pyecharts import options as opts

导入数据:

r1 = pd.read_csv(r't1t1',names=['name','rule','date'],sep='t',parse_dates=[2])
r1.head()

4fb5e88662ee6f5d11725b3128dec7d3.png

算法体系优化思路
目的找出问题规则进行调优。虚假交易用户由于不涉及到对用户的惩罚与反馈,无法通过电话反馈率来衡量算法效率,因此一直找不到好的方法来衡量算法的效率,规则多数都是基于业务线员工经验来定的。

单规则认定率¶
单规则认定率。一般认为一个真实的虚假交易用户通常在多方面有会具备可疑特征,因此越是被多的规则认定,那么这个用户应该越可能是真实的虚假交易用户,反过来,如果一个规则产出的用户多是由它一条规则认定,那么这个规则很可能就不够好。也就是说如果此规则的单独认定率越高则越有问题。

def c1(x): # 删除列表最后的空值x.pop() return x
z2 = r1.rule.str.split(',').apply(c1)
r1.rule = z2
r1.head()
t1 = Counter(r1.rule.apply(len).values)
keys =[]
for i in t1.keys():keys.append('rule'+str(i))
p0 = [i for i in zip(keys,list(t1.values()))]def pie_base(data): #绘制饼状图c = (pe.charts.Pie().add("", data).set_global_opts(title_opts=opts.TitleOpts()).set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c}")))return c.render_notebook()pie_base(p0)

1721ed9207ce02d7b1bf34f4a20969af.png

超过50%用户都是单规则认定。

统计各条规则认定数量

ru = {} # 所有规则认定数量
rud = {} # 单规则认定数量
for i in r1.rule.values:for j in i:ru[j] = ru.get(j,0)+1if len(i)==1:rud[j]=rud.get(j,0)+1rule1=[]
num1=[]
num2=[]
d1 ={}
for i in range(1,14):i = str(i)rule1.append('规则'+i)num1.append((ru[i]-rud[i])) # 多条规则认定的用户数量num2.append(rud[i])  # 单条规则认定的用户数量d1.update({i:round(rud[i]/ru[i],2)}) # 单规则认定率def bar_different_series():  # 画图c = (pe.charts.Bar().add_xaxis(rule1).add_yaxis("多规则认定量", num1, gap="5%").add_yaxis("单规则认定量", num2, gap="5%").set_global_opts(title_opts=opts.TitleOpts(),))return c.render_notebook()bar_different_series()

1e291cbae66d36be602c3c35efbf94d2.png

6417cf135205a0e8b42c4333dcd8b421.png

10号规则认定数量最高,单规则认定率也最高,6号规则单规则认定率次高。

1号规则 和 3号规则 认定数量不低,单规则认定率低。

7号规则 和13号规则规则产出数最低。

规则产出的时序分析

dd={}
for i,j in r1.groupby('date'):z={}z1={}for k in j.rule.values:for m in k:z[m]=z.get(m,0)+1if len(k)==1:z1[m]=z1.get(m,0)+1dd.update({i:[z,z1]})dd1 ={}
rname = d1.keys()
for i in rname:dd1.update({i:[[],[]]})
c=0
for i ,j in dd.items():for i1 in rname:try:dd1[i1][0].append(j[0][i1])except:dd1[i1][0].append(0)try:dd1[i1][1].append(j[1][i1])except:dd1[i1][1].append(0)line = pe.charts.Line()
line.add_xaxis(date1)
for i in rname:line.add_yaxis(i, dd1[i][0], is_connect_nones=True)
for i in rname:line.add_yaxis(i+'dan', dd1[i][1], is_connect_nones=True)  
line.set_global_opts(title_opts=opts.TitleOpts(),)
line.set_series_opts(label_opts=opts.LabelOpts(is_show=False))
line.render_notebook()

a026e968b158385bcd1e3fa0bfa558ba.png

对比优质规则1,2与最差规则10,规则10单规则认定数波动大

6号规则平时效果不好,但是某些时候好

某些规则随时间突然增长可能是规则调节的结果,作弊人数增多也是不能排除的因素

关联规则分析

from pymining import itemmining, assocrules, perftesting,seqminingdef c1(x):   # 对 rule 列进行处理x.pop()return x
z2 = r1.rule.str.split(',').apply(c1)len(z2.values)
#1646975relim_input = itemmining.get_relim_input(z2.values)
report = itemmining.relim(relim_input, min_support=2) # 统计出频繁项集
rules = assocrules.mine_assoc_rules(report, min_support=3000, min_confidence=0.5) # 频繁项集对应的规则

针对单规则集合进行分析:

ru = rules[-13:]
#由于单规则关联都在最后因此可以直接切片#输出:
[(frozenset({'7'}), frozenset({'2'}), 8067, 0.6952512281306559),(frozenset({'7'}), frozenset({'10'}), 9715, 0.8372834611738343),(frozenset({'8'}), frozenset({'11'}), 63460, 0.6536338167435728),(frozenset({'12'}), frozenset({'2'}), 73038, 0.5008503168115862),(frozenset({'12'}), frozenset({'10'}), 82421, 0.5651932413528267),(frozenset({'1'}), frozenset({'6'}), 81605, 0.5175026951613926),(frozenset({'1'}), frozenset({'2'}), 117318, 0.7439786923711079),(frozenset({'1'}), frozenset({'11'}), 94456, 0.5989980341175725),(frozenset({'1'}), frozenset({'10'}), 83064, 0.5267550256833027),(frozenset({'4'}), frozenset({'10'}), 103074, 0.6079806529625151),(frozenset({'9'}), frozenset({'11'}), 143924, 0.607092390043489),(frozenset({'3'}), frozenset({'10'}), 213916, 0.7634458490067738),(frozenset({'2'}), frozenset({'10'}), 203395, 0.5446349196148367)]

作网络图:

nodes = []
n=0
for i in ru.items():nodes.append({"name":i[0],"symbolSize":ru[i[0]]/20000,"category":n})n=n+1links = []
for i in rules[-13:]:links.append({'source':list(i[1])[0],'target':list(i[0])[0]})def graph():c = (pe.charts.Graph().add("",nodes,links,repulsion=1000,).set_global_opts(legend_opts=opts.LegendOpts(is_show=False),title_opts=opts.TitleOpts(title=""),).set_series_opts(label_opts=opts.LabelOpts(is_show=True)))return c.render_notebook()graph()

ac0e7e922eb6f9a598cde8817bcfb9f1.png

10,11,6号规则认定量大,只能印证其他规则,本身得不到任何规则的印证

13号规则孤立,并且不和任何规则发生关系

9号规则能被11号印证

5号孤立

1号优质规则被多条规则印证

2号规则本身质量可以,又能印证其他规则

http://www.jmfq.cn/news/5135923.html

相关文章:

  • 医院做网站运维/正规接单赚佣金的app
  • 免费做网站靠谱么/地推网推平台
  • 教师个人网站建设/南京seo公司
  • xyz域名做网站好么/seo综合查询怎么进入网站
  • 新疆维吾尔自治区建设厅官方网站/百度实名认证
  • 怎么通过域名做网站/外贸推广建站
  • 做微网站多少钱/学生个人网页制作成品
  • 临汾做网站公司/网络营销策略的制定
  • 企业自建网站有哪些/百度指数查询移动版
  • 怎么把自己做的网站挂到外网上/长春网站建设公司哪家好
  • 合肥置地广场做网站的公司/网店培训机构
  • 哪里有做旅游包车的网站/百度怎么联系客服
  • 教做炸鸡汉堡视频网站/谷歌推广代理公司
  • .com网站制作/手游推广渠道
  • 网站开发人员定罪/2345浏览器网页版
  • 网站开始是怎么做的/网络营销策划书结构
  • 奢侈品网站设计/网络营销策略包括哪些
  • 房屋设计用什么软件/优化流程
  • 电商网站储值消费系统/搭建自己的网站
  • 织梦网站如何做软件下载/顾问式营销
  • 济南定机票网站建设/百度手机导航官方新版
  • 找人做网站靠谱吗/青岛seo网站管理
  • 南平 网站建设/云浮新增确诊病例30例
  • 重庆营销型网站随做的好/南昌seo网站管理
  • 网站制作专业/近三天重大新闻摘抄
  • 独立网站怎么做seo/优化网站视频
  • 网站怎么做排名靠前/苏州seo
  • 网站建设基本内容/百度人工电话
  • 大连手机网站设计/软文广告经典案例300字
  • 去哪找网站建设公司/搭建一个网站需要多少钱