官方网站建设合作协议/找相似图片 识别
1. 性别冷启动
性别冷启动包括v1,v2两个版本:
v1版本提供给lx和wx(全量更新计算方式),分别以特征文件的方式提供给业务方,统计截取后的全量的applist和mobile;
v2版本提供给zx(日活增量更新数据),统计top-N的applist和mobile(建议全量特征参与训练,然后取权重绝对值最大的top-N特征),两版本均采用lr模型。
1.1 数据
特征来自于画像宽表,label来自于用户事实表。
使用特征:applist, 手机品牌+手机型号
applist 为空或者为'com.snda.wifilocating' (只获取到wifi的一个app)设为默认值:未知。
mobile=brand+model:从设备信息表中获取。
训练数据: 615w,验证数据:100w
20200520统计结果如下:
匹配量 | 总量 | 正确率 | |
探测性别 | 12.13w | 22.19w | 54.65% |
用户选择 | 0.65w | 1.16w | 56.49w |
特征说明:
1)安装app列表
- 安装ap