做一名优秀网站设计师计划/seo搜索引擎优化技术教程
1.项目介绍
随着社交网络和电商平台的快速发展,用户数据的海量累积,数据分析师需要从中挖掘数据价值,进而创造商业价值。本项目的目的是通过分析法国某C2C时尚电商平台的用户数据,挖掘用户流失行为背后原因,希望能为C2C导向的电商平台带来些许提示。
项目数据来源自kaggle(数据地址 提取码:cobp)。本项目以Mysql为主要分析工具。
2.局限性
项目中所使用的数据集仅涉及完整用户数据的一部分,不涵盖近期的用户数据,最近期的用户注册日期距离数据收集日期也有7.92年之久。因此,数据本身的‘古老性’在一定程度上局限了分析的深度。
3.数据概观
指标介绍
identifierHash | 脱敏id | type | 唯一值user |
country | 国家 | language | 语言 |
socialNbFollowers | 粉丝数量 | socialNbFollows | 关注用户数量 |
socialProductsLiked | 喜欢商品数 | productsListed | 上架商品数 |
productsSold | 售出商品数 | productsPassRate | 满足商品描述的通过率 |
productsWished | 希望购买数 | productsBought | 已购商品数 |
gender | 性别 | civilityGenderId | 男1,女2 |
civilityTitle | 称谓(mrs,mr...) | hasAnyApp | 是否有任一App |
hasAndroidApp | 是否有安卓App | hasIosApp | 是否有IOS App |
hasProfilePicture | 是否有账户头像 | daysSinceLastLogin | 距离上次登录天数 |
seniority | 注册天数 | seniorityAsMonths | 注册月数 |
seniorityAsYears | 注册年数 | countryCode | 国家编号 |
整体概述
数据集共98,913名注册用户,包括2,719名卖家("productsListed"或"productsSold"字段不为0则被定义为卖家)和20,650名买家("socialProductLiked" ,"productWished","productBought" 任一字段不为0被定义为买家),其中有7,710人具有买家和卖家的双重身份。
通过“days since last login”字段可知该数据集中距离上次登录时间间隔最短的用户也间隔了11天之久。因此将14天内登录过的用户定义为活跃用户(Active users)。另外,离开14天至30天的用户相对而言更易回归(Easy-return users),31-90天未登录的用户的回归可能性较低(Hard-return users),而未登录天数超过90天的用户可以视为不可逆转的流失用户(Churn users)。基于以上定义,该数据集中仅有1.90%的用户能被定义为活跃用户,绝大多数的用户已经流失或者接近流失。
从商品维度来看,该平台共覆盖商品21,956件。其中正上架产品9,929件,已售出产品12,027件。
从用户维度观察,该平台拥有来自200个不同国家的用户,其中女性用户占76.96%,男性用户占23.04%。英语和法语是使用最广泛的语言。平均每个用户拥有3.43名粉丝和8.43个关注用户。此外,据统计结果显示,很大一部分用户并未使用过官方app。
卖家角度
在2,719名卖家之中,有74.88%的卖家有成功卖出商品的经历,有23.17%的卖家在还有上架商品的情况下超过90天未登录。整体上来看,平均有29.55%商品是符合商品描述的,平均售出率(Products sold / (Products listed + Products sold) * 100% )为57.19%。从社交的角度,平均每个卖家拥有10.19名粉丝,关注20.7个用户。
卖家角度
在20,650买家之中,有26.24%的买家在该平台上购买过商品。整体上来看,平均每个买家喜欢21.18件商品,加购7.48件商品,最终购买了0.82件商品。从社交的角度,平均每个买家拥有4.45名粉丝,关注10个用户。
为了分析用户流失的原因,本项目选择针对两组用户群体:“五零”用户和留存用户,进入深入挖掘。
4.“五零”用户分析
在探索数据的过程中,发现“五零”用户的数量达到了77,274。也就是说,大约78%的用户不拥有以下任何一类状态: 有商品上架、有商品已售出、喜欢商品、加购商品或已购买商品。这批“五零”用户的流失率高达98.07%,而“非五零”用户的流失率为74.62%。
通过对“五零”用户与“非五零”用户的比较分析,“五零”用户存在如此高流失率可能有以下三点原因:
社交功能体验较少
一个值得一提的发现是超过90%的“五零”用户拥有3个粉丝和8个关注用户。因此,我们有理由假设在用户注册账号的时候即拥有3个粉丝(可能是官方账号)且强制要求关注8个官方推荐用户。如果这个假设成立,那么任何粉丝量或关注量的增长都可以被视为社交网络的增长。大部分“五零”用户在社交网络的增长方面呈现停滞状态,平均粉丝量为3.11,平均关注量为8.0。非五零用户组的平均粉丝量为4.56,平均关注量为9.91。对比“五零”用户,均有大于1的增长量。尽管这个数据值较小,但能反映出主动社交与被动社交之间巨大的心理差异。这个心理差异对流失率的影响值得进一步深究。
官方App使用率低
使用官方app的“非五零”用户要远多于“五零”用户,无论安卓还是IOS系统都是如此。对于用户来说,移动应用是一种更即时、更简单、更灵活的浏览方式。下载了官方app的用户更容易进行操作,即更容易成为“非五零”用户。
“僵尸”用户
另一个有趣的发现是“五零”用户仅存在19个唯一 seniority值,且不具有连续性。这意味着这77,274个用户在在19个不连续的日期里注册,即数以千计的用户在同一天注册。例如,5,002个用户显示注册了3,199天。由于没有这家电商的具体信息作为参考,根据仅有的数据进行判断,数据集可能存在不完整的情况。值得警惕的是,数据的异常性可能反映了电商平台业务的不健康。平台可能存在大量虚假用户,也可能是由于引流渠道的质量不佳导致出现大量一次性用户。这些僵尸用户拉高了整体的流失率。
5.留存用户分析
前面提到项目所使用的数据集具有“古老性”,所有的用户的注册时间都在距离数据收集日的七年之前。考虑到这点特性,留存下来的1,875名活跃用户、1619名买家和665名卖家变得非常具有挖掘价值。他们为什么选择长时间留存在这个平台?他们有什么共同的特征?
社交互动活跃
留存卖家平均拥有16.6名粉丝,关注40.03个用户。留存买家平均拥有9.32名粉丝,22.02个关注账号。对比流失用户,在量上有一个明显的增长,特别是关注的用户账号数量提高了3~4倍。
留存卖家的商品通过率更高
留存卖家的平均商品通过率为49.65%,是流失卖家(12.95%)的四倍。如下图所示,一个拥有更高商品通过率的卖家有能卖出更多的商品的倾向。在通过率高于80%时,这个趋势更为明显。如果一个卖家能够在平台上成功出售商品,那么他大概率会留存在这个平台。
留存买家的转化率较低
平均一个留存买家喜欢130.32件商品,希望购买40.25件商品,最终购买4.10件商品。平均一个流失买家喜欢的商品件数为11.89,希望购买4.7件,最终购买0.54件。相比之下,流失买家的行为频次要低得多。但涉及到用户的时间维度不一致,所以并不能很合理的进行比较。进而选择观察其转化率,从喜欢商品,到希望购买,到最终购买这三个行为节点中,留存买家的节点转化率为30.88%和10.19%,而流失买家的节点转化率为39.53%和11.49%。流失买家的转化率高于留存买家的转化率,这个发现与常识相悖。一个可能的解释是使用C2C平台的用户对于所需要购买的商品更为明确,注册登录之后便直接寻找所需要的商品,完成交易或找不到所需商品之后便会直接离开该平台。他们目的性明确,不太容易在电商平台上闲逛。
6.业务优化建议
社交互动功能
对于一个C2C电商平台,不同于社交媒体平台,社交互动不是它的主要功能,其社交功能需要服务于最终交易。平台可以有意识培养一些有特色的个人时尚卖家,增添一些娱乐和分享的性质。例如,一个costom卖家可以分享一些节日装束、妆容。
鼓励用户使用官方App
使用官方App对于留存用户有正面作用。据统计数据显示,超过半数的用户没有使用过官方app。平台可以通过发放优惠券、提供便利服务等方式鼓励用户下载和使用其app。例如,用户可以在移动应用程序上跟踪商品的物流情况。
指导卖家撰写商品描述,提高商品通过率
由于C2C业务的性质,新卖家并没有销售经验。若是出售难度大,卖家较容易流失。由于商品描述与商品通过率有关,商品通过率与售出数量有正向关系。平台可以提供官方的指导视频、手册或者模板,指导新卖家撰写更符合标准的商品描述。
获取用户时间
对于目的性强的用户群体,平台需要尽可能获取他们的时间,让他们愿意花时间在平台上闲逛。可以在首页展示一些有特色、有趣的商品来达到吸引眼球的目的。