淘宝电商数据分析意义 淘宝限制买家行为是什么意思
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
淘宝是中国电商市场当之无愧的“王者”,其用户量规模之大达到了亿级。但是随着电商行业的迅速发展,该行业的红利期已经走到了尾声,单单靠着中国市场的庞大人口红利不是电商企业发展的第一策略。电商企业现在渐渐转入精细化运营的阶段,从注重增量转向注重存量。本文以淘宝用户一周的行为数据,探究淘宝用户的购物模式存在的问题。
本数据集(UserBehavior.csv)包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。数据集的组织形式和Mo【【微信】】类似,即数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔。本数据来来源于阿里云天池。
数据集中有以下字段:
名称 | 含义 |
---|---|
用户ID | 字符串类型,用户ID |
商品ID | 字符串类型,商品ID |
商品类目ID | 字符串类型,商品所属类目ID |
行为类型 | 字符串,枚举类型,包括【'pv'(点击), 'buy'(购买), 'cart(加入购物车)', 'fav'(收藏)】 |
时间戳 | 整型,行为发生的时间戳 |
数据集的大小情况为:用户数量有987,944条,商品数量为4,162,024条,商品类目数量为9,439条,所有行为数量为100,150,807。
由于数据量巨大,本报告只使用了10万条数据作为样本,得出的结论存在一定偏差。
本报告从两个角度进行分析。第一个角度是研究淘宝用户的转化率,发现转化率低这个问题,接着从用户购物流程和淘宝的推荐机制两个可能存在的问题根源进行分析。第二个角度是淘宝用户不同时间的行为模式,旨在探究用户活跃的高峰和低谷,同时比较一天内用户的活跃节点。
1.选择子集
本报告将使用所有数据条目进行分析,对时间戳进行分解,得到购物日期和购物时间。使用以下命令。
alter table ub add dates 【【微信】】(255);update ub
set dates=from_unixtime(timestamps,'%Y-%m-%d');
alter table ub add hours 【【微信】】(255);
update ub
set hours=from_unixtime(timestamps,'%h:%i:%s');
2.列表重命名
为了方便分析,用英文对列进行命名。
3.删除重复值
因为每个用户每一秒钟不可能重复出现两次行为,所以对每个用户同一时间内的行为计数检查是否存在重复值。
select userid, time, itemid【【微信】】r />【【微信】】 userid,time,itemid
ha【【微信】】(userid)>1;
结果显示不存在重复值。
4.缺失值
将每列数据设置成不是null,并且对每一列进行计数
【【微信】】(*), count(userid), count(itemid), count(categoryid), count(behavior),count(time)
【【微信】】r>
结果显示没有缺失值。
5. 异常值处理
检查所有行为是否都出现在2017年11月25日至2017年12月3日之间之间。
使用
select dates【【微信】】r />where dates > '2017-12-3' or dates < '2017-11-25';
得到了44条范围日期之外的数据,将这些数据删除,
delete dates【【微信】】r />where dates > '2017-12-3' or dates < '2017-11-25';
至此,数据清洗工作结束。
1.基础研究
首先对整体数据的概况做一个总结归纳,使用以下命令
【【微信】】(distinct userid) as 用户总数, count(distinct itemid) as 商品总数,count(distinct categoryid) as 商品类型总数, count(distinct behavior) as 行为类型总数,
count(distinct dates) as 天数
【【微信】】;
得到以下数据
可以看到,在这10万条数据里,一共记录了983位用户在9天内的行为信息。在这9天内,所有行为涉及的商品总数为64440件,一共包含了3128中种商品类型。
2.淘宝用户转化率分析
首先对淘宝用户在购物的整个流程中的转化率进行分析研究。使用以下命令,
selectsum(【【微信】】='pv' 【【微信】】) as pv人数,
sum(【【微信】】='cart' 【【微信】】) as cart人数,
sum(【【微信】】='fav' 【【微信】】) as fav人数,
sum(【【微信】】='buy' 【【微信】】) as buy人数
【【微信】】r>
从图中可以看出,点击行为占所有行为比例最高,达到了89.71%。其他行为的占比急剧下降,添加购物车行为占比5.45%,收藏行为人数占比2.75%,购买人数占比2.1%。这说明从点击到达成购买行为这一过程中,转化率并不高,那么是什么导致这个现象的发生呢?
我们提出两个假设,第一个是购物流程不同对用户购物存在影响。电商存在的夹点就是用户在确定购买前的流程,我们探究流程的繁琐程度对用户决策的影响,同时探究用户在淘宝购物时的购物模式。第二个假设是淘宝的推荐机制推荐的商品是否与用户购买的商品不匹配,导致了用户购买转化率低。
假设一:购物流程对转化率有影响
首先从整个购物流程出发,上述图表是用户行为的概况,但是不是所有流程详细的转化率数据。因为淘宝的购买流程可以分成几个不同类型,我们研究不同的购物流程的消费模式有何不停。
淘宝的购物流程可以分成以下几类:
- 点击→购买
- 点击→收藏→购买
- 点击→加入购物车→购买
- 点击→收藏→加入购物车→购买
下面研究每个流程的转化率
首先将每件商品与每个用户产生联系后所涉及的流程进行计算,当pv为1,其他为0时,说明该用户只对该商品进行了点击行为。当pv为1,buy为1时,说明该用户点击这个商品后直接达成了购买行为。
select userid, itemid,sum(【【微信】】='pv' 【【微信】】) as pv,
sum(【【微信】】='fav' 【【微信】】) as fav,
sum(【【微信】】='cart' 【【微信】】) as cart,
sum(【【微信】】='buy' 【【微信】】) as buy
【【微信】】r />【【微信】】 userid, itemid;
使用上述命令后,得到了表格内的数据格式,将这段命令存储为视图并命名为process,方便后续使用。
- 点击→购买 和 点击→流失
使用以下代码
【【微信】】(userid) as 点击→流失from process
where pv>0 【【微信】】=0 【【微信】】=0 and buy=0;
【【微信】】(userid) as 点击→购买
from process
where pv>0 【【微信】】=0 【【微信】】=0 and buy>0;
得到
- 点击→收藏→购买 和 点击→收藏→购物车→购买
from process
where pv>0 【【微信】】>0;
【【微信】】(userid) as 点击→收藏→购买
from process
where pv>0 【【微信】】=0 【【微信】】=0 and buy>0;
【【微信】】(userid) as 点击→收藏→购物车
from process
where pv>0 【【微信】】>0 【【微信】】>0 and buy=0;
【【微信】】(userid) as 点击→收藏→购物车→购买
from process
where pv>0 【【微信】】>0 【【微信】】>0 and buy>0;
- 点击→加入购物车→购买
from process
where pv>0 【【微信】】>0 【【微信】】=0;
【【微信】】(userid) as 点击→加入购物车→购买
from process
where pv>0 【【微信】】>0 【【微信】】=0 and buy>0;
综合得到的数据,得到下图
可以看到,经过点击页面查询商品后直接购买只占了点击后行为的1.4%,转化率非常低。但是在用户将商品加入购物车和收藏栏里后,直接购买的转化率分别是9.2%和8.5%。在收藏后再加入购物车后,购买的转化率提高到了31%。这说明用户在使用淘宝时,更多是有目的性的购物,非主动性的受到界面推荐引导的购物占比很低。
假设二:推荐机制推荐商品与用户意愿不匹配
要研究推荐机制推荐的商品是否与用户意愿匹配,首先要找出淘宝推荐的商品种类。这里我们使用点击数排名前十的商品类别代表商家推荐的商品。
select categoryid, count(behavior) as 点击量【【微信】】r />where behavior='pv'
【【微信】】 categoryid
order by 点击量 desc
limit 10;
点击量最高的是4756105类商品,第二位和第三位分别是3607361和4145813类商品。
再研究用户购买的商品类别前十
select categoryid, count(behavior) as 购买数【【微信】】r />where behavior='buy'
【【微信】】 categoryid
order by 点击量 desc
limit 10;
购买量最高的类别是2735466类商品。
对比点击量前十和购买量前十的商品类别,我们发现有五类商品是重合的。
这说明50%推荐的类别进入了购买量前十,这个数据没有对比无法得到相对高低,那么我们来研究商品的点击量和用户购买的商品是否一致。同理,我们得到
select itemid, count(behavior) as 商品点击量【【微信】】r />where behavior='pv'
【【微信】】 itemid
order by 商品点击量 desc
limit 10;
select itemid, count(behavior) as 商品购买量
【【微信】】r />where behavior='buy'
【【微信】】 itemid
order by 商品购买量 desc
limit 10;
经过对得到的数据进行比对,我们发现用户购买的商品前十与推荐商品前十没有重合,说明推荐的商品与用户的意愿不匹配。综合上面分析得到的图表,淘宝的推荐机制没有起到激励消费者的作用,推荐的类别与用户购买的类别仅仅有50%的重合度,用户购买的商品与推荐的商品的重合度更低。说明假设二成立。
综上,用户转化率低的原因主要是淘宝的推荐机制不合理造成的。用户的购物流程没有明显的对决策产生影响的表现,但是数据表现出用户主要行购物偏多,对首页的商品推荐的转化率非常低,从侧面反映出淘宝推荐机制的不合理。
3.用户购买行为与时间的关系
我们研究时间对用户消费行为的影响,主要考虑两个方面,分别是以天为单位,工作日和周末客户购买行为的区别,另一个是每天以小时为单位,客户在一天中的活跃高峰和低谷期。下面是研究时间与用户行为的思路导图。
- 工作日和周末的日活区别
本报告将行为发生的数量为用户活跃度。
select dates, count(behavior) as 活跃度【【微信】】r />【【微信】】 dates
order by dates asc;
以上是2017年11月25号到12月3号每天的活跃度,从表中可以看到在12月3号和12月3号两天出现了一个明显的活跃高峰期,而这两天恰巧是周末,这说明用户在拥有更多空闲时间的周末,会更加频繁访问淘宝,发生购买行为。那么从另一个角度进行分析,用户购买商品的数量是否也同样呈现这样的分布呢?
select dates, count(用手机订酒店用哪个软件最好 预定酒店哪个软件比较便宜
用手机订酒店用哪个软件最好,用手机订酒店用哪个软件最划算,手机上订酒店便宜吗,手机订酒店流程感谢阅读,欢迎关注?点赞。
手机已经成为人们工作生活中必不可少的电子产品,对于旅游党和出差党来说,酒店永远是最最重要的一件事情,那么手机上用什么app挑选酒店最有性价比呢?
根据市场调查,市场占比排名靠前的的2款app是携程和飞猪,但根据本人和身边亲友的使用体验,都一致认为飞猪这几年的体验要明细好于携程,这主要是从搜索体验、价格、支付整个流程来做比较的。
携程搜索广告较多,大数据杀熟的情况较严重
携程经过多年的飞速发展,逐渐成为旅游行业的龙头老大,占据了绝对优势的市场份额,处于垄断地位后就开始利用自己收集到的用户数据做恶,美其名曰为用户实现精准化推荐,其实是【大数据杀熟】,即根据用户的日常浏览记录和操作轨迹来虚假标记旅游产品的价格,实现千人千价,比如一个出差党经常需要预定酒店,那么就会根据大数据来给你定价,一个旅游党经常需要买飞机票,就根据大数据给你标高航班价格,反正知道你们是携程忠实用户,已经培养起购买习惯,不会轻易换平台。
近几年携程杀熟的事件屡见不鲜,下面是我百度搜出来的事件:
飞猪会员等级和酒店等级挂钩,酒店支持信用住,可以先租后付费,性价比也很高
飞猪的口碑是一步一步做起来的,背靠阿里巴巴这座大山,有充足的资金和技术实力可以依靠,迅速和一些旅行公司和景点展开合作,尤其是国外的市场,也就1,2年时间势头就超过了去哪儿这些老牌旅游公司,可见阿里巴巴是给予了飞猪非常大的资源。
这次中秋我和家人去青岛玩,就是在飞猪上预定的酒店:如家精选酒店。因为这家酒店地理位置很好,就在火车站和栈桥附近,景点多而且出行方便,其次我的飞猪等级是F3,直接可以注册如家就是钻石卡会员,可以享受如家的钻石卡会员的一切权益,本身飞猪也送了100优惠券,整体3晚下来才600多点,非常超值,而且可以支持信用住,先住后付款,这么多好处肯定会继续使用飞猪。
当然这只是我个人的观点,我是对飞猪平台比较信赖,经历过携程杀熟事件后,我实在对携程提不起好感,就是这样。
码字不易,欢迎大家点赞关注,多谢!
1.选购
首先,您要在高德网上注册成为会员。然后,您就可以按您喜欢或习惯的搜索方式查询所需产品,找到后浏览产品的使用性能及其他各项详细信息。
2.加入购物车
在标有商品编号和品名的购买条中输入您所需的数量,并点击购买按钮,即将商品放入了购物车;为了保证您订购的 安全性,这个过程需要先登录,如果您还没有登录,我们会 把您引入登录页面。
3.去收银台
当您把您所需的商品全部放入了购物车,并确认购买目前购 物车中全部商品,请按“去结算”按钮,即可完成订购。
4.确认收货人信息
填写送货登记信息并确认。
5.选择付款方式
[款到送货]:
款到送货付款方式适合于全国各地的用户。其具体方式为银行汇票、银行转帐支票或电汇。
[货到付款]:南京地区的用户购物时还可选择货到付款方式。通常情况下,我们在严格的配货后(时间不超过24小时)将按照用户在注册时填写的联系电话或E-mail进行确认后按指定的时间和地点送货上门。
6.选择配送方式
客户在高德办公所订商品,高德办公将尽量按照客户要求的送货时间送达;特殊情况双方协商送货时间。
7.订单确认
当页面显示送货登记完成,表明您此次求购已顺利完成。
售后服务承诺
退换货:
在下列两种情况下,只要客户在收到商品三天内(以客户签收日为准)向高德办公提出退换货要求,高德办公保证无条件退货或者更换其它商品,否则不予退换。
质量问题:客户在收到商品七天内发现产品有先天性故障且无法修复的情况下(需相关部门的检验证书),高德办公保证为客户无条件退换货。
非质量问题:在七天之内,机器没有使用过、未破坏原包装并且不影响二次销售的商品(不包括办公耗材、配件、服务)。
下列商品不能退换货:
1.产品曾受到:非正常使用、非正常条件下存储、暴露在潮湿环境中、暴露在温度过高或过低温度中、未经授权的修理、误用、疏忽、滥用、事故、改动、不正确的安装、不可抗力、食物或液体溅落、产品的正常磨损等。
2.因客户的责任,造成商品外观、使用性能破坏的;影响二次销售的。
3.非质量问题的特别订货: 应客户的要求,特别购买、定制的商品,如代客采购商品等。
4.客户收到的产品与合同订货的标的商品一致且没有质量问题的情况下,高德办公不予退换货。
退换货方式:
发生退换货时,客户需将商品送至高德办公,由客户服务部检验。符合退换货条件的商品高德办公将在三个工作日内予以解决,请客户协助填写退换货登记表。如有赠品,退换货时应将赠品原样退回,相应会员积分点数扣除。
相关服务:
1.所有从高德办公采购的办公设备产品均享受国家或行业相应的保修期,及厂家保修制度。
2.对于非保修责任及非高德办公销售的产品,维修将按照市场价收取费用
3.高德办公OA客户服务部随时解答客户相关疑问,请拨打热线电话(025)83350637 83363589 83361944或登陆到高德论坛与我们联系;
4.售后服务条款参照生产厂家规定执行。
注:因不同产品的特性差异,故其送货条款、付款方式以及退换货条款不尽相同。