图2
“标签体系”方法的根本是数据标签化。
构建用户画像的核心流程如下图:
图3
3. 用户画像根本数据采集根本数据采集须要全面网络用户在站内和站外所有干系的静态数据和动态数据。 梳理根本数据,须要明确目前都有哪些数据源,比如核心的系统线了局景门店、机器、小程序、电子数据渠道、营销渠道和第三方数据。 梳理根本数据,须要结合实际需求,梳理干系的数据实体和关联关系;并且根据干系性原则,对某宝的用户、商品和机器渠道三类数据实体进行数据剖析维度的列举。 针对每一类数据实体,进一步分解可落地的数据维度,形成字段集如下举例。用户数据: 用户自然特色:性别,年事,地域,教诲水平,出生日期,职业,星座;用户兴趣特色:兴趣爱好,利用某宝APP/网站【可爬】,浏览/收藏内容,互动内容,品牌偏好,产品偏好;用户社会特色:婚姻状况,家庭情形,社交/信息渠道偏好;用户消费特色:收入状况,购买力水平,已购商品,购买渠道偏好,末了购买韶光,购买频次。
商品数据(以消费电子类为例):
手机:品牌,颜色,尺寸,电池容量,内存,摄像头,CPU,材质,散热,价格区间;条记本:品牌,屏幕尺寸,配置,颜色,风格,薄厚,价格区间;智好手表:品牌,功能,材质,电池容量,颜色,风格,价格区间。渠道数据(以消费电子类为例):
信息渠道:微信,微博,论坛,SNS,贴吧,新闻网站,咨询App;购买渠道:电商平台,微店,官网,实体店,卖场。图4
4. 用户画像行为建模完成根本数据采集后,须要对这些数据进行洗濯、拉通、整合以及剖析建模,之后才能构建用户画像。
首先用户多渠道信息打通,多数据源的情形下,我们要将不同数据源的同一个用户的信息打通。我们可以把用户手机号、身份证等信息视为用户的ID,如果用户的信息在不同数据源,那么我们须要进行连接,从而构建一张关联图:
图5
图6
图中连通的ID可以视为同一个用户,从而实现用户拉通,拉通可以基于图的方法进行强拉通,也可以采取机器学习的方法进行模糊拉通,预测出拉通的概率。
其余,拉通的可信程度由业务的密度决定,密度越高,对可信度的哀求越高,譬如推举是低密度业务,纵然识别缺点,影响比较小,但对付 电商的 短信关照做事,如果识别缺点,体验就会非常差。
图7
用户画像的底层是机器学习,那么无论是要做客户分群还是精准营销,都先要将用户数据进行规整处理,转化为相同维度的特色向量,诸多华美的算法才可以有用武之地,像是聚类,回归,关联,各种分类器等等。
对付构造化数据而言,特色提取事情每每都是从给数据打标签开始的,比如购买渠道,消费频率,年事性别,家庭状况等等。
好的特色标签的选择可以使对用户刻画变得更丰富,也能提升机器学习算法的效果(准确度,收敛速率等)。
图8
5. 用户画像可视化(1)用户个体画像; (2)用户群体画像。
图9
6. 用户画像在业务上的运用图10
7. 智能推举协同过滤和贝叶斯智能评分稠浊推举。小结
AI产品经理以大数据为根本通过:
第一步,设定用户画像的目标;
第二步,构建以标签知识图谱化为系统的标签体系;
第三步,采集数据;
第四步,通过对采集的用户行为数据建模;
第五步,实现用户画像可视化;
第六步,讲按照韶光序列更新迭代并运用;
第七步,在运用用户画像知识图谱过程中结合算法实现智能推举。
#专栏作家#连诗路,"大众年夜众号:LineLian。大家都是产品经理专栏作家,《产品进化论:AI+时期产品经理的思维方法》一书作者,前阿里产品专家,希望与创业者多多互换。 本文原创发布于大家都是产品经理。未经容许,禁止转载。 题图来自Unsplash,基于CC0协议