1.用户画像的概念和作用
用户画像 就是一种常用的用户建模方式,系统可以根据用户画像中描述的用户个性特征和兴趣爱好,为用户推荐个性化内容。构建用户画像的核心工作是给用户“打标签”,其中,“标签”是通过分析用户信息得来的高度精炼的特征标识。
用户画像作用:
①精准营销:分析产品的潜在用户,定向特定群体
②用户统计:统计用户的使用和购买行为
③数据挖掘,只能推荐:利用关联规则计算,进行商业智能创新
④效果评估,完善产品运营,,提升服务质量:可以通过构建测试用户的方法实现效果评估,这些测试用户对推荐内容是否采纳和阅读的行为是确定的。
⑤服务/产品的私人订制:个性化服务某类群体甚至每一位用户。当前,用户对个性化服务的要求越来越高,而只有在充分理解每一个用户的基础上,才有可能提供个性化的服务,因此用户画像越个性化、越准确,给用户提供的个性化服务才会越完善。
2.如何构建用户画像
第一阶段进行基础数据收集:①用户的社会人口属性:性别、年龄、职业、收入、教育程度等;②网络行为数据,如用户使用各种网络服务和应用的频率、时长、用户使用的设备。③服务行为数④用户交易数据,即用户对商品和内容的购买行为。
第二阶段对采集到的基础数据进行分析和挖掘。第一阶段采集到的数据是未经处理的原始数据,往往没有规整的结构,需要对其进行清洗、归类等预处理工作。通过文本挖掘、自然语言处理、机器学习等,把无结构的数据整理为结构化的用户行为数据。同时,一方面使用分类算法,对用户行为进行归类处理,发现用户感兴趣的主题和关键词,提高数据的可用度;另一方面,使用聚类算法对兴趣爱好相同的用户进行聚类,则推荐相关内容时可以统一推送给某一类用户,而不必在全部用户集合里逐个收索对此类内容感兴趣的用户,提高系统效率。
第三阶段是为每个用户构建个性化的用户画像,这是对前两个阶段采集数据的进一步提炼和抽象。
3.用户画像标签体系
(1)身份特征:性别、年两、职业、常驻地点、电子邮箱等等。
(2)主题兴趣特征:感兴趣的类别和主题、感兴趣的关键词、感兴趣的内容来源、基于兴趣的用户聚类、消费习惯等等。
(3)垂直兴趣特征:科技、体育、金融、财经、娱乐等等。
(4)行为特征:分时段的行为特征、分位置的行为特征、阅读内容等等。
4.用户画像的“冷启动”
如何给系统并不了解的新用户提供有效的内容推荐,通常被称为用户的“冷启动”问题。
策略一:根据外部服务的历史行为数据扩充新用户的画像,当前,在不同的互联网应用之间往往会开放一些编程接口,用户以编程读取各个系统中可以公开的数据。比如用户在一个新的算法推荐系统注册时,可以通过微博或者微信授权直接使用微博或微信账号登陆新系统,从而免去重新注册一个新账号的过程。在这种情况下,算法推荐系统可以根据用户的授权读取用户在微博、微信平台的公开数据如昵称、发布内容、阅读历史等等、如此便可在用户直接提供个人兴趣爱好信息的情况下,使用自然语言处理和及其学习等算法,根据用户在其他服务中行为数据提取用户的兴趣特征,扩充用户画像的标签数量,达到尽快完善用户画像的目的。
策略二:用户分类和聚类。尽管个体用户都有“千人千面”的兴趣特点,但在一定程度上仍可以对用户进行分类和聚类,而针对同一类用户的推荐对此类用户中的所有个体的推荐均有一定的有效性和合理性。具体地,对于新注册使用系统用户,可以使用其基本信息标签(年龄、性别、手机类型、网络特征、地理位置)查找系统已有用户中与新用户相似度较高的用户,把用户归类为这些用户所属的类别中,从而使用相应的用户类别的内容推荐规则进行有针对性的推荐,并依据使用用户的阅读行为及时反馈,形成新用户自己的画像标签集合。
5.用户画像的设置和调整策略
策略1:过滤噪声数据。在用户与推荐系统的交互过程中,并不是所有的点击和阅读动作都是有效的。需要识别出用户的无效阅读行为,将相应推荐内容对应的标签作为噪声数据过滤掉或者降低其在用户画像中的权重,提高推荐的准确度。
策略2:适度降低热点标签的权重,对于用户在热门内容上的动作,系统需要相对应的标签做一些降权处理。
策略3:用户兴趣爱好往往随着时间而改变,伴随用户在算法推荐系统内动作的累积,用户某些历史行为对应的特征值权重应当随着时间改变而改变。
策略4:调整负向操作权重。推荐系统根据用户画像的标签给用户推荐适配内容,理想的情况是推送的内容都会得到用户的阅读和观看。如果一篇内容推荐给某个用户之后,用户完全没有点击查阅,则此篇内容可能并不是该用户感兴趣的类别。
策略5:综合考虑全局背景。对于某个给定的特征标签,需要考虑其他人均点击情况。还需要关注特定标签对应的内容被推荐给多个用户后的人均点击情况或驻留情况,然后对应相应的标签做一些权重调增。
联系客服