北京启檬科技有限公司北京启檬科技有限公司

智能推荐引擎|精准匹配用户需求,提升转化率

基于机器学习算法的智能推荐引擎研究与实现

在信息化时代深水区,互联网环境下的商业模式正在挑战运营商的传统营销模式.面对快节奏的工作和生活,客户需求既复杂又多变,为了契合客户"短,平,快"的生活模式,这就要求运营商的营销动作要快捷,高效,避免错失营销良机.为深度契合客户需求,充分发挥数据优势,本文通过人工智能手段和自主研发算法构建智能推荐系统,根据每个客户偏好精准推荐产品和内容,提升渠道价值和转化率,保障客户维系,保有和价值释放.

基于单列短视频场景的广告实时竞价系统设计与实现

广告投放系统,搜索引擎与推荐系统,是互联网时代三大极具挑战性的大规模数据计算问题.当以短视频和直播为载体的信息流产品出现后,广告领域从过去20年基于文本和图片的形式向前延伸,逐渐向以视频和音频为载体迁移.在上述的时代背景下,广告领域亟需探索新的利益点和表现形式. 随着大数据技术日益成熟,广告投放系统也在向精准化和智能化的方向发展.广告主希望通过操作难度更低的方式投放广告,同时又希望投资回报率能得到提升.平台则希望最大化长期收益.现阶段学术界和工业界在计算广告领域的研究大多仍主要集中在搜索广告,对于RTB (Real Time Bidding)广告的研究相对较少.仅有的RTB研究也主要集中在传统双列信息流广告,对以视频,直播为载体的单列信息流广告的研究少之又少. 本论文设计了一套基于单列短视频场景的完整的高可用性的广告竞价系统,完成的主要工作如下: (1)广告竞价系统整体架构的设计与实现.用户触发信息流请求,广告引擎依据其的自然属性和行为属性返回广告.架构用以解决从用户请求至广告返回的整条链路的功能模块.核心模块主要包括数据预处理模块,转化率预估模块,广告服务器模块,竞价模块,用户体验模块,数据后处理模块等. (2)竞价模块的设计与实现.本论文在常用竞价服务的基础上,针对广告主"缺乏表达自己真实目标的途径"和"缺乏有效的优化手段"的问题,提出"出价与计费解耦的智能竞价模式"——oCPX (optimized Cost Per X).并提出将PID (Proportion-Integral-Differential)控制器与智能竞价模块相结合,在广告主预期出价给定的情况下,实现广告主收到的真实的行为成本更接近其目标出价的效果.同时,针对调价系统波动较大,以及欠成本,爆成本现象频发的问题,提出使用双曲正切函数对调价过程进行平滑处理的方法.在保证系统灵敏性的同时,实现确保其时序稳定性的效果. (3)预估模块的设计与实现.本论文在常用预估服务的基础上,针对高阶特征计算复杂度高和数值不稳定的问题,提出使用DeepFM (Deep Factorization Machine)模型,因子分解机获取低阶特征组合,深度神经网络获取高阶特征组合,并采用相同的Embedding来训练,实现计算的稳定性.同时,针对点击数据稀疏的问题,提出使用拥有嵌入层的前馈神经网络方法,并提出将常用特征通过one-hot的方式构成稀疏特征,然后再通过浅层神经网络转化成稠密特征的方法,有效避免了维数灾难.最后,针对梯度消失的问题,提出隐藏层使用ReLU(Linear Rectification Function)激活函数的方法,实现神经网络训练的加速.并提出使用随机失活的方法,有效避免了由于神经网络过深而产生的过拟合问题. 本论文希望通过优良的数据流处理系统,帮助竞价系统在面对巨量数据时保证实时性和鲁棒性.同时,将通过深度学习,提高广告转化率预估的准确性,并通过实时竞价中更加准确的排序关系,提升平台的变现效率.此外,通过将控制论算法与竞价系统相结合,使得实时竞价系统长期具有更强的生命力,从而吸引更多广告主与平台加入.

消除无差别假设的互联网广告效果评价研究

互联网广告效果是互联网运营领域最关注的话题,因为它直接影响互联网运营商的切身利益与用户的购物体验,广告运营商的诸多任务均已以互联网广告效果作为重要的参考依据.因此,评价互联网广告效果就成为一直以来学术界和工业界的研究热点,具有非常重要的研究意义和商业价值.然而,由于网页的广告效果由诸多复杂异构的因素共同决定,除了广告本身以外,还与页面格局,用户类型,浏览轨迹等因素相关.因此,如何发现一种更科学,更真实的互联网广告评价指标和评价模型极具挑战性.首先,互联网广告效果多以广告点击率(Click Through Rate,CTR)和转换率(Conversion Rate,CR)等为评价指标,二者均为粗粒度,不精确的显示评价指标.点击率指标忽略那些用户注意到,并形成一定印象,但并没有付出具体点击行动的广告,而转化率指标将用户对网页内容的浏览和对广告的浏览混为一谈;其次,目前评价互联网广告的数据集信息源单一,完整性差,缺少足够的隐式信息,如用户在关注网页时的情绪,用户本身性格等,无法基于多源异构数据构造精确的评价模型;再次,目前的互联网广告效果评价方法多基于用户无差别假设和页面无差别假设.用户无差别假设忽略了用户类型不同所造成的行为方式差异.页面无差别假设把整个网页视为一个整体,不考虑页面的不同布局,广告所在位置对用户行为的影响,难以体现用户对网页不同兴趣区域的行为差异.最后,互联网广告评价模型的建立过程中多基于静态位置特征,缺少对时序动态特征的刻画,忽视了用户行为是一种时序序列.针对上述问题,本文提出了一种融合多模态特征,多重因素和时间序列信息的互联网广告效果评价方法.本文主要工作和创新点如下:(1)提出新的互联网广告效果评价指标.针对互联网广告评价模式单一,评价系统实时反馈不足问题,本论文提出"印象空间"互联网广告效果评价指标.首先,利用心理学印象理论构造印象空间,设计一个向量来模拟大脑的印象空间,模拟的印象空间简化为一个由多因素构成的向量,将复杂的定义性语言通过一段向量表达;其次,选取浏览过程中可能影响关于互联网广告的印象空间建立的的主观因素和外部因素,利用对比研究,整体分析方法寻找这些内,外因素如何影响印象空间的构建,选取关键性,表达性,多样性的因素通过一系列的排列组合方法构造多形态印象空间;最后,利用数学统计中的相关性实验分析和偏离程度检验,研究印象空间的科学性和有效性.(2)大规模多源异构数据采集.针对互联网广告推荐缺乏个性化,广告计算效率延迟问题,本论文进行多源异构数据数据采集.首先,基于心理学行为理论和方法,收集用户信息,包含静态信息与动态信息;其次,利用网页设计方法和眼动追踪收集网页布局内容信息和用户页面操作等信息;之后,利用模糊集理论对采集的数据进行量化和标准化处理;最后,通过相关性分析方法,集成多源异构数据,形成大规模在线互联网广告评价数据集,验证不同的数据表达对互联网广告效果影响的程度,为消除用户无差别假设和页面布局无差别假设奠定数据支持.(3)消除用户无差别假设.针对互联网广告推荐缺少个性化的问题,本论文提出用户类型差异化评价方法,实现用户类型划分.首先,利用模糊决策方法,量化多源异构的用户属性;其次,集成量化后的属性,定义集成属性,并利用将集成属性划分至不同域;最后,利用最优化组内平方差和聚类方法寻找最佳的用户类型种类数,依据此分析各类用户的等.实验证明,不同类型用户具有不同的点击行为和浏览习惯.(4)消除页面布局无差别假设.针对网页页面无差别对待问题,本论文提出基于兴趣区域的用户差异性行为研究方法.首先,掘互联网广告和网页条目布局,定义基本搜索引擎下网页页面布局状态;其次,利用注意时效定义页面兴趣区域;最后,筛选兴趣区域内用户的行为数据,利用关联规则挖掘不同用户的点击行为特点;利用多频子路算法挖掘用户的浏览偏好.实验证明,用户对于网页页面的重点关注区域呈F形,不同的兴趣区域内会产生不同的行为偏好.(5)建立融合多重因素,多类别特征和时序特征的级联互联网广告效果评价模型.在上述工作基础上,本论文提出基于多模态特征和时序特征互联网广告效果评价模型.首先利用马尔科夫链,寻找特征的的时序特性;其次,构建由梯度提升树(Gradient Boosting Decision Tree GBDT)模块,因式分解机(Factorization Machines FM)模块,域因式分解机(Field Factorization Machines FMM)模块,局部马尔可夫链模块(Partially Observable process Makorv POM)等多模块级联的深度学习框架;最后,建立基于多模态特征和时序特征级联模型,实现互联网广告效果精准预测,并分析模型复杂度和模型性能.

酒店搜索推荐的设计与分析

随着信息技术和互联网的发展,人们从信息匮乏时代来到了信息过载时代,用户很难从海量的信息中快速获得对自己有用的信息,对信息的利用率反而下降了。因此过滤信息的能力成为了衡量一个信息系统好坏的重要指标。一个具好的信息系统,会从海量信息中过滤出用户最关注的信息,这将大大增加系统工作的效率,并节省用户寻找信息的时间。推荐系统正是在这种背景下应运而生,作为传统搜索引擎的一个补充,在解决信息过载问题中发挥着重要的作用。 以某旅游垂直搜索网站为实例展开面向酒店搜索的推荐技术研究。在深入分析了各种常用推荐系统后,结合酒店搜索的特点,设计了一种基于酒店相似度的酒店推荐系统。系统的设计思路是根据用户最近的访问酒店推测出用户的兴趣,然后推荐相似的酒店。系统包括离线模块和线上模块,离线模块根据点击日志和酒店信息计算酒店相似性表,线上模块根据用户的最近访问历史计算出推荐结果并负责收集用户反馈和记录系统状态。为了对系统进行离线评测和研究,同时设计了一种基于用户访问时间序列的推荐评测系统,并定义了命中率和命中率精度两个精确度指标作为主要的评测指标。该评测系统把每个用户的点击详情日志看成访问序列,用最近访问历史、当前访问酒店和目标酒店组成的时间窗口在访问序列上滑动来模拟回放用户的访问和推荐过程,并进行相关统计,计算出评测指标。该评测系统被用来研究基于内容、协同过滤等多种相似性算法对系统的影响,并探究影响推荐效果的各种因素和改进系统的方法。 经过研究,发现使用基于协同过滤的Amazon相似性算法和点击详情转化率相似性算法的效果最好,归一化相似性是必要的,应该经常更新酒店相似性表。使用最佳训练集长度、过滤坏数据、组合使用多推荐引擎可以有效改进系统效果。综合使用这些改进方法之后,相对于原始系统,命中率提高了7%,命中率精度提高了15%。

一种应用推荐方法及终端

本发明实施例提出的一种应用推荐方法及终端,通过获取用户阈值时间内的在应用下载网站的浏览行为,根据所述浏览行为确定用户的兴趣标签,根据所述兴趣标签计算用于多应用下载网站中各应用的兴趣度,根据所述兴趣度向所述用户推荐应用,可以解决离线推荐引擎无法处理实时搜索行为的问题,作为搜索引擎的补充,可以更加准确、及时的计算用户兴趣标签,为用户提供实时个性化的推荐服务,提升用户体验,提高下载转化率。
赞(56)
未经允许不得转载:>北京启檬科技有限公司 » 智能推荐引擎|精准匹配用户需求,提升转化率