架构不行就换架会议速记构这样一个思路
日期:2016-09-27 / 人气: / 来源:网络整理
【IT168 专稿】本文根据【2016 第七届中国数据库技巧大会】(微信搜索DTCC2014,关注关注中国数据库技巧大会公众号)现场演讲嘉宾张相於老师分享内容收拾而成。录音收拾及文字编辑IT168@ZYY@老鱼
讲师简介
▲张相於
现任58团体转转算法架构师,前当当网推荐&NLP开发经理。本科、硕士毕业于中国国民大学,曾任当当网个性化推荐&NLP算法开发经理。负责当当推荐系统以及NLP算法的相干工作,会议速记,现任转转算法架构师,负责转转的推荐系统相干工作。具有多年推荐系统、机器学习、数据发掘、大数据盘算方面的实战经验,主导过多个推荐、广告系统项目和多次技巧升级。同时关注互联网金融、反讹诈、风险把持等机器学习技巧的新利用。
正文
大家好!我是来自当当网的张相於,我今天分享的主题是《当当推荐数据系统架构演变之路》。
现在网上风行这么一句话,套路,都是套路。我感到任何行业或学科或工业,发展到成熟阶段,都会有一些套路。推荐系统作为大数据范例利用的成功场景,确实发展了很多年,所以也积累出了必定套路。今天,我们就来聊聊这个套路。我今天分享的重要是离线端利用,不包含在线实时API层面,以当当为例但不只针对当当,分享大纲如下所示:
首先看一下发展过程,我把它分为三个阶段:
起步期是算法时代,到成长期就属于蛮横生长时代,成熟期以架构为主,架构为王的时代。
先简略看下推荐系统的范例发展史。讲历史,我们按时间次序讲,一开端是起步期,从零开端做推荐系统,推荐系统做成以后,会进入快速成长期,成长期可长可短,因为具体行业存在差别,蛮横生长过后会涌现很多问题,这时就需要把控,需要做重构,这时就进入了架构为王的时代,如果架构相对成熟一点,可以称之为相对成熟时代。
先讲一下算法时代的两个特点:动机和业务特点。
讲动机实际上就是讲系统什么时候涌现,什么时候可以上推荐系统。一般来说,移动互联网时代,很多APP一出来就想上猜你爱好等功效,但这其实是有动机在里头的。
第一个动机是业务需要,业务需要含义比较丰富,比如流量利用,数据发掘,用户体验升级等。但也不是说有业务需要,确定可以做出推荐系统。想做推荐系统,数据是最重要的,必须有必定的数据积累才干做推荐。数据积累是多维度的,可以是行动推荐数据,也就是用户数据,也可以是本身的数据,比如电商行业,数据相对而言比较丰富,比较合适做推荐系统。某些行业比如互联网金融行业,可能没什么数据,这时就需要扒数据。总之没有数据确定玩不转。
这个时代的业务有很多特点,第一个特点是从0-1的状态。这时,系统没有个性化,就像百货商场一样,千篇一律。从0-1需要做什么呢?有几个层面是不同的,比如不同页面看到的成果不同,不同的购物流程和阶段看到的不同,或者不同的人看到的东西不同。
其次是比较关注效果,比较关注效果侧面反响的是意图单纯,有过推荐系统经验的朋友会知道,推荐系统一开端是单纯的推荐,以算法为主,后期可能要顾虑业务和运营。还有一个特点是特别逻辑比较少,初期重要关注效果,涉及的规矩比较少。同时,人工干涉也比较少,后期一般需要不同程度的人工干涉。这时的算法有如下特点:
其实推荐算法,万变不离其宗就是一些基础算法,重要是基于类似度的,我们把它称之为memory base,其实都是在记东西。协同过滤算法其实是很经典的一种算法。说到算法,十有八九确定是协同过滤算法及各种变种。然后是召回,推荐系统做到后来,一般会分两步,一是召回,二是排序。但初期只单独做召回,排序时根据类似度进行排序。无论是基于内容类似度还是文本类似度,说到底算法思想都是一样的,只是以不同的情势展现出来而已。一开端建议应用单一算法和模块,因为初期可能没有时间和精力做很多模块。
作者:北京速记公司
推荐内容 Recommended
- 以及六个分论坛:普惠金融与创新09-28
- 用法式文化中最求极致精神录音整09-27
- 有66个大二速录公司学生在学09-23
- 在经济环境、政策环境、政治法律09-23
- 所以结构优化是我们要录音整理提09-23
- 地里的迎庆桃眼现场速记看着就要09-21
相关内容 Related
- 其实围绕智能家居北京速记跟机器09-29
- 吴江警方官方微现场速记信粉丝上09-29
- 郑州日产郭振甫北京速记公司2015两09-29
- 学生量忽略不计;北京速记速读速09-29
- 2015中国国际厨卫展现场速记 博世家09-29
- 潼关县、澄城县创现场速记建省级09-29