我们把前面两会议速记块的结果拿过来
日期:2016-08-16 / 人气: / 来源:网络整理
4月20日,UBDC全域大数据峰会·2016在北京举办。会议以“无数据不智能”为主题,除主论坛之外,分辨设立了“数据化运营”、“数据营销”、“IOT和O2O数据利用”、“数据开放与发展纵横谈”四个平行分论坛。
Drawbridge总监、数据科学负责人在“无数据不智能”的主论坛上,分享了技巧如何联结数据。李想分享了强账号系统和跨屏联结两个概念。
李想认为,强账号系统是封闭的,譬如腾讯账号在腾讯系统内是可行的,但是用户一旦脱离了腾讯环境。后面的情况就不得而知了。
而实际上,如果每一个用户都可能拥有很多设备,这些设备有可能有各自不同的应用处景和应用习惯。但是属于同一用户的话,用户在这设备上会有必定的相干性,如果我们视察数据的面足够广,数据的量也足够大,从必定程度上我们是有这个可能创造这些数据其实是一个人的。
李想在大会上分享了三个利用跨屏连接数据的案例,以下为李想在UBDC全域数据峰会·2016中分享的速记实录:
有什么最大的变更,我说应当是有各种各样的基于用户的互联网设备的增进,比如从最早智能手机开端,后来涌现智能电视、智能手表,甚至有物联网,这种设备的涌现对终端用户来讲是激动人心的事情,因为他们可以在任何时间,任何处所,用很多方法获取他们想要得到的信息。另外一方面,对很多企业来讲,这些大的互联网设备涌现引起了一个新的问题,我们知道很多企业最终的目标是要把产品卖给客户,很多时候这个企业的产品跟客户所拥有的移动设备的数量没有关系。比如这是一个化装品公司,他的任务是把他的化装品卖给他的客户,他不会说他的客户是拥有3、2台电脑会比没有电脑,拥有2台手机的客户买的化装品多。在这种情况下,用户获取信息的道路比较简略,报纸、电视,从现在看,这些渠道是一个非常粗暴,最原始的方法,它对客户没措施做个性化的推送。这也有一个利益,因为客户的意志力会比有限的渠道里,他做的事情非常简略,我把广告,投放到有限的渠道里去,就可以直接影响到这个客户的购置行动。
现在随着各种各样的移动互联网设备涌现,用户的行动产生了翻天覆地的变更,首先用户获取信息的道路是千千万万,速录公司,电脑、手机、平板,这是一个最大的变更。
从大的方面讲,应当有两种方法,另外一种是我花比较多的时间是基于概率的领域。首先是强帐号系统,开放的寻衅,看用户是不是用同一个账户登录。我们总结一下,这些设备有可能有各自不同的应用处景和应用习惯。但是属于同一用户的话,用户在这设备上会有必定的相干性,如果我们视察数据的面足够广,数据的量也足够大,从必定程度上我们是有这个可能创造这些数据其实是一个人的。
下面从技巧层面做一些相对深入的分析,首先把这设备把概念连接起来,它必定是一个大数据系统,唯一能够知道哪些设备是属于同一方法,我们把视察到的设备拿到这个系统来。比如举个利用处景,PC端跟移动互联网的连接,把我们能视察的PC端的标识和移动端的标识拿在一起,我们对这个数据做大批的沉淀、梳理、处理,两个设备之间的标识。换句话说,这相当于大海捞针的过程,全部系统的输出是比较少的数据量,但是它的数据必定是海量的数据。
举一个实际的例子,我们一个处理600亿次的系统。这个系统大概是怎么工作的?一般分成三个模块,第一个模块是海选系统,它把所能视察到的PC端和移动端的数据拿过来,我尽量产生一个有可能的配对,这是什么意思?这些配对有可能是属于同一个用户的,在海选阶段有两个特点,第一个特点,它处理的速度利用非常快,如果你处理速度赶不上数据进来的速度,会有很大问题。第二个特点,它对配对的质量有所请求适当的放松。但是我们盼望属于同一个人的设备中尽量在海选阶段保存下来。第二个阶段是我们把海选的成果拿过来,进行精选的阶段。在这里我们会做这样的事情,录音整理,我们会对海选的成果提取一些非常复杂的特点,我们会用相对盘算量非常复杂的模型,他们所谓做这些事情只有一个目标,我们盼望对海选的配对产生一个分,配对正确的标识分出的越高越好。我们可以做一些其它的处理,比如排序等等,所以目标只有一个,尽量把毛病的配对删除,或者打一个很低的分,把可能属于同一用户的配对的分值提上去。
在一般这种情况下,对我们将近一半的客户,精选的量的成果就足够了,他们需要的东西很简略,比如PC端跟手机的配对,但是对我们另外一半客户,北京速记公司,他们需要更苛刻或者复杂一些,你能不能对我们的客户所有移动的标识,我们需要做的聚类的处理模块,我们把前面两块的成果拿过来,先产生一个图,如果你做图的话,确定会有结点。这里面结点是各个设备的标识,比如PC跟移动设备的标识。
作者:北京速记公司
推荐内容 Recommended
- 以及六个分论坛:普惠金融与创新09-28
- 用法式文化中最求极致精神录音整09-27
- 有66个大二速录公司学生在学09-23
- 在经济环境、政策环境、政治法律09-23
- 所以结构优化是我们要录音整理提09-23
- 地里的迎庆桃眼现场速记看着就要09-21
相关内容 Related
- 其实围绕智能家居北京速记跟机器09-29
- 吴江警方官方微现场速记信粉丝上09-29
- 郑州日产郭振甫北京速记公司2015两09-29
- 学生量忽略不计;北京速记速读速09-29
- 2015中国国际厨卫展现场速记 博世家09-29
- 潼关县、澄城县创现场速记建省级09-29