车品觉称:“一开始,我们在用好数据,但是随着数据战略与平台战略紧密结合,我们开始刻意地去管理数据(保证数据安全、质量和对于商家的可用性),养数据(有意识地收集外部数据),沉淀数据。”
让大数据更好用?阿里巴巴是如何实现这种转变?从六个地方入手:确保数据安全(保护商家和个人的隐私)、保证数据的质量(去除虚假数据)、实现各个部门数据标准的统一(如转化率)、让原始数据变得更精细化(更符合商家的应用情景)、获得外部数据(如并购新浪微博,和其它平台合作、购买数据信息等)、建立数据委员会。
具体做法:
a)去除源头污染,净化数据质量
自阿里巴巴数据委员会建立以来,数据质量就成了部门的核心工作,车品觉认为数据质量是大数据的命门,如果将大数据比作水流,“来自任何支流的数据,如果质量有问题,都会带来整个水源的污染。”由于淘宝等平台上的数据往往良莠不齐,不少数据虚假,带来很大的噪音干扰。“有时,在淘宝平台上,对于一个人,我们会看到两个手机,一个iPad,三张信用卡,五个淘宝帐号,收集数据时,以为是多个人,但实际上就是一个人。但如果依照这个数据,商家可能就将红包给了一个不活跃的账户。”为此,阿里巴巴试图剔除虚假的数据,让收集的数据能反映真实的消费情景。比如上面的案例,就要鉴定所有这些账户、信用卡等是否为同一个人所有。再如,阿里巴巴经常要做产品界面测试,有时临时修改界面,会一下子多出一个按钮,这就会带来大量误点击操作,数据收集时,就会得到很多失真的用户行为数据。阿里巴巴的数据人员目前的工作就是要将这些失真的数据剔除,或者将数据还原到真实的场景。
b)打破分割,统一数据标准
统一数据标准,就是让净化后的数据流得以汇集。阿里巴巴下属各个部门业务重点不同,对数据的理解不同,因此数据标准往往各不相同,比如转化率。要将这些数据汇集成大数据之海,就必须统一标准,这也是阿里巴巴数据委员会目前重点推行的项目。
湘ICP备2022002427号-10 湘公网安备:43070202000427号
© 2013~2024 haote.com 好特网