数据尽职调查之互联网广告行业数据造假分析

        发布时间:2019-08-04 来源:原数据

        数据尽职调查之互联网广告行业数据造假分析
         
        相信对于移动互联网一代,对于“信息流广告”这个词并不陌生,它是指一种将广告融入信息内容之中的原生广告形式,自从2006年的Facebook中首次展现后传入国内,被新浪微博、今日头条、网易、百度等各大媒体迅速跟进并运用。2018年,我国信息流广告市场规模已达到千亿元规模,约为1070亿元,同比增长73.1%。
        但是很多广告主对这个词又爱又恨!相比较传统网络广告形式,信息流广告具有精准投放、高嵌入度、高互动性、高转化率等特征,实现了广告效果的“可视化”和互动性,成为了新晋广告主的青睐,但是对于最终的广告数据着实让人“头大”。
         

        目前,信息流广告行业的头部媒体也就是广告主投入最多的媒体就是:字节跳动、百度、腾讯,占据了信息流广告市场70%的市场份额,竞争极其激烈。

        先说字节跳动系广告:字节跳动企业有今日头条、抖音、西瓜视频、悟空问答等多款不同维度的产品,作为目前移动互联网仅此于微信使用时长的最大流量池,DAU超数亿人,MAU达1.75亿,覆盖人群较为广泛。其投放形式主要分为:转化—(OCPA\OCPC\OCPM),有效播放—CPV,点击—CPC,展示—CPM,多样的投放形式满足了不同需求的广告主。大企业追求高大上的开屏,中小企业对于应用下载和信息流效果广告情有独钟。

        再说百度广告:作为全球最大中文搜索引擎,覆盖了95%的中国网民,每天有超过2亿次搜索,“搜索+信息流”的形式在变现路径上有独特的优势。
        举例来说,如果某车企新品进行信息流投放,头条的“兴趣营销”只能帮广告主找到感兴趣的用户,但“感兴趣”和“想购买”可能完全是两个不同的人群,就如同大多数人都会对超跑“感兴趣”,但真正“想购买”的可能万中无一。而百度却依靠搜索和产品阵列带来的数据优势,通过兴趣关键词,找到真正“想购买”的那部分用户,这也是百度的信息流异军突起后来居上的一个重要原因。

        对于腾讯系广告:在中国,只要你用社交软件,一定逃不过QQ和微信!在两大社交工具的加持下,想没流量都难。
        就拿广点通来说,如果你做过朋友圈广告,你一定了解,朋友圈广告的投放频次是有严格要求的!这也是腾讯广告成功的地方,在用户体验方面,腾讯广告主要定位:小而精,保证了广告的观赏性,相对于同行业信息流广告,广告质量和广告体验都能让用户接受。

        在如此大的市场容量下,广告黑产也如幽灵般逐渐涌现,甚至已经形成了相当完善的产业链。作为一个在数据界摸爬滚打多年的原数据团队一员,分享一下数据造假的上中下游产业链:
         
        位于产业链顶端的是黑产解决方案提供商,在这样的公司有专门负责研究模型研究破解方式的分析人员,有专职的软件开放人员,有专职的反作弊信息收集人员,也有负责把刷量软件、脚本分发到市场上的市场运营人员。
        经过一层或多层黑产代理刷量软件、脚本流到不同的刷量者手中,并通过包月或按分发量分成的模式获利。造假者只需要极小的代价就可以方便地购买到假量,使众多广告者的广告投入石沉大海。
         
        曾经红极一时的直播平台,也闹出过笑话:2015年某主播在“斗鱼”平台直播游戏“英雄联盟”时,聊天室显示观看人数竟然超过了13亿,相当于所有中国人都在观看,被网友吐槽“网友不够用了!” 还有不少投手在分析投放数据时会有类似的感受:点击量、咨询量都不少,但是成功转化的很少,然后大家会不约而同的想到:是不是遇到了流量作弊?
            
        从上述2个案例中可以看到流量作弊无处不在,那么这些数据都是怎么做到的呢?原数据尽调团队给出常见的流量作弊主要有以下几种:

        (1)双层iframe
        作弊的iframe为了不让人看见,大小只有0x0或1×1,但有些在线广告在显示时会判断浏览窗口大小,如果太小可能就不能显示。这时有些网站就采用了双层iframe技术来刷广告流量。这种作弊方式使用巧妙,里面的js不可能得到最外层真正的页面地址,想抓证据都抓不到。

        (2)IP屏蔽
        有些站点在进行作弊时,会屏蔽北京、上海等大城市的访问,你从这些地区访问时,看不到他们的作弊代码,一切正常。等换用其他地方的代理访问时,你在他们页面里就能看到作弊用iframe代码,这种屏蔽让他们的作弊手段很难被同业发现。

        (3)购买垃圾流量
        现在来自iframe,木马的垃圾流量都是明码标价在卖的,可以用这些流量来刷页面,刷广告。这种也比较难以发现。网站去刷流量目的往往比较复杂,一是刷广告流量,赚广告商和广告主的钱,二是为了alexa之类的排名,也有是为了给投资人看所谓的“业绩”。
         
        大数据、云计算等技术的升级运用,也加快了流量黑色产业链的“技术进化”,流量作弊范围也由集中于移动应用下游的游窜向其上游开发和供应链转移扩散。作弊技术的革新对以“流量质量”为营销生命线的广告主而言,无疑是不容忽视的威胁。

        新生态下,如何有效评估和防护成为各大品牌和广告主进行广告营销呢?原数据尽调团队给出以下建议:

        (一)应用第三方监测平台
         市面上也出现了很多第三方监测软件,通过第三方平台的技术支持,对流量数据进行实时监控,对客户数据的采集和关联分析实现更精准的质量评估,获取流量异常的实时信息,从而精准打击流量黑产的作弊和欺诈行为,切实守护营销资金的安全。


        (二)建立欺诈终端
        有条件的广告主可以自行建立高度持续化运营的欺诈终端,通过用户标识知识库实现对流量欺诈用户的有效标识和持续监控、更新,能更有效地预防流量欺诈风险的发生。此外,结合样本代码检测耗时低至秒级的高性能自动化APK静态、动态检测系统,可实现对流量黑产的深度追溯,并建立与之对抗的感知、监测、对抗模型。与旁路监测和标识知识库配合,可打造一层贯穿流量营销全周期的安全防护墙。

        但是,有一点要说,由于黑产有发达的情报、监控体系和合理的软件架构,把底层基础服务和上层应用剥离,通过对短信接收、线程、宽带、频率、打码方式设置就可以实现刷量,对于普通的广告主来说还是难以分辨,防不胜防,所以只有通过专业的数据尽调数据审查团队去监测、采集,才能保证数据的真实性和准确性。

        数据尽调团队来⾃知名互联⽹企业,精通人工智能、自然语言处理、机器学习、大数据分析等技术,曾在谷歌、IBM、BAT等一线企业任职,拥有多款千万DAU产品实战背景,拥有多年反作弊实践经验。欢迎商业合作或加入我们。
        (微信:Robot_Volke)



        新闻中心