有了互联网,广告就可以发挥自身的灵活性,成为能够触及更多的受众,成本较低的互联网广告,使得小商家受益。于是电子商务得到了发展。假如你是一个做电商的,你会怎么利用互联网来打广告呢?
那么多种互联网广告,哪种效果最好呢?
具体到哪家媒体或者网站上去做呢?我们先说一下结论, Google的搜索广告优于Facebook的个性化展示广告,后者优于一般的展示广告。
接下来量化计算一下各种广告形式的效率
先说Google的搜索广告,它是和Google的引擎相伴随的。Google的搜索引擎中收录了大约几十亿个常用的网页和上千亿个其它网页,当然它还有近千万的广告主以及几千万种广告。为了聚焦,我们只关注它几十亿个(我们假定为40亿)常用网页和几千万种广告。
如果我们要从40亿个网页中找出自己最需要的那一个网页来,需要多少信息呢?如果每一个网页大家查找的频率相同,那么从40亿中选1,需要log(40亿)=32比特的信息。
但实际上,有些网页大家查找得越频繁,是你想要的那个网页的概率越大,所以根据这个频率计算信息熵,其实不需要32比特。我们假设,需要大约一半信息,即16比特就够了。
另外,我们还考虑到用户的浏览器所使用的语言,比如英语最广泛,那么划定范围又小了一些,又可以节约一些所需信息,这时候我们估计大约需要12比特信息。
好,这时候,你在搜索框里输入的关键词,能减少这12比特的信息熵吗?
要知道,在英语里,一个表达意思的英语单词,(即排除the,a,is等使用太频繁,但没有鉴别力的单词)平均大约只有6~8比特信息。
因此,你如果用两个关键词,通常可以保证你所要找的内容排在第一位。当然,这几个关键词所提供的信息最好是正交的,那样效果最好。
对于中文,情况也是差不多。一个汉语的两字词,大约有8~10比特的信息,于是你用两个两字词,在Google上基本上可以确定那个你唯一要找到的网页。
理解了搜索的信息论原理之后,我们现在转换一下身份,假定自己是广告主,要投放广告了,看看怎样利用用户在搜索时提供的信息找到广告的受众。
要知道,广告是一种商业信息,虽然它和钱相关,但是如果我们不考虑内容,只看信息量,它和网页搜索没什么差别。
在中国,Google和百度广告主的数量在几十万到百万这个量级,但实际上,很多广告主把预算花光了后,就不再及时续费了,此外还有一些广告主的广告质量很差,点击率不高,我们也暂时不考虑。
于是,我们假设有12万广告主要做广告,要想让用户从中把你这一家商店选出来,信息熵(不确定性)是17比特。
如果你不清楚任何用户的需求,那么只好随机做展示广告。在历史上,展示广告效果从来都不好,原因就在于它无法消除不确定性,在这里就是17比特的信息熵没法消除。
因为展示的广告和读者的意图无关,读者偶尔的点击也只是好奇和不小心。
据京东主管广告的负责人颜伟鹏先生介绍,在门户网站上做展示广告,获得一个用户的成本可以高达10000元以上,做那种广告完全得不偿失。
当然了,展示广告的收费也就不可能太高,通常每一千次展示的收费,也被称为RPM,不会超过0.5美元。但你不是为了省钱,而是为了效果,为了更便宜地获得客户。
那么搜索广告的效果怎么样呢?
由于用户在搜索时提供了信息,表达了他这一次搜索的目的,因此,广告就好做了。
如果我们还是假设用户搜索的关键词是两个词,每个词平均两个汉字,通常这两个词提供的信息是正交的,根据汉字词平均的信息量,这两个词大约提供了16~20比特的信息,基本可以消除17比特的信息熵。
对Google来说,已经可以确定该显示哪一个广告了。也就是说广告和用户的需求其实完全匹配了。
这样,广告的效果就好很多,当然搜索广告也因此收费高很多。Google通常可以做到30美元,甚至50美元以上的RPM,百度也能做到100人民币左右的RPM。
这比之前传统的展示广告高出了大约两个数量级。
虽然广告的收入并非和不确定性的减少呈指数相关,但是,如果你作为广告主知道用户的意图再进行服务,效果也要好得多。
我能不能做一些个性化广告以及和内容相关的广告?
很遗憾,个性化服务会带来的好处并没有人们想象的多,这里面根本的原因是,人的差异远没有我们想象的大。关于个性化,我们可以理解成我们自身的喜好,和大众平均值的差别。
如果我们把自己日常关心的事情放到10个维度中来考虑,每一个维度有一个权重,十个维度放在一起,就是一个关注度的概率分布。
我们假设P=(P1,P2, ……, P10)。
类似的,我们假设大众在这十个维度上的关注度的概率分布是Q=(Q1,Q2, ……, Q10)。那么所谓个性化的差异,就是P和Q这两个概率分布的交叉熵KL(P,Q)。
那么这个交叉熵有多大呢?如果是考虑十个维度,其实并不大,根据我们在Google和腾讯使用了大量的数据计算,它不到一比特。
这也就是说,中国人所说的“性相近,习相远”是对的,因为人的本性差不多。
但是如果考虑的维度比较多,比如细到100维,这个数值就要大一些了,大约在1~2比特之间。
1~2比特信息虽然比不上搜索时用户自己输入的信息那么多,但是对于改进广告系统还是有用的。
这其实是Facebook的广告效果比当年雅虎等门户网站好的原因之一。
为什么说之一呢?
因为光靠那1~2比特的信息,Facebook完全不可能做到今天的市场规模,它的广告系统另有玄机,那就是利用了承载广告页面本身的内容信息,以及社交网络的网络效应。
我们先说说利用承载广告页面本身内容信息的作用。
如果我们在一个介绍金融的网页中放一个薯片的广告,效果恐怕好不了,但是如果放一个高端旅游的广告,效果就会好一些。这就是所谓的和内容相关的广告。
至于社交网络的网络效应,用我们一句俗话讲,就是“近朱者赤,近墨者黑”。
你周围圈子是什么人,你就被划分成什么人,他们点击什么广告,你就被推送什么广告。这样一来,广告的效果又有了进一步的提升。
你可能注意到了,搜索广告使用了用户提供的10多比特的信息,而个性化广告其实只能利用1~2比特信息。但是后者的效果也比门户网站的广告要好。
因为如果说Google的广告效果主要是因为用户主动告知自己的目的而极大地得到提高,那么Facebook 广告系统的效果则是通过几个隐含的信息叠加式改进的。
后者虽然每一类信息的效果有限,但是由于使用的信息彼此是正交的,它们的效果可以叠加,几种主要信息在一起,效果就比传统门户网站的展示广告好了很多。
那有没有其他效果很好的广告投放办法呢?
在互联网的世界里,还有第三类广告系统,那就是电商平台上的广告系统,它以亚马逊和阿里巴巴为代表。
这类广告系统,实际上直接使用了用户过去的购买行为信息,甚至可以预测上一次购买的消费品是否已经用完。因此对用户信息的把控是极为准确的,它的效果也非常好。
要点总结
1.Google的广告系统利用的是用户主动输入的信息,它最为有效,因为任何时候,人总是喜欢买东西,不喜欢被卖东西。任何推送都比不上用户主动的请求更有效。
2.我们介绍了个性化服务的本质,就是寻找每一个人和整个群体在喜好上的差异程度,我们可以用交叉熵来定量衡量它。维度分得越细,个性化特点越突出。但是,人对各种东西喜好的差异比我们通常想的要小很多。
今天有很多不重视底层技术和信息理论的创业者,天真地以为自己做了点个性化的事情,就可以对现有的行业竞争者取得碾压性的优势,这只是他们自己的想象。
“化学之父”拉瓦锡讲,不使用天平衡量就得不到真理。
类似的,Google一直强调,没有数据就得不出任何结论,道理是相通的。在信息时代,为什么我们要了解信息论最基本的原理?就是要能够判断做事情的方向是否正确,以免像一些公司那样,死都不知道是怎么死的。
3.我们看到了使用正交、可叠加信息的作用。这才是Facebook成功的根本原因。
4.我们与其说是大数据帮助亚马逊和阿里巴巴了解我们的意图,不如说我们自己直接将自己的需求放到了亚马逊和阿里巴巴里面。它们的成功还揭示了一个规律,就是离达成交易的环节越短,广告的效果越有效。
根据我们在Google的研究,发现人从了解到一些商业信息到最后达成购买并付费是一个非常长的过程。
开始先看到一些普通的信息,如果他真感兴趣,会向周围朋友去了解,然后会去做一些研究,包括看看使用者的点评,再随后是搜索比价,最后才达成购买。
大部分媒体,包括门户网站上的信息,只是提供普通信息,它们离购买最远,因此广告的效果最差。
社交网络的信息和Google搜索的信息属于第二、第三阶段的,离购买越来越近,广告的效果也就越来越好,电商上的属于最后一环,效果最好。
做人做事要直截了当,效果最好,不要拐弯抹角,就是这个道理。
比如请假要找直管领导。
有的人请假特别喜欢“代请”,先不说这种“举手之劳,却请人代劳”的做法妥不妥当:
第一,离当事人越远,解释说明的效果越差;
第二,别人帮助请假,实际上对你的真实信息掌握有限。
80%的人都看过的文章
- Mozilla联合创始人投诉Google违反GDPR法规
- Google受罚:将向Android制造商收取最高40美元费用
- Google为Chrome添加了传感器权限控制
- 什么是app-ads.txt?app-ads.txt实施步骤解析
- 5250万用户信息恐遭泄漏,Google+ 将被提前关闭
- Google推出防止学生网上抄袭的工具
- Facebook接受意大利税务部门处罚:支付超1亿欧元
- Google健身网站将于3月19日关闭,将焦点转移到移动和智能手表上