互联网公司的指数们

4月头上,随着蚂蚁金服正式推出淘金100指数,BAT三家互联网巨头再一次在同一个领域里碰头:他们都开始做自己的股票指数。

如果算上新浪的i指数,迄今为止,已经有四家互联网公司编制股票指数。

对股票指数的投资,被视为一种被动型投资,它比较适合风险厌恶度高而且相对没有太多时间看盘的人。

我一向认为,在整个大势走好的情况下,投资指数,是一种不错的解决方案。算是顺势而为,又不用动什么脑子。

股票指数不是什么新鲜事,但互联网公司出手制作股票指数,是互联网金融大潮下的一桩新鲜事。

无一例外,他们都宣称自己:大数据。

下表可以比较直观地看一下这四个互联网公司做的股票指数的简单情况:

internetindex1

这个表能看到几个指数的表现情况,淘金100由于刚刚发布,不在统计之列:

interntetindex2

2015年以来的表现:

internetindex3

四个指数,可以分成三类。

第一类,腾讯的腾安和新浪的i系列。这个属于“媒体指数”,不算什么太新鲜的事,赫赫有名的道琼斯指数、日经指数、金融时报指数都是媒体指数——由媒体发布指数。

腾安基本上没有提及如何利用腾讯的数据来制作指数——虽然我们都知道,腾讯拥有强大的社交大数据。腾安是发布最早的一个互联网公司指数,13年5月的时候,微信已经出发,但并没有像今天那样无孔不入。

从腾讯公司的发言人身份来看,它也的确是一个媒体指数。我查到当时的媒体通稿里都引述了马立的致辞,马立是腾讯网的副总编。

腾安强调了它的专家评审机制,有这样的话语:“腾安价值专家评审委员会阵容强大,由财经媒体、证券投资、资本运作、市值维护、行业研究、宏观经济以及金融工程等不同领域的专家组成,从不同的专业角度排除投资地雷。”

很奇怪,腾安指数不怎么提及腾讯自选股,后者是腾讯旗下在证券行当里非常重要的软件。腾讯自选股与腾讯网同属OMG部门。

新浪的i系列,号称与新浪财经大数据有关,“通过新浪财经大数据分析,找到一种有效的连接用户情绪与股价表现的关系,将符合这种关系的股票提取出来,是大数据因子的精髓,也是指数编制过程中最大的创新”——这个有效的连接用户情绪与股价表现的关系,十分让人不明觉厉。

新浪这样解释它的这个“有效关系”:用户在新浪财经对行情的访问热度、对股票的搜索热度;用户在新浪财经对股票新闻的浏览热度;股票相关微博的多空分析数据。

不过,新浪在互联网门户媒体里虽然很强,但不具有压倒性垄断优势。它的用户样本,是整个互联网财经领域中的重要组成部分,但要说能有效代表,比较牵强。微博倒是一个不错的数据源——因为新浪微博有压倒性垄断优势——但微博这个行当,本身在走下坡路。

我个人的看法是,新浪i指数,依然是一个媒体指数。

后面两个,才是真正意义上的大数据分析后的互联网公司指数。

百度的百发,可以视为基于搜索的指数。蚂蚁的淘金,可以视为基于流水的指数。这两种指数,在前互联网时代是不可想象的。也是前面提及的“道琼斯指数、日经指数、金融时报指数”完全做不出来的。

而且,它们与即时性有关,是真正的用“当下发生的”去预测未来。它们也和“全样本”有一定的关系,百度是中国最大的搜索引擎,阿里是中国最大的电商平台,在各自领域具有压倒性的垄断优势。虽然百度和阿里不等同于全部的搜索和电商,但要说它们能代表搜索和电商,应该没有太大的疑问。

搜索,反映着人们的兴趣(或者称之为意愿),某种意义上代表着“关注”。而且,人们在使用搜索的时候,是需要自己填入一个或者若干关键词的。搜索关键词理论上讲,可以找到人们在盘算这个议题时候的思考重点。

谷歌利用搜索,做了全美流感趋势判断,号称比医疗系统出来的数据还快还准,这是大数据领域中会被反复提及的经典案例。

淘金100则建立在阿里平台上的交易流水,根据电子商务的交易流水,阿里旗下的蚂蚁金服做了一个“维他命平台”,来判断行业景气度情况,然后根据这个行业景气度,筛选股票形成淘金100指数。

用电子商务交易流水来判断行业景气度,这个逻辑是可靠的。著名的巴菲特买可口可乐的故事也说明了这点:巴菲特看到很多人从超市里大量购买可口可乐从而决定入股巴菲特。这个故事可靠性有多高不得而知,但大致逻辑是可信的。

这两个指数,各有优劣。淘金100,在我个人看来,更能反映2C行业的景气度,而证券市场上,也存在大量2B业务的公司。2C的景气度能否推2B,理论上可以,但并不完全,模型建构更复杂。百发100,2B和2C都能覆盖,但从搜索意愿和兴趣到实际的公司基本面情况,中间链条比较长,而且数据清洗工作比淘金100更难。毕竟销售达成和消费意愿,有关联但还是不同。

但这两个指数所仰仗的数据源,是可以信任的。大数据的难点之首,就是数据采集。没数据,后面就啥都没有了。

这四个互联网公司指数如果做一个横向比较的话,我大致是这样一个结论:

腾安指数,腾讯网在中国互联网网站中流量排名第二(仅次于百度),数据比较大,有强大专家评审团。

新浪i系列,新浪微博是它的重要武器,在微博全盛期,覆盖量极大。微博现在已不如11年那般辉煌,但依然有庞大的数据量。至于新浪财经的数据,实话说一句,不代表什么。

百度百发,基于搜索的指数,数据源强大但过于碎片,数据清洗工作量大,不过能覆盖到几乎所有的行业。

蚂蚁淘金,基于流水的指数,数据源强大,而且可以横跨桌面和移动——这是前三个指数所不具备的——,数据清洗工作量相对小,但覆盖2B行业有点吃力。

作为一个证券投资者,可以购买腾安、百发和淘金的基金产品(淘金100的基金产品相信很快可以获批出炉),,亦可购买四个指数。从过去的收益率来看,似乎都还表现不错。

但要从互联网金融这个意义上讲,百发和淘金,更深入一些。

最后的一些个人脑洞大开的思考。

10年的时候,我曾经作为一个外部评委参加过一个运营商视频基地的内容采购评估。当时很多视频网站都前来应标。搜狐视频的应标者的话语给我留下了深刻的印象。他们宣称,他们知道中国最受欢迎的演艺人员都有些谁。

这是拜搜狗输入法所赐。搜狗输入法可以侦知人们经常用的词都有哪些。经常用的词,某种意义上自然代表了热度。

输入法是跨平台的,你可以在各种网站、软件、应用中使用到。而且输入法也是横跨桌面互联网和移动互联网的。搜狗输入法进入到iOS之后,更是全面覆盖到了苹果的硬件产品中。

所以,我个人觉得,下一个做基于互联网大数据的指数的,可能是搜狗,它具有一定的条件:数据源。

利益声明:作者在写作此文时,并不持有文中所涉及的任何一个基金,也未购买文中所涉及的任何一个指数。

—— 首发 上海观察 ——

欢迎扫码,向我捐助十块钱。

erweima.jpg

说明:

1、本博客文字,除特别注明外,均为本人原创,可以自由转载,谢绝长微博形式转载;
2、转载时请注明本人大名,魏武挥,不是魏武辉,不要搞错。
3、转载时请保留此段:本文由扯氮集博主魏武挥原创撰写,欢迎于钛媒体/微信/ZAKER/网易新闻客户端中搜索ItTalks以订阅公众账号,或于搜狐新闻客户端科技频道订阅“魏武挥”
4、本人不接受商业文章(俗称软文)撰写的合作,不要再询问我如何合作法。其它合作请点击本公号菜单关于里的合作需知
5、欢迎于iOS中下载“ItTalks”应用,或Android中下载“扯氮集”应用。
6、欢迎于喜马拉雅电台搜索“魏武挥”,听我用语音的方式吐槽互联网。

大数据为先:读《金融e时代》

金融e时代 近日[i],阿里支付宝忽然非常低调地推出了一个名为“余额宝”的服务,微博上盛传将支付宝中的款项转入余额宝后可获得“利息”。我去查看了一下,发现所谓“利息”,其实是指当用户将金额从支付宝转入余额宝时,就等于购买了天弘基金公司的基金,根据该基金的收益情况,可以获取一定的利益。支付宝提示说:“根据基金行业的长期经验,存入300元以上有较高概率可获得每日收益。”实际收益计算方式为:(余额宝资金/10000 )X基金公司公布的每万份收益。

早在马云辞去CEO职位之时,我就以为,未来阿里最大的看点不在陆兆禧,而在彭蕾,后者是阿里金融的掌门人。银行业务三大模块:存贷汇,支付宝在“汇”上玩得风生水起,是中国头号第三方支付工具,贷上则有阿里小贷不断向前推进。来自互联网的新兴力量,正在试图“摇一摇”传统金融行业(语出马云)。

本书作者万建华,是一名资深的金融专业人士,早年就在初创的招商银行中推进银行业创新服务,后又受命筹建中国银联,这本《金融e时代》是作为一个“传统的”金融家的视角,来回顾和看待整个中国金融业的数字化进程。

包括银行、证券业在内的金融,其本质就是“一堆的数字”。故而金融业数字化的工作起步其实很早,也很快速。万建华写道,1993年国内ATM机还非常稀罕,10年后,美国已经出现独立法人的互联网银行,visa和mastercard在全球四处铺设POS刷卡机,而国内招商银行则用“一卡通”这一新金融工具,迅速奠定了自己在金融业中的地位。而在今天,自助式的金融服务随处可见。金融电子化已经不再是什么新事物,另外一头,电子正在金融化,互联网公司(比如阿里),正在迅速渗透到信贷和支付,国外的Facebook则在踌躇满志地试图接入存贷中介功能。

在金融业行当搏杀的公司们,可能最核心的部位就是“大数据”——这个基于数字的有别于传统的数据仓库的新理念。作者在第七章专门提到了大数据在证券业中的利用:2012年,国泰君安的研究人员就根据20万户的样本研发了一个“个人投资者投资景气指数”(3I指数),借由这些投资者的各种交易行为,建立一个逐项加权汇总的量化模型,来反映整体投资景气度。万氏认为,3I指数表现出了一定的领先性,它的走势和实际资本市场走势有较好的拟合效果。与传统数据仓库向后望的分析理念不同,大数据的向前看分析理念,的确在金融这个投机也好投资也好的行业中,有着领航灯般的作用。

银行业也可以利用大数据(持卡用户的消费数据)来更有针对性地进行广告推送,加大消费者的消费量以从中获利。作者以mastercard为例,这家公司收集和分析来自210国家的15亿信用卡用户的650亿条交易记录,比如它发现一个人在下午4点左右给汽车加油,接下来一个小时前往购物或去餐馆吃饭的概率会较大,消费金额大致在35-50美元之间。这样的分析结果是有意义的:比如某餐馆可以在加油小票后附上一个本饭店的优惠券来吸引客流。

现在的问题在于,类似阿里金融这样的电子金融化公司,正在截留金融业的数据,比如支付宝的快捷支付,让银行只能获得一个用户转出多少多少金额的记录,而对消费了什么全然无知。阿里小贷更是由于掌握了商家的具体经营情况,且借助互联网数字化操作,能做到随借随还,让贷款客户由年化利率的18%降到实际的融资成本6%左右。这家不足300人的公司——根据作者披露——到了2012年年中,已经投放贷款总额280亿元,7月就实现了单日利息100万元。这样的规模和发展速度,确实值得让银行家们重视起来。

阿里金融未必会去替代银行,我一直认为它去开设一家银行的想法过去可能有过,但今天应该已经兴趣不大。阿里的平台化运营,将从淘宝(平台接入各种电商)蔓延到物流(菜鸟网络接入各种快递公司)再到金融(阿里金融接入各种银行)。阿里所图,远超过一家银行。未来金融电子化和电子金融化的博弈还将持续一段时间,整个行业的游戏法则,将由谁来制定,还尚未可知。


[i] 本文作于6月14日

—— 刊发于《人物》杂志 ——

转载说明:
1、本博客文字,除特别注明外,均为本人原创,可以自由转载;
2、转载时请注明本人大名,魏武挥,不是魏武辉,不要搞错。
3、转载时请保留此段:本文由扯氮集博主魏武挥原创撰写,欢迎于微信中搜索ItTalks以订阅公众账号,或于搜狐新闻客户端科技频道订阅“魏武挥”