|
目前,新影数讯的主要精力集中在对影视行业娱乐数据、用户观影行为、用户对演员的评价等要素的分析整理上。资料照片 |
从2011年年底开始,微软、Facebook和谷歌等国际公司的“大数据”技术和服务被业内人士津津乐道。国内敏锐的创业者与风投们迅速将目光从门户网站、搜索引擎、社交媒体转移到了“大数据”相关业务。
在中关村,一群热衷于大数据的年轻创业者率先试水。已经在中关村投资多家大数据创业公司的海银资本,为人们展示了大数据到底能为我们带来什么,并勾画出其美好的创业前景。
用“大数据”为电影“算命”
2012年下半年,冯小刚导演的电影《1942》上映前夕,外界一片赞誉和看好,纷纷预测票房将突破7亿元。可一个名叫刘晗的人11月9日却“出乎意料”地发微博表示:预估电影《1942》的票房为3.8亿元左右。最终的结果是,《1942》的票房确实不佳,只有3.64亿元。
如此精准的预测,让刘晗团队很快出了名,也得到了业内影视剧公司的一致肯定。2013年初,刘晗和他的技术团队在海银资本的投资下,组建了“新影数讯”公司,成立还不到半年,已与包括华谊兄弟、光线传媒等在内的十几家影视巨头企业达成合作。
刘晗说,“我做大数据预测,主要是希望国产影片亏本少一些,同时大家能看到自己喜欢的电影。虽然2012年的票房稳步增长,但总体来看,国产片的日子并不好过,除《画皮Ⅱ》、《泰囧》等少数影片盈利之外,亏损率高达80%,这还不包括有超过60%的影片制作了却没有机会上映,造成了资金的大量浪费。”
刘晗介绍,在英国读大学时,他学的是计算机专业,毕业后在当地从事过酒店管理工作,他当时就经常通过分析客人年龄层、桌布颜色、果汁类型等来判断哪些因素影响酒店入住率。
2006年,开始有创业梦想的刘晗选择回国,“国内的创业环境很不错。但创业之前,一定要在大企业先历练一段时间,积累经验、熟悉国内环境,并寻找创业机会。”回国后,刘晗在IBM工作过一段时间后进入新浪,接着在中国移动的卓望公司写过微博开放平台的接口,还做过微博营销。
在新浪的工作经历,让刘晗选择了现在的创业方向,即用数据回答“什么决定电影票房”、“什么样的电影有人看”。刘晗当时从事底层技术架构方面的工作,“从微博平台获取数据时,别人不知道怎么合理存储数据,我就知道它背后的规律”。他介绍,通过数据分析,他发现互联网中80%的网民都会有意或无意地去关注一两位明星,1000条微博里至少有1条和电影有关。“可以说,娱乐明星的带动效应非常大,是最容易挖到数据的地方。”
2011年底刘晗离开卓望后,正式走向创业之路。他的团队开发的(iFilm+)数据平台利用社交网络和数据预测电影票房,由于预测的准确率高达70%,很快受到电影业的关注,同时,短短两个月后也吸引了百万元的天使投资。
“现在早已不是盲目做电影的时代了,一切以数据说话。”刘晗说。
刘晗表示,2012年2月至8月是团队的技术积累期。“那时,我们几乎是足不出户,对近十年来上映的四、五百部电影进行预测分析。先通过各种渠道收集数据,然后让计算机根据其票房和各种参数逆向推导出定量,从而确定‘公式’。预测时,再结合从社交网络的大量信息中提取出的、会影响数值的因素填入公式,进行测算。”
就这样,刘晗团队经过半年的时间,不断做着循环重复的工作,收集数据、研究算法、不断调校,直到数据精准。
目前,刘晗十人不到的团队的主要精力集中在对影视行业娱乐数据、用户观影行为、用户对演员的评价等要素的分析整理上。他们掌握有两万部电影、六万名艺人、四千位导演以及公众对他们的评价的数据资料。“我们还有大量涵盖微博活跃用户约8000万人的偏好分析。”
刘晗说,推动一部影片成功至少有30至50个参数变量,从艺人、剧本、档期、预告片、发行商、宣传点、主题曲等数个因素进行分析才能得出相对准确的结论。
2012年8月,刘晗与《当北京遇上西雅图》团队合作,进行宣传数据指导,制片方本计划于2012年圣诞节档期上映,可“数据”显示,2013年春节后才是最佳时期。“当时,多数人认为《当北京遇上西雅图》应该在2亿到3亿元收入,但最终在那个相对较冷的档期,获得了破5亿元的好票房。”
海银基础数据库助创业企业快跑
新影数讯的快速成名印证了一个事实:大数据时代的多维价值正被快速发现,数据采集、存储、分析等各个环节的商机为资本提供了很好的投资方向。两年前,发源于中关村的海银创业孵化器就开始把目光聚焦在大数据这个领域,重点聚焦社交网络和大数据及其相关应用,目标是建设成为早期社交网络应用创业企业的摇篮。
据介绍,海银资本已先期投资了13家大数据创业企业,聚集了46位创业者,其中6人拥有海外留学经历,18人有知名企业从业经历,平均年龄约30岁。能够在短时间里汇聚大数据领域如此多的优秀创业企业,海银资本有其杀手锏。
自2012年成为海银资本创业大家族中的一员后,刘晗认为他们的网络分析技术有了很大的提升。这主要来源于海银资本为内部团队搭建的一个免费共享的“核心数据库”,这个“核心数据库”平台目前拥有3.5亿个用户关系,且这一数据正在不断地增加,同时,海银资本与清华大学、成都电子科技大学等高校紧密合作,保证人才补给和技术的前沿。
另外,海银资本的每一支团队也都在自己领域内独立或与相关专家合作进行深入研发,研发的部分成果将不断充实“核心数据库”。
据介绍,“核心数据库”的数据最初是由海银资本的10多个创业团队非常辛苦地从互联网上“扒”出来的,并相应地打上了“标签”。“我们现在能直接从这些已经被打过标签的数据池里,根据自己的需要做二次开发,根据自己的产品特征,打上更细致的标签。”刘晗表示,团队中每个兄弟公司都会无私地拿出自己的数据,供其他成员使用。这些累积起来的数据就非常多了,大家都不用重复费劲地“扒拉”数据了,既节省了时间,也能省出不少费用。
对于像刘晗一样基于大数据创业的初创企业来说,这一“核心数据库”平台无疑比真金白银还重要,因为数据量越大,数据挖掘和分析结果就越准确。“虽然公司成立不久,但我们预计今年可以实现收支平衡,明年收入可以破一千万元。”刘晗充满信心地对记者说。
据介绍,数影视讯目前承接的业务已经从影片票房的预测宣传,延伸到了前端的剧本评估与演员选择,以及后端的电影衍生品与演员广告效应等分析,今后还要进军电视剧行业。刘晗表示,机会合适的时候,公司将对影视剧直接投资。
大数据浪潮中北京与硅谷没有差距
海银资本合伙人吴晓梅很清楚产业投资,特别是天使投资这种中早期投资的巨大风险,“天使投资这种前期投资,成功率低、缺乏成熟的评估指标,也最花心思,往往都是很多人不愿意做的,但是对创业者来说是最有价值的。”
吴晓梅说,但是,用海银资本多年来积累的产品经验、人脉去帮助创业者,与所有初创企业共同成长,是海银资本的职责所在。她深知,这些创业团队核心成员都是技术出身,在管理方面还有许多需要学习的地方,同时,他们都来自硅谷等海外各地,见识广、有才能,但对国内的创业环境并不熟悉,创业初期的支持尤其重要。
“对入驻的企业,我们平均每周组织两次培训,一次主要是请清华大学等院校的教师对团队成员进行技术性培训,另一次主要是请一些成功企业家、管理者分享自己的实践经验。同时,我们还为他们提供投融资、宣传、工商税务登记、法律咨询、人员招聘等方面的孵化服务。”吴晓梅说。
海银资本还依托中关村海淀园的“雏鹰人才创业基地”,为这些大数据创业公司提供空间支撑。“雏鹰人才工程是中关村针对海内外优秀创业人才推出的创业扶持工程。经认定的雏鹰人才可获得创业启动资金支持,并能优先入驻雏鹰人才创业基地,享受不超过100平方米的办公用房租金补贴。”中关村园区管委会人才处的工作人员李欢欢表示。
吴晓梅认为,天使投资的关键是要会判断产业趋势。她表示,海银资本投资的初创企业目前发展势头都不错。海银资本投资的新影数讯、比邻弘科、音贝网等16家初创期企业,分别通过微博、微信等社交网络平台,分析网友喜欢什么音乐、看过哪些电影、喜欢什么美食等行为,再通过创建商业模式来获取商机。
根据Wikibon的调查,2012年全球大数据市场总额为114亿美元,2013年将达到181亿美元,2017年将达到470亿美元。在2012至2017年,大数据市场将以年均31%的速度增长。
“大数据不仅改变了营商的模式,也将改变人们的生活。”易观国际大数据高级分析师黄萌表示,如果我国大数据流动起来,尤其是跨界流动,将会为市民带来更多的便利,如医疗卫生领域,可以让全国的医院实现诊疗信息互联互通,并通过深度解读这些数据,让医生根据病人的饮食、家族史和每天的运动量,预测未来疾病的风险。同时,可很好实现远程会诊,让市民在家里和不同城市都能看病。同样,在交通领域,如果把地理信息、监控录像、路况信息等数据进行整合分析,能降低汽车发生事故的几率。
“‘大数据’时代的到来,将使中国本土创业企业掀起新一轮创业风潮,在大数据的浪潮中,北京与硅谷没有差距。”采访中,几乎所有的大数据创业者都这样认为。
吴晓梅认为,“虽然现在他们的体量还很小,但下一个腾讯,甚至下一个Google极有可能在他们中间诞生。”