为什么说《纸牌屋关于中国》的播出成为美国推动大数据认知度的重大事件

去年英国华威商学院和美国波士頓大学物理系的研究发现用户通过谷歌搜索的金融关键词或许可以金融市场的走向,相应的投资战略收益高达326%此前则有专家尝试通过Twitter博文情绪来预测股市波动。

理论上来讲股市预测更加适合美国中国股票市场无法做到双向盈利,只有股票涨才能盈利这会吸引一些游資利用信息不对称等情况人为改变股票市场规律,因此中国股市没有相对稳定的规律则很难被预测且一些对结果产生决定性影响的变量數据根本无法被监控。

目前美国已经有许多对冲基金采用大数据技术进行投资,并且收获甚丰中国的中证广发百度百发100指数基金(下稱百发100),上线四个多月以来已上涨68%

和传统量化投资类似,大数据投资也是依靠模型但模型里的数据变量几何倍地增加了,在原有的金融结构化数据基础上增加了社交言论、地理信息、卫星监测等非结构化数据,并且将这些非结构化数据进行量化从而让模型可以吸收。

由于大数据模型对成本要求极高业内人士认为,大数据将成为共享平台化的服务数据和技术相当于食材和锅,基金经理和分析师鈳以通过平台制作自己的策略

K最近邻算法。给定一些已经训练好的数据输入一个新的测试数据点,计算包含于此测试数据点的最近的點的分类情况哪个分类的类型占多数,则此测试点的分类与此相同所以在这里,有的时候可以复制不同的分类点不同的权重。近的点的權重大点远的点自然就小点。

朴素贝叶斯算法朴素贝叶斯算法是贝叶斯算法里面一种比较简单的分类算法,用到了一个比较重要的贝葉斯定理用一句简单的话概括就是条件概率的相互转换推导。

朴素贝叶斯分类是一种十分简单的分类算法叫它朴素贝叶斯分类是因为這种方法的思想真的很朴素,朴素贝叶斯的思想基础是这样的:对于给出的待分类项求解在此项出现的条件下各个类别出现的概率,哪個最大就认为此待分类项属于哪个类别。通俗来说就好比这么个道理,你在街上看到一个黑人我问你你猜这哥们哪里来的,你十有仈九猜非洲为什么呢?因为黑人中非洲人的比率最高当然人家也可能是美洲人或亚洲人,但在没有其它可用信息下我们会选择条件概率最大的类别,这就是朴素贝叶斯的思想基础

支持向量机算法。支持向量机算法是一种对线性和非线性数据进行分类的方法非线性數据进行分类的时候可以通过核函数转为线性的情况再处理。其中的一个关键的步骤是搜索最大边缘超平面

Apriori算法是关联规则挖掘算法,通过连接和剪枝运算挖掘出频繁项集然后根据频繁项集得到关联规则,关联规则的导出需要满足最小置信度的要求

网页重要性/排名算法。PageRank算法最早产生于Google,核心思想是通过网页的入链数作为一个网页好快的判定标准如果1个网页内部包含了多个指向外部的链接,则PR值将会被均分PageRank算法也会遭到LinkSpan攻击。

随机森林算法算法思想是决策树+boosting.决策树采用的是CART分类回归数,通过组合各个决策树的弱分类器,构成一个最终嘚强分类器,在构造决策树的时候采取随机数量的样本数和随机的部分属性进行子决策树的构建,避免了过分拟合的现象发生。

“神经网络”這个词实际是来自于生物学而我们所指的神经网络正确的名称应该是“人工神经网络(ANNs)”。

人工神经网络也具有初步的自适应与自组織能力在学习或训练过程中改变突触权重值,以适应周围环境的要求同一网络因学习方式及内容不同可具有不同的功能。人工神经网絡是一个具有学习能力的系统可以发展知识,以致超过设计者原有的知识水平通常,它的学习训练方式可分为两种一种是有监督或稱有导师的学习,这时利用给定的样本标准进行分类或模仿;另一种是无监督学习或称无为导师学习这时,只规定学习方式或某些规则则具体的学习内容随系统所处环境 (即输入信号情况)而异,系统可以自动发现环境特征和规律性具有更近似人脑的功能。

“啤酒与尿布”的故事产生于20世纪90年代的美国沃尔玛超市中沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定嘚情况下,“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中这种独特的销售现象引起了管理人员的注意,經过后续调查发现这种现象出现在年轻的父亲身上。

在美国有婴儿的家庭中一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿咘父亲在购买尿布的同时,往往会顺便为自己购买啤酒这样就会出现啤酒与尿布这两件看上去不相干的商品经常会出现在同一个购物籃的现象。如果这个年轻的父亲在卖场只能买到两件商品之一则他很有可能会放弃购物而到另一家商店, 直到可以一次同时买到啤酒与尿布为止沃尔玛发现了这一独特的现象,开始在卖场尝试将啤酒与尿布摆放在相同的区域让年轻的父亲可以同时找到这两件商品,并佷快地完成购物;而沃尔玛超市也可以让这些客户一次购买两件商品、而不是一件从而获得了很好的商品销售收入,这就是“啤酒与尿咘” 故事的由来

当然“啤酒与尿布”的故事必须具有技术方面的支持。1993年美国学者Agrawal提出通过分析购物篮中的商品集合从而找出商品之間关联关系的关联算法,并根据商品之间的关系找出客户的购买行为。艾格拉沃从数学及计算机算法角度提 出了商品关联关系的计算方法——Aprior算法沃尔玛从上个世纪 90 年代尝试将 Aprior算法引入到 POS机数据分析中,并获得了成功于是产生了“啤酒与尿布”的故事。

外汇短线高频茭易密训班 ---手把手实战培训

培训时间:2天封闭训练

培训时间:7月7日-上午9:00至7月8日下午17:00

复训时间:每个月4天(提供公寓住宿)

外汇市场上主要交易方式

剥头皮交易法的定义、特点

短线高频交易法实战交易记录剖析

EA历史回测和参数优化

EA实战使用中如何提升收益……

6.2 数据分析帮助辛辛那提动物园提高客户满意度

辛辛那提动植物园成立于1873年是世界上著名的动植物园之一,以其物种保护和保存以及高成活率繁殖饲養计划享有极高声誉它占地面积71英亩,园内有500种动物和3000多种植物是国内游客人数最多的动植物园之一,曾荣获Zagat十佳动物园并被《父毋》(Parent)杂志评为最受儿童喜欢的动物园,每年接待游客130多万人

辛辛那提动植物园是一个非营利性组织,是俄亥州同时也是美国国内享受公共补贴最低的动植物园除去政府补贴,2600万美元年度预算中自筹资金部分达到三分之二以上。为此需要不断地寻求增加收入。而偠做到这一点最好办法是为工作人员和游客提供更好的服务,提高游览率从而实现动植物园与客户和纳税人的双赢。

  • 借助于该方案强夶的收集和处理能力、互联能力、分析能力以及随之带来的洞察力在部署后,企业实现了以下各方面的受益:

  • 帮助动植物园了解每个客戶浏览、使用和消费模式根据时间和地理分布情况采取相应的措施改善游客体验,同时实现营业收入最大化

  • 根据消费和游览行为对动植物园游客进行细分,针对每一类细分游客开展营销和促销活动显著提高忠诚度和客户保有量。.

  • 识别消费支出低的游客针对他们发送具有战略性的直寄广告,同时通过具有创意性的营销和激励计划奖励忠诚客户

  • 360度全方位了解客户行为,优化营销决策实施解决方案后頭一年节省40,000多美元营销成本,同时强化了可测量的结果

  • 采用地理分析显示大量未实现预期结果的促销和折扣计划,重新部署资源支持产絀率更高的业务活动动植物园每年节省100,000多美元。

  • 通过强化营销提高整体游览率2011年至少新增50,000人次“游览”。

  • 提供洞察结果强化运营管理例如,即将关门前冰激淋销售出现高潮动植物园决定延长冰激淋摊位营业时间,直到关门为止这一措施夏季每天可增加2,000美元收入。

  • 與上年相比餐饮销售增加30.7%,零售销售增加5.9%

  • 动植物园高层管理团队可以制定更好的决策,不需要 IT 介入或提供支持

  • 将分析引入会议室,利用直观工具帮助业务人员掌握数据

借助于该方案强大的收集和处理能力、互联能力、分析能力以及随之带来的洞察力,在部署后企業实现了以下各方面的受益:

帮助动植物园了解每个客户浏览、使用和消费模式,根据时间和地理分布情况采取相应的措施改善游客体验同时实现营业收入最大化。

根据消费和游览行为对动植物园游客进行细分针对每一类细分游客开展营销和促销活动,显著提高忠诚度囷客户保有量.

识别消费支出低的游客,针对他们发送具有战略性的直寄广告同时通过具有创意性的营销和激励计划奖励忠诚客户。

360度铨方位了解客户行为优化营销决策,实施解决方案后头一年节省40,000多美元营销成本同时强化了可测量的结果。

采用地理分析显示大量未實现预期结果的促销和折扣计划重新部署资源支持产出率更高的业务活动,动植物园每年节省100,000多美元

通过强化营销提高整体游览率,2011姩至少新增50,000人次“游览”

提供洞察结果强化运营管理。例如即将关门前冰激淋销售出现高潮,动植物园决定延长冰激淋摊位营业时间直到关门为止。这一措施夏季每天可增加2,000美元收入

与上年相比,餐饮销售增加30.7%零售销售增加5.9%。

动植物园高层管理团队可以制定更好嘚决策不需要 IT 介入或提供支持。

将分析引入会议室利用直观工具帮助业务人员掌握数据。

6.3 云南昭通警察打中学生事件舆情分析

5月20日囿网友在微博上爆料称:云南昭通鲁甸二中初二学生孔德政,对着3名到该校出警并准备上车返回的警察说了一句“打电话那个下来”,車内的两名警员听到动静后下来追到该学生后就是一顿拳打脚踢。

5月26日昭通市鲁甸县公安局新闻办回应此事:鲁甸县公安局已对当事囻警停止执行职务,对殴打学生的两名协警作出辞退处理并将根据调查情况依法依规作进一步处理。同时鲁甸县公安局将加大队伍教育管理力度,坚决防止此类事件的再次发生

5月26日,事件的舆情热度急剧上升媒体报道内容侧重于“班主任称此学生平时爱起哄学习成績差”“被打学生的同学去派出所讨说法”“学校要求学生删除照片”等方面,而学校要求删除图片等行为的曝光让事件舆情有扩大化趋勢

5月26日晚间,新华网发布新闻《警方回应“云南一学生遭2名警察暴打”:民警停职协警辞退》中央主流网络媒体公布官方处置结果,網易、新浪、腾讯等门户网站予以转发从而让官方的处置得以较大范围传播。

昭通警察打中学生事件舆论关注度走势(抽样条数:290条)

“警察打学生而且有图有真相,在事发5天后昭通市鲁甸县警方最终还是站在了舆论的风口浪尖。事发后当地官方积极回应并于5月26日將涉事人予以处理,果断的责任切割较为有效地抚平了舆论情绪从而较好地化解了此次舆论危机。

从事件的传播来看事发时间是5月20日,舆论热议则出现在25日4天的平静期让鲁甸警方想当然地以为事件就此了结,或许当事人都已淡忘此事如果不是云南当地活跃网友“直播云南”于5月25日发布关于此事的消息,并被当地传统媒体《生活新报》关注的话事情或许真的就此结束,然而舆情发展不允许假设的存茬这一点,至少给我们以警示对微博等自媒体平台上的负面信息要实时监测,对普通草根要监测对本地实名认证的活跃网友更需监測。从某种角度看本地实名认证的网友是更为强大的“舆论发动机”,负面消息一旦经他们发布或者转发所带来的传播和形成的舆论壓力更大。

在此事件中校方也扮演着极为重要的角色。无论是被打学生的班主任还是学校层面,面对此事件的回应都欠妥当学校层媔的“删除照片”等指示极易招致网友和学生的反感,在此反感情绪下只会加剧学生传播事件的冲动。班主任口中该学生“学习不好、愛起哄”等负面印象被理解成“该学生活该被打”在教师整体形象不佳的背景下,班主任的这些言论是责任感缺失的一种体现校方和癍主任的不恰当行为让事件处置难度和舆论引导难度明显增加,实在不该——人民网舆情监测室主任舆情分析师

【宽客网络课堂】石破忝惊之作:可量化的期货基本面策略

本课程为台湾著名专家林洸兴先生的倾力之作。与目前市场上大多数泛泛而论的期货分析课程不同“深刻”、“逻辑”两个词可以概括本课程的特点。结合量化的需求与特点林先生特意在本系列课程中将可量化的基本面因素提炼出来講述。从这样一个独特的角度讲解期货策略相信本课程是一个石破天惊的课程。

}


  《时代周刊》为了选不选斯諾登做2013年度封面犹豫了很久而大数据时代的到来已无需纠结。

  从2013年6月初斯诺登揭发的“棱镜门”事件,到九大互联网巨头卷入美國监控全球互联网计划再到斯诺登到寻求避难,最后到美国政府斡旋大数据监控是为了所谓的“反恐”这个通过分析海量通讯数据获取安全情报的大数据案例,让围绕大数据的话题与反思不断发酵也让2013被称为“大数据元年”。

  从可以自动转弯和刹车的汽车到IBM沃森超级电脑在游戏节目《危险边缘》中打败人类,这项技术终将改变我们所居住的星球上的生活与生意

  一位居住在纽约布鲁克林的軟件开发者 Federico Zannier“把自己卖了”,他通过发起“A bite of Me”项目不断收集自己所有的数字轨迹,并挂到网站上销售“那些公司在用我的数据赚钱,當你接受那些使用条款时你就已经把这些数据的使用权白送给他们了。”

  的确亚马逊监视着我们的购物习惯,谷歌监视着我们的網页浏览习惯而似乎什么都知道,不仅窃听到了我们心中的“TA”还有我们的社交关系网。

  大数据能够越来越精确地预测世界的事凊以及我们所处的位置我们却还没准备好接受它对我们的隐私和决策过程带来的影响。我们的认知和制度都还不习惯这样一个数据充裕嘚时代因为它们都建立在数据稀缺的基础之上。在大数据时代不管是告知与许可、模糊化还是匿名化,这三大隐私保护策略都失效了

  “斯诺登效应”还在继续,大数据时代的生存规则也将被每一个生产数据的你和我来书写

  2013大数据年度事件:棱镜门

  致我們无处安放的隐私

  “棱镜门”为人们反思大数据时代的个人隐私与公共安全提供了一个范本,斯诺登潜逃、引渡以及政治庇护这样的凊节增加了戏剧性却无碍于反思这个问题的内核。

  “谢谢你斯诺登!”临近感恩节,一个自由组织为感谢斯诺登公开美国监听秘密特地在华盛顿的一辆巴士上打出这样一幅致谢的广告。

  从2013年6月初斯诺登揭发美国的“棱镜门”事件,到九大互联网巨头卷入美國监控全球互联网计划再到斯诺登到俄寻求避难,最后到美国政府斡旋大数据监控是为了所谓的“反恐”从纯技术角度来看,“棱镜”是一个典型的通过分析海量通讯数据获取安全情报的大数据案例但它也引发一个重要的思考:大数据时代,个人隐私该何处安放

  根据斯诺登提供的信息,美国国家安局拥有的正是一套基于“大数据”的新型情报收集系统这套名为“无界爆料”的系统,以30天为周期可以从全球网络系统中接收到970亿条讯息,再通过比对或者通讯记录等方式能几近真实地还原个人的实时状况。

  “棱镜门”为人們反思大数据时代的个人隐私与公共安全提供了一个范本斯诺登潜逃、引渡以及政治庇护这样的情节增加了戏剧性,却无碍于反思这个問题的内核

  经过一段时间的辩论,斯诺登已经被“脸谱化”一方认为他是公众隐私权的捍卫者,是自由的守护者;一方认为他是叛国者是双面间谍,应该被引渡回国接受审判当更多的事实披露出来,谁是英雄谁是罪犯,也会慢慢浮出水面

  震惊源于“小數据”思维

  “大数据”基础已完备

  “斯诺登事件让我惊讶的不是‘棱镜’计划本身,而是如此众多的社会还是小数据’思维对這个计划如此惊讶。”这是《大数据时代》一书的作者之一迈尔?史恩伯格在香港大学的演讲中对此全球性事件的反应与感慨。

  的確对当今全球的绝大多数人而言,“大数据”还是个相当陌生的概念甚至还未曾听闻,事实上它已悄然而至从微观到宏观,从商业箌政治到军事铺天盖地,无所不在斯诺登揭露了“棱镜”,“棱镜”揭示了“大数据”

  就商业用途而言,今天的谷歌、微软、惠普等已完全可以通过它们掌握的数以百万计、千万计甚至亿计的数据,经由“超级计算”准确推断消费者的习惯、电影的票房、流感疫情的发展趋势。商业如此在政治、经济、军事等方面的用途和潜在利益当然也不遑多让。

  这就是“大数据时代”

  “大数據时代”建立在三个基础之上:一,数以亿计的人们无时无刻,不知不觉地在生产大量数据每一个人在每一时间每一地点,那怕是一個最不经意的微小行为就是一个数据。所以合起来,就是海量的数据二,数据虽已产生并存在除非把它“上穷碧落下黄泉”地全數搜集网罗起来,否则没有意义这就要靠像“棱镜”一样的网络技术。三最后一步,就是将海量的数据以超级快的速度加以归纳、计算与分析这就靠一代又一代推陈出新的超级计算机。第一个基础是从来就有的现在,加上了第二与第三我们就进入到了“大数据时玳”了。

  没有什么与隐私无关

  电子大学互联网科学中心主任曾经介绍过2013年公开的一项最新研究成果:某个手机用户只要曾出现在4個基站的服务区利用大数据模型,研究者就能把他从百万用户中区分出来识别他的身份,准确率为95%此文发表在《自然》出版集团的學术刊物《科学报告》上。

  结论就是别让我在4个基站看到你。

  周涛是畅销书《大数据时代》的中文译者他表示,大数据的“1.0蝂本”仅仅是分析那些与目标有直接相关性的数据但到“2.0版本”后,大数据更关心“数据的外化”也就是将更多看似无关的数据纳入視野。

  周涛本人也正研究如何通过大数据识别个人信息通过分析一个人某段时间的GPS定位数据,就能知道他的性取向:“瞒了家人几┿年的秘密也许一个手机软件就能出卖你。”

  无论是“4个基站”还是“手机与性取向”的研究,都表明一个事实:通常被认为与隱私无甚关联的信息在大数据时代都将发生质变。周涛透露国外科学家已经建立了模型,通过分析人们在Facebook上的行为也能判断他的性取向,所需要的只是用户添加的“喜欢”或“不喜欢”标签大约需要100个。

  周涛强调他的研究被置于严格的监管之下,而且是基于哃性恋者自愿提供的信息并不侵犯隐私。但是否每个大数据从业者都如此遵守规则

  北京邮电大学管理学院教授万岩说,她曾对自巳的学生做了一个问卷:公开自己的信息从而得到更有针对性的营销或是严格保护隐私但必须自己动手搜索商品,你会选哪一个学生們的回答大致是50:50。

  普通人对网络隐私的态度也许还很有宽容度,他们必须接受或者说忍受一个事实――大数据时代,人就是透明嘚

  正如《纽约时报》所说,斯诺登是一个时代的开始因为他使人们看到了,像美国这样拥有世界上最强大的科技和情报能力的一個国家他们会以什么样的方式来窃取全世界的情报。

  你现在的生活24小时

  被大数据改变的生活图景

  尽管我们仍处于大数据時代来临的前夕,但我们的日常生活已经离不开它了

  垃圾邮件过滤器可以自动过滤垃圾邮件,尽管它并不知道“发#票#销#售”是“发票销售”的一种变体;交友网站根据个人的性格与之前成功配对的情侣之间的关联来进行新的配对;具有“自动改正”功能的智能手机通過分析我们以前的输入将个性化的新单词添加到手机词典里。

  然而对这些数据的利用还仅仅只是一个开始。从可以自动转弯和刹車的汽车到IBM沃森超级电脑在游戏节目《危险边缘》中打败人类来看,这项技术终将改变我们所居住的星球上的许多东西

  Joan的工作日誌

  Joan是一位生活在北京的职场新人。早晨起床时她睁开眼第一件事就是从床边抓起智能手机,关掉闹钟这是第一个能叫醒她的闹钟Sleep cycle,睡前要把手机扣在枕头旁它会记录你的上床时间、各个时间段的睡眠质量,甚至几点做了梦它不一定准时在你设定的时间响起,而昰提前半小时开始感知发现你进入浅睡眠的时候,它就会响铃

  查看了自己近一个月的睡眠记录表,比上个月好了一些Joan又刷新了郵箱,看看公司有没有发来新的电子邮件邮件倒是没有,但她发现微信里多了一些信息她的几个姐妹相约今晚一起去美食节目《美食哋图》推荐的餐厅。

  餐厅的名字有点耳熟Joan想起曾经在大众点评看到过人们的评价,环境、服务、气氛都拿到5颗星但最重要的食物ロ味似乎不太让人满意。

  Joan把自己的想法告诉姐妹们大家或许会换另一家餐厅。然后她起床梳洗带上Nike+手环,穿上跑步鞋准备到社區旁的公园慢跑,享受清晨的阳光她打开手机天气,PM2.5只有78是北京难得的好天气,Joan的心情一下子也明媚起来

  回到家,手环自动把紦她今天跑步的里程、时间、消耗的能量等信息输入系统系统根据耐克社区用户的数据告诉她达到了默认目标。她很开心地把结果分享茬微博上顺便看看朋友们都在忙什么。

  7点半手机上的拼车App提示她距离出发时间还有5分钟,她拿上东西匆匆出门和另外两个邻居┅同前往上班地点。这两位邻居也是在拼车网站上认识的现在他们成了好朋友。在车上闲聊一位邻居说他准备去北欧旅行,通过蚂蜂窩App下载了很多攻略在淘宝浏览雪山需要的装备,这些天无论手机还是电脑关于机票特价、酒店预订、滑雪装备的广告都多了起来。

  到了公司Joan打开网页,百度个性化首页根据她的浏览兴趣只推送了科技、财经、时尚等几个频道的新闻微信忽然响起,是一位台湾的愙户着急地说Joan公司的一个设计出了问题,Joan在公司的IBM Notes中寻找相关的记录文件并立刻反馈给了客户。

  好不容易熬到中午Joan来到楼下的賽百味,结账时把美团发来的团购号码出示给服务员在角落坐下来,边用Kindles看书边嚼着三明治。

  Kevin的商务随行

  午餐结束回到办公室Joan收到了新的工作订单,要为客户设计网站这时,她找到了位于(,)的IT服务商与她接洽的Kevin迅速提供了公司介绍和服务项目,开始了两个公司的对接和谈判

  Kevin计划两天后去美国参加苹果开发者大会,现在有点担心出差会影响到新客户的谈判几经沟通后,Kevin和Joan敲定了项目啟动会的时间已经订好机票的Kevin只好通过携程完成了改签。

  已经3点半了Kevin终于有时间看看今天的股市。他开通了“银证通”为此还給他一定的佣金优惠。在互联网圈待了十几年Kevin感觉到身边的一切都在进行着数字化的改变,从门户到搜索从电商到,互联网会席卷每┅个行业几个月之前,他还认为与银行、券商的合作仅仅是IT层面的网站搭建没想到现在客户已经提出了构建互联网金融服务平台的需求。

  除了股票Kevin还在人人贷上把一部分存款投给了一家浙江的电商,他考察过这商的信用信誉良好,这种P2P的模式也是他在美国时就知道的

  妻子把活期账户里的存款转到余额宝的时候,Kevin还因为货币基金的收益率嘲笑她现在每天查看收益已经成了妻子的固定动作。不仅如此从不关心理财产品的她开始询问他基金、的事情,Kevin倒是有点担心自己的财政大权要转到妻子手里了

  电脑提示,距离另┅场客户沟通会还有1个小时地点是他没有去过的酒店。打开高德地图选择了系统推荐的最通畅的路线,同步到车里的GPS导航Kevin匆匆走到停车场。GPS导航已经在他同步的时候自动开启了

  走进会场,Kevin把电脑连到幻灯机上他没有带任何存储设备,而是打开思杰的ShareFile之前准備的PPT就呈现出来了。就在他们开会的时候客户的部门负责人不在现场,网络会议让他如临现场没有错过任何细节。

  完成一天的工莋Kevin准备回家了。今天妻子不在家但Kevin还是能享受到进门就有热水的好生活,他打开海尔物联网App选择“一键回家”,家里的热水器、空調自动开启

  此时Joan正和姐妹们享受happy hour,她们果然换了另一家点评网站上得到5星推荐的餐厅到达饭店的时候,门口围着许多排队等位的吃客Joan报上了自己的电话号码,服务员立刻将她们引到预订的位置她们从等位的人群中潇洒地穿过,似乎感觉到自己被羡慕嫉妒恨的眼咣环绕

  坐下来的姐妹们依然各自面对着自己的手机,有的在刷朋友圈有的在看其他网友的推荐菜,其中一位发现在街旁上签到之後她们就能享受9折优惠Joan并不喜欢这样,朋友面对面坐着眼睛还是离不开那一方窄窄的屏幕。她感叹:人世间最远的距离不是我爱你而伱不知道而是我们坐在一起看自己的手机。

  直到第一道菜上桌朋友们才算正式开始了今晚的聚会。

  “你的包很漂亮新买的嗎?”

  “双十一扫的太可怕了,我没熬到12点凌晨4点钟醒来发现购物车里的东西都改成‘商品不存在’了,已经被哄抢一空了你懂嗎还好我又翻到了这款5折的包。”

  餐桌上的话题总是离不开购物聊起来Joan忽然意识到,除了吃饭之外姐妹们已经很少聚在一起了,以前还常常约着去逛街现在这项活动好像消失了。

  “很久没去KTV了吃晚饭一起吧。”Joan提议

  “算了吧,这个时间包房没有优惠咱俩唱吧上PK吧。”

  说起唱吧Joan的微博上常常有朋友发来自己录制的作品,还有朋友邀请她一起对唱但她总感觉没有在KTV过瘾。

  夜生活还是结束在吃饭上了Joan虽然有些意犹未尽,奈何自己的提议总是得不到附和9点钟在商业区打车总是要迎风等上半天。Joan打开嘀嘀咑车1公里之内的空车只有寥寥四五辆,语音输入自己想去的地方很快便收到了系统回复,500米以内的一辆出租车接下了订单

  Joan和顺蕗的一位姐妹上了同一辆出租车,司机先后把她们送到家Joan把今晚包括吃饭、打车在内的费用记录在AA账本里,每个人要给她多少钱一目了嘫她把结果发送到朋友们的微信上,很快便收到了朋友在支付上转过来的钱

  支付宝上又有钱了,Joan习惯性地打开了淘宝朋友双十┅买的包都已经背上了,她买的衣服才刚刚发货双十一真是伤不起。正抱怨时她发现夹多了些功能,按住一个商品可以查看“相似款”和“搭配款”。这个小发现够她兴奋很久了女人的衣柜里少的不止一件衣服,她把还在运输途中的两件衣服放进收藏夹了查看了幾十款搭配商品,“淘宝是一种病”Joan已经感染了。

  梳洗后上了床Joan打开网站,发现《纸牌屋关于中国》第二季放出了明年上映的消息那一点点睡意又一去无踪了。

  只有看书才能让她安静下来她习惯了看着书睡去,但是家里的书架很久没有摆上过新书了自从買下Kindle,想看任何一本书的时候她首先想到的都是去看看有没有电子书

  今天她打开了《大数据时代》,书里说:“我们时刻都暴露在‘第三只眼’之下:亚马逊监视着我们的购物习惯谷歌监视着我们的网页浏览习惯,而微博似乎什么都知道不仅窃听到了我们心中的‘TA’,还有我们的社交关系网”

  思杰大中华区总裁曹衡康

  无论何时何地,曹衡康都能调出工作用的数据快速、便捷、安全地办公碎片化时间一点也不浪费,因为数据跟他走

  这是一个普通的假日。曹衡康正带着家人在上海郊区休假突然接到了秘书的电话。公司总部的一个副总裁10月8日要来中国但临时发现签证已过期,需要中国这边出具邀请函重新办理签证

  身为思杰大中华区的总裁,曹衡康休假期间从哪里去调邀请函签字呢当时已经是10月4日,时间紧急否则对方赶不过来,很多客户的会议时间都要重新调整曹衡康不慌不忙地打开智能手机,通过公司的桌面虚拟系统接到公司自己电脑的云存储里把邀请函调出来打开,远端签字然后直接把签完嘚邀请函从云存储上用电子邮件发给了那个副总裁。

  不用回办公室不用找电脑,不需要下载下来更不需要手写签字、传真,几分鍾内问题得到了解决曹衡康的办公生活往往就是在“指尖”下的手机、平板中进行的。

  “我在哪里数据就在哪里,数据跟我走”曹衡康说,无论在家还是在车上,或者是等飞机的候机大厅、酒店里无论是用手边的平板电脑、笔记本或是智能手机,他都能调出笁作用的数据快速、高效、便捷、安全地办公随时随地都可以进入工作模式,碎片化时间一点也不浪费

  他的工作体验正在变得普遍。IDC的预测显示2015年前亚太区(不含日本)的8亿3870万员工将实现移动办公。大数据在提升移动信息化办公及管理领域里的重要性将更加凸显人们使用云端的数据将越来越像水、电一样方便。

  移动达人的碎片时间

  曹衡康最爱移动办公不仅仅是因为他服务的思杰Citrix在全浗致力于实现安全移动办公和云服务,更是因为他切身实实在在地体验着移动办公数据跟人走的便捷

  有时他会选择在家里上班。当尛孩生病的时候曹衡康会陪伴在身边。“小孩可能在旁边床上睡觉你只要观察他,他的烧有没有退下去有没有别的问题等,你的工莋可以不受影响”曹衡康说,许多小孩在5岁之前经常会有小毛病当孩子不舒服的时候,他和员工们就选择在家上班通过互联网就可鉯截取公司电脑里的数据进行操作。

  个人电脑的空间毕竟有限数据就存放在他们公司内部的磁盘再放入云存储。这样无论在哪里,曹衡康可以随时享用数据处理工作。堵车的路上等候飞机的时候,他都可以充分利用起来办公“你在外面用平板所拿到的数据跟洎己在公司是一模一样的,你的数据随你而行跟你一起走。”曹衡康说

  随时随地可以享用办公数据,对于他来说这意味着更加精细化的时间管理。每天上班前就可以把昨天总部新发生的事情处理完并把等待的时间利用起来,最后也许会有一整晚的工夫陪家人或散步“数据跟我走”优化的是时间资源分配。

  “数据跟我走”同时也意味着海量的数据这个移动达人的碎片化时间里,享有的数據更多更便捷

  因为他的移动办公并不是一般人所理解的是仅随处收发电子邮件,用Dropbox、印象笔记同步编辑文件或者开视频(电话)会議通过思杰的虚拟化技术,曹衡康实现的是真正桌面化的移动办公而真正的工作是不可能脱离桌面的。

  那么遇到视频(电话)會议要演示PPT怎么办?能闻其声或者见其人,但如何看到对方的详细演示情况并做沟通呢

  曹衡康毫不担心。作为思杰的中国大中华區负责人他经常会有很多的会议。思杰目前有近10个分公司在全国各地大家都时间一到就开始GoToMeeting。曹衡康能随时随地通过思杰的软件远程播放PPT去跟他们沟通

  他每个月会告诉员工们,公司目前最近发生什么事情我们的作用在哪里。同时他也及时听取各个部门主管汇报凊况一切都可以远程完成。由于后台大数据的强有力支持移动协同办公更便捷,效率更高

  飞行达人的“他设备”

  “糟糕,筆记本Wi-Fi出了故障”正在机场启动办公模式的曹衡康面临了新问题。

  这又要如何移动办公呢就在刚才,曹衡康接到了公司财务打来嘚电话提醒他本月要完成员工加薪的年度考评。本来这是要回国后做的但他发现接下来的日程已经排得满满当当。当得知从希腊回国嘚飞机晚点5小时的消息后他便开始准备调配跟自己走的数据了。

  自己的设备出了问题曹衡康于是借到了太太的iPad远程登录到公司内蔀系统,调出调薪的员工的考勤和绩效在接下来的时间里完成了考评的任务。

  即使是用别人的电脑他也毫不担心数据的安全性问題。曹衡康很是自豪

  很多人担心移动办公时数据所潜藏的安全“炸弹”。比如可能会担心当自己在手机上修改数据时也许会误发給陌生人或在某一刻丢失手机。但思杰的办公系统不用顾忌这些问题因为所有的工作数据都不能被下载到设备上,都是在云上面处理

  “有人说那我不带走,但是我可以在中间看到一些情况抄录走”曹衡康继续解疑,事后审计可以解决这一问题事实上思杰已经把這个人一天操作的情况过程测录了下来。

  实际上思杰的客户遍及医疗、学校、制造工业等行业,许多行业都是要对安全性要求极高嘚思杰从一开始就践行的就是“安全”。曹衡康说:“安全正是我们过去二十几年来的核心价值”通过思杰的技术,用户可以选择保存数据的位置制定并管理分区,这样既能保障安全也能做到性能优化。当大数据时代人们普遍担心自己信息安全问题时这其实对曹衡康和思杰都意味着机遇。

  机遇越大挑战越大他也越忙碌。由于每周都要出差这个飞行达人就常在飞机场等飞机的时候处理很多倳情。他总是要求自己把工作在一定时间完成在对的时间做对的事。如果当时从希腊度假回来事情他无法在机场做完如果借用他人的設备不能保障安全性,那势必意味着那个周末回到家再工作

  而安全的移动办公就解决了一切问题。安全感也是幸福感言及此,曹衡康的语气里透着强烈的幸福感“能够让大家在用大数据时既便捷又安全,这是我们公司提供的方案能够帮忙的地方安全,也是方便嘚移动数据” 曹衡康很乐见大数据的时代到来。事实上提供完整的安全数据共享服务,即“follow-me-data”(数据跟我走)也正是他和思杰所倡导嘚数据正是他所在的公司非常重要的战略组成部分,是实现未来移动战略的关键

  大数据时代下的气象服务是什么样子?在看得见嘚未来融入地理信息、社会经济等多维度数据,能够让人们知道下一刻哪里可能会发生什么比如这阵风是否会吹翻门口的广告牌,前媔一个高速路口是不是在下雨堵车

  即将过去的2013年,“雾霾”几乎成为许多都市人最扰心的一个热词在北京,政府甚至不得不以工哋停工、公车停驶、工厂停产等种种措施尽力减少各种污染物的排放。

  十面“霾”伏的敌人来自何方?大数据时代的到来或许可以寻根溯源,因为它能帮助人们更准确地了解、判断生存环境中最重要的一面――空气质量

  未来大数据的价值核心在于预测。中科大信息科学技术学院院长李卫平介绍中科大先进技术研究院中正在进行着一项科研,通过收集和分析雾霾天气产生的各种数据找到产生雾霾忝气最主要的原因。“这是一些看上去杂乱无章的数据我们建立一个大数据库,从中找寻规律性的东西”这个科研项目与微软合作,┅旦找到其中规律有望为政府治理雾霾天气提供科学依据。

  2013年10月30日在微软亚洲研究院创新日上透露的一种新技术,试图让人们了解所在地区空气质量的真实情况在此基础上,人们就能做出更明智且更有利于健康的决策例如何时何地最适合户外运动,或者何时应戴上口罩或关上窗户

  “这些工作都是在大数据的基础上才能够进行,无论模式如何先进没有海量的数据进入,都不能达到很好的效果”中国气象局公共气象服务中心高级工程师唐千红说。

  在大数据时代数据并非单纯指人们在互联网上发布的信息。全世界的笁业设备、汽车、电表上有着无数的传感器随时测量和传递着有关位置、温度、湿度乃至空气中化学物质的变化。

  微软根据现有监測站所提供的空气质量数据以及城市里的其他多种数据来源(包括气象情况、交通流量、人员流动趋向、路网结构、人口集中点等)运鼡数据挖掘和机器学习技术,对大数据加以充分利用并在监测信息和对应结果之间建立一个隐式映射,从而可以实时推断出包含细颗粒粅信息的城市空气质量数据

  大数据时代下的气象服务是什么样子?唐千红认为在看得见的未来,融入了地理信息、社会经济数据嘚气象服务能够让人们知道任意时间地点可能会发生什么,例如这阵风是否会吹翻门口的广告牌前面一个高速路口是不是在下雨、会鈈会发生山洪。

  其实大数据就在脚下尽管很多时候我们没有意识到。

  全球的数据量正在以每18个月翻一倍的惊人速度增长世界囸在高速数字化。事实上从城市交通到空气质量,从建筑设计到影视制作大数据分析应用已经渗透到生活的面面。大数据到底怎样改變了人们的生活轨迹为此我们采访了微软研究院院长Peter Lee、微软亚洲研究院院长洪小文、微软全球资深副总裁周以真,揭开大数据的神秘面紗

  数字商业时代:什么是大数据与机器学习?这一技术的商业应用前景如何

  洪小文:我常常举一个例子,譬如说你妈妈明天偠来北京看你她在邮件里告诉你航班的号码,明天下午5点钟会到可是你那天下午在开会,三四点的时候计算机就自动把邮件里面的航癍号码抽出来自己去航空公司的网站一查,告诉你班机晚点要7点才来。而且它还会根据交通状况决定什么时候通知你出发以什么方式出发。它可以建议你坐出租车、坐地铁要多少分钟甚至可以在你的社交网络里找到附近的朋友开车来载你。

  这些自动化都可以做嘚到但是今天还没有这样的系统和服务,所以就只能隔几分钟看一看很浪费时间,而且在很多场合不允许这样的东西其实是大数据與机器学习的表征,需要很多不同种类的数据有邮件的数据、地图的数据、飞机的数据、交通的数据。大数据不仅是大还要有多样性囷集成性。

  大数据还应用在其他方面比如报刊杂志上的文章到底有多少人看,大家有什么评价转发给谁。以前这些东西可能要做問卷才能得到今天通过互联网更有机会获取。如果搜集的大数据都是零散的、繁杂的你怎么去看?这就需要数据可视化这一点对管悝者非常重要。管理者在做一个决定之前想看看这个东西在某一个区域大家的反应会怎么样,调出来一看就知道

  大数据与机器学習真的是在每一个行业都有类似的应用。

  数字商业时代:有人说大数据与云计算是一个问题的两面,云计算是支撑大数据时代的基礎但当大数据和云计算真正落地,或是走向消费者的过程中遇到的障碍和挑战有哪些

  周以真:实际上,普通用户已经享受到很多夶数据和云计算所带来的利益和好处只是我们并没有清晰地意识到而已。比如用Windows Phone进行文字输入输入前一个字,就会有下一个字或词汇嘚提示联想或者用手机或PC收发邮件时,垃圾邮件的过滤功能这些都是集成大数据和机器学习的技术才能得以实现。

  类似的应用无處不在甚至可能存在的地方太多了,我们都已经忽略它了

  另外一个典型的例子是关于云。比如我们把手机上的照片存储在云端即使手机丢失再换一个新的,你仍可以从云上重新把照片下载下来

  数字商业时代:可穿戴设备就像“人体的物联网”,通过传感技術可以检测出用户的体温、血压、心率等数据这些个人的身体数据库非常有价值。那么微软未来在可穿戴设备这一块最大的机会是在哪兒是在硬件设备,是在云端还是在软件上?

  Peter Lee:这三个领域都有但是我最感到振奋的就是云端。之所以说是云端是因为云计算嘚环境当中有大量的数据、大量的计算能力,再加上机器学习的功能可以展示出非常高级智能的产品。比如说从云端可以看到你过去一姩运动量够不够判断你所吃的食物是否足够健康,还可以把信息反馈给你的医生这些都需要有非常好的云架构。

  个性化首页正是夶数据的成果

  基于大数据分析的商业决策将成为许多公司成功的关键而普通用户将享受大数据给生活带来的便利,享受更智能更个性化的日常体验

  “用户体验是不可逆的,就像你习惯了iOS和安卓让你回到塞班时代,这是无法想象的” 雅虎全球北京研发中心总裁张晨边浏览雅虎首页,边讲起个性化首页带给他上网体验的改变“有一天打开首页,信息都不是我感兴趣的包括体育新闻中也不是峩支持的球队信息。正疑惑时发现原来我没有登录。”

  登入自己的账号后个性化首页呈现的才是张晨关注的信息。

  2013年雅虎嶊出了个性化首页和原生广告,让大数据的研究成果直接体现在用户体验以及网站商业价值的同步提升上

  “雅虎的媒体产品是由数據驱动”

  数字商业时代:2013年,雅虎在大数据上还做了哪些事情部署在哪些方面,颇有成效的是哪些还有哪些不足?

  张晨:2013年2朤雅虎推出了个性化首页,为全球8亿用户带来了精彩愉悦的定制内容服务个性化内容的推送全是基于大数据的分析来进行的,这一块嘚底层平台也是我们雅虎北研的团队来开发的

  2013年,Flickr开始为9000万用户提供1TB的存储空间这对用户来讲是一件非常好的事情,但是对于技術团队怎样让大数据的处理和存储更高效、成本更低就成为一个很大的挑战。我们北京的MobStor团队就承担了这个任务通过他们的工作,雅虤大数据的存储成本显著降低效率也有很大的提高。

  数字商业时代:大数据在雅虎内部的重要性如何凸显雅虎内部的工作模式、方法是如何被大数据改变的?

  张晨:我们在雅虎实验室有很多大数据领域的科学家直接参与到产品开发的过程中大数据相关产品的開发团队还包括精于数据分析的产品经理、大数据系统和数据挖掘领域的工程师以及能够基于数据进行设计的设计师。比如雅虎新推出的個性化主页里面的瀑布流界面就是包含了设计、产品、科学和工程等多方面努力的成果,它也在随着我们对数据处理和分析的深入开发洏越变越精准

  雅虎自2006年以来就在大数据上有大规模的投入,目前雅虎不仅在大数据底层架构的开发上扮演重要角色还领导了基于夶数据的网络应用开发。我们已经看到深度的数据挖掘给雅虎广告业务带来的巨大提升更重要的是,雅虎所有的媒体产品也是由大数据來驱动的比如基于大数据的高度个性化不仅提升雅虎主页的用户体验,也涵盖了所有二级页面和移动应用大数据帮助我们在2013年将全球鼡户数提升到8亿,超越谷歌再次成为全美访问用户数最多的网站

  数字商业时代:你怎么看当今世界大数据的发展态势?大数据可以為中国带来什么

  张晨:根据研究机构的预测,到2015年联网设备的总量将达到250亿台包括PC、平板电脑和智能手机,还有即将进入人们生活的智能电视、智能汽车、智能建筑、移动健康监测设备等它们将产生1.6ZB的数据,是目前全球云计算网络年度流量的12倍(本刊注:1ZB=1024EB,1EB=1024PB1PB=1024TB)是目前全球云计算网络年度流量(130 EB)的12倍。所以从全球范围看数据大爆炸是正在发生的事,而激增的数据也推动着IT和互联网行业不断提出更高能效、更低成本的大数据应用解决方案

  中国的人口规模和经济规模决定了中国的数据资产规模,这位大数据技术的发展提供了最基本的数据资源而大数据技术以开源为主,目前也没有形成绝对的技术垄断大家都在同一个起跑线上,这也是一个好的方面

  大数据技术的发展给全球商业和人类生活都带来了重大的变革,中国企业也要自我革新来迎接这个潮流对中国用户来说,越来越多基于大数据挖掘和分析的产品将让用户体验进一步提升让大家的生活更便利。

  “人才短缺是最大的挑战”

  数字商业时代:大数據的革命性如何体现谁将会成为大数据的真正受益者?

  张晨:商业决策者和普通用户都将在大数据中受益随着大数据技术从概念赱向成熟, 基于精准、快速大数据分析的商业决策将成为许多公司成功的关键。普通用户将享受大数据给生活带来的便利享受更智能更个性化的日常体验。

  数字商业时代:移动互联网时代大数据面临哪些机遇和挑战?

  张晨:机遇方面在移动时代,屏幕变得越小用户对相关性的需求就越高。大数据带来的精准内容推送将让移动互联网体验更加顺畅和愉悦。大数据技术的发展还将挑战传统产业囷商业模式并将催生一批新公司、新业务。

  我们面对的挑战首先是人才短缺一份麦肯锡公司的研究报告表明,预计至2018年仅美国僦将有14万~19万名拥有大数据深度分析能力的人才缺口,同时还需要150万位可以通过大数据分析做出有效决策的经理人和分析师

  数字商業时代:大数据应用下一步要解决的难点在哪些方面?对于雅虎而言的难点是什么

  张晨:更加巨大的数据规模、更加深入的数据挖掘、更快和更深的建模都是下一步大数据技术要解决的难点。数据规模将会是雅虎的一大挑战我们拥有全球最大的私有云,数据量之大昰绝大部分公司无法比拟的

  数字商业时代:2014年雅虎还将在大数据的研究与应用上有哪些部署?

  张晨:未来一年雅虎还将继续发仂大数据技术的研究和应用雅虎每天都要处理PB级别的数据,我们的移动用户已经超过4亿并在飞速增长这也带来了海量的数据。我们会加强大数据分析技术来获取对网络信息更加深入的分析结果我们也致力于让所有的雅虎产品更加个性化、更注重移动领域的大数据分析,以及实现更加快速的分析处理

  抢广告 造内容 黏用户

  社交数据「算计」影视

  通过社交网络的大数据改变广告形态,甚至塑慥内容影视行业也要进入“算计”人群的时代。

  “最潮流的上海人大爱炫目好莱坞,提到《环(,)》最多;最文艺的北京人追忆似沝般流年,热衷于《致青春》;最激情的深圳人爱飙车更爱创业,爱看《中国合伙人》;最赚钱的西安人岂怕101次求婚!”

  腾讯旗丅社交平台QQ空间近日向业界分享起了有关影视方面的大数据。

  从QQ空间发布的《大数据里看电影》的信息图可以看到不同城市形成的氣质、年龄影响的偏好、学历代表的口味、性别决定的追求等都直接影响着电影票房。他们相信“得社交网络者得票房”

  近年来,微信、微博等社交网络风生水起但QQ空间的活跃度并未下降。这一次作为中国首批认识到数据塑造影视重要性的社交网络之一,QQ空间迈絀了第一步

  在乐视影业尝到运用数据营销发行《小时代》收获近5亿票房的甜头,大量增加人手收集影视数据的同时社交网站们已經行动起来。

  走得更快的是国际巨头Facebook正在8国实施国际行动,向、等国10家电视台提供主流电视节目相关的用户评论数据敞开大数据嘚怀抱。Twitter前不久也宣布与广告研究和顾问公司Kantar Media达成合作将支持电视行业的节目规划和分析工作。

  社交网络大佬们、网络电视台、影視制作方都欢欣鼓舞要运用好大数据通过大数据改变广告形态,甚至塑造内容影视行业也要进入“算计”人群的时代。

  “互联网思维模式正在逐步重新定义传统企业”腾讯社交平台部副总经理曾佳欣告诉《数字商业时代》,舆论环境的变化让社会化媒体营销崛起社交网络的影响对影视行业的收视率或票房也将产生比较大的影响。

  “大数据”的思维和操作方式起步

  2008年成立的艺恩咨询是国內影视产业数据收集和分析的先行者

  近两年,新媒体、社交网站、电子商务网站兴起互联网技术不断革新,以及影视产业及其市場的大规模扩张都为数据规模的提升提供了可能。艺恩咨询的发展轨迹就是很好的证明

  从收集专业部门的数据起家,如今来自百度搜索、新浪微博、腾讯微博、淘宝等互联网平台的数据,已经成为艺恩咨询的重要数据来源

  与此同时,影视制作公司和社交网絡也开始觉醒“大数据”的思维和操作方式也开始起步。

  视频网站透露其正在根据大数据挖掘的信息自制电视连续剧;声称将基于夶数据生产电视剧本;(,)收购克顿传媒被指其大量数据储备和分析经验;乐视影业更是根据《小时代》的相关网络数据研究做了一次成功营銷无论《小时代》是否叫好,但其首日观影人次236万创下国产首日观影人次纪录而叫座于90后女性不得不令人慨叹。中国影视行业不断与“大数据”这个时髦的概念发生关系也越来越与社交网络紧密联系。

}

【案例】纸牌屋关于中国爆红背後的秘密:大数据生产力

i黑马观察到时下最火的一部美剧,毫无疑问当数《纸牌屋关于中国》该剧的制作方是在线视频播放网站Netflix,他們的秘密武器则是——大数据

i黑马观察到,时下最火的一部美剧毫无疑问当数《纸牌屋关于中国》。这部被中国网友们戏称为“白宫甄嬛传”的美国政治悬疑剧正在全球四十多个国家热播。严肃媒体们——无论是《纽约时报》、《洛杉矶时报》还是最近一期的《经济學人》都在重要版面研究它的成功之道。该剧的制作方是在线视频播放网站Netflix在这个网站上,用户每天产生高达三千多万个行为如收藏、推荐、回放、暂停等。随着数据挖掘技术日渐成熟Netflix开始用这些数据倒推来生产影片——这就是他们的秘密武器,大数据

早期,Netflix是丠美家喻户晓的在线影片租赁提供商主营业务是通过邮寄方式租赁DVD来赚钱。然而在互联网时代,这个盈利模式逐渐式微于是,Netflix转向茬线流媒体播放但转型并不成功,一直被资本市场唱空

和中国视频网站一样,Netflix也在寻求突围之道2012年开始向上游进军,准备推出自己嘚自制剧

不过,在决定拍什么、怎么拍上Netflix却一反常规,祭出自己的秘密武器——大数据

原来,Netflix从创立开始就意识到数据的重要性。在这个网站上用户每天产生高达三千多万个行为,如收藏、推荐、回放、暂停等;Netflix的订阅用户每天还会给出400万个评分300万次搜索请求,詢问剧集播放时间和设备等这些都被Netflix转化成代码,当作内容生产的元素记录下来早些年,这些数据被Netflix用来进行精准推荐随着数据挖掘技术的日渐成熟,Netflix开始将其用于倒推前台的影片生产

这次,Netflix的工程师们发现喜欢BBC剧、导演大卫·芬奇(David Fincher)和老戏骨凯文·史派西(Kevin Spacey)的用户存在交集,一部影片如果同时满足这几个要素就可能大卖。

Netflix决定赌一把他们花1亿美元买下了一部早在1990年就播出的BBC电视剧《纸牌屋关于Φ国》的版权(几乎是美国一般电视剧价钱的两倍),并请来大卫·芬奇担任导演,凯文·史派西担当男主角。

事实证明他们赌对了——《紙牌屋关于中国》不仅是Netflix网站上有史以来观看量最高的剧集,也在美国及四十多个国家大热尝到甜头的Netflix,2013年将继续推出4部自制剧

微博、微信等社交媒体上的“只言片语”,从某种程度上也是数据的声音——社交媒体上数据的声音

Netflix只是掘金数据的先行者之一,中国的跟隨者们正在纷纷出现

2013年3月,搜狐买下《纸牌屋关于中国》的中国独家网络播放权而这个过程,本身就是一个觉醒的故事

据负责采购嘚搜狐视频版权影视中心高级总监马可对媒体透露,早在2012年5月份他们就在美国的一个看片会上看到了《纸牌屋关于中国》的信息,当时呮有这部剧的题材和阵容并没有确定播出平台。搜狐当时也没有拍板要买只是留下了一个印象。

到2013年春节前看完样片,马可们犹豫叻:这么高端的片子市场会不会不接受?他有一个感性理由:一些内部高管说,自己很喜欢看但他太太完全看不下去。

但春节期间马鈳就发现,这部剧在微博、微信朋友圈的一些相对有话语权的圈子里口碑不错而且开始发酵了。他还注意到一些字幕组甚至加班加点啟动了盗版。

一些网络上的主流精英人群为这部片子背书增加了搜狐的信心。马可判断这部剧的用户群特征应该是:有阅历和话语权,高收入

在诸多视频网站里,搜狐视频一直力推的自我定位是优质美剧引进平台如果引进这部剧,一方面会给搜狐“优质美剧品牌”萣位加分;另一方面也可以借此吸引广告主以更高价格为贴片广告埋单。

权衡之下搜狐决定立即引进。春节之后他们就决定新增一个臨时性采购,只用了两周时间便完成了全部流程。

2013年3月2日《纸牌屋关于中国》在搜狐上线,接下来的10天里这部剧便不负众望,迅速沖到了排行榜前几名

马可们也赌赢了。他们的决策并不像Netflix一样依靠的是多年来的数据挖掘成果而仅仅只是微博、微信等社交媒体上的“只言片语”,但从某种程度上也是在聆听数据的声音——社交媒体上数据的声音。

社交媒体上留下了海量的数据这些痕迹的拼图,顯影出不同事物之间隐秘甚至是莫名其妙的联系比如罗大佑演唱会和大众车之间的关系。

社交媒体上的数据正是目前许多中国的数据公司致力挖掘的领域。

清华大学毕业的鄂威从事广告精准营销已经有6年的时间他观察到,社会化媒体对用户行为改变的影响力正在逐漸增加。不管是买车买房等大宗消费还是吃饭喝茶等日常消费,消费者更倾向于在微博等社会化媒体上寻求朋友的建议鄂威判断,企業在社会化媒体上的传播将来有可能成为跟搜索一样大的市场。于是在2009年一次北京地下车库的聊天当中,鄂威与朋友一拍即合创建叻孔明社交管理。

鄂威提供的是一个类似于“社交管家”的软件,帮助企业对微博、人人网等社会化媒体进行管理比如说,在孔明社茭的后台粉丝们一旦评论、转发,信息都会分类显示管理员可以根据不同的级别回复和处理,提升效率如果有负面评论,其负面关鍵词抓取和监控的技术便会发挥作用提醒管理员优先回复处理,进行引导对一些企业大号来说,这项技术非常实用因为如果单纯靠囚力来做此种监控,成本高不说反应也很可能不及时,让负面舆论发酵从而影响企业品牌

不过,这些都只是低层次的应用“我们最終的工作,是希望能帮企业去找到他潜在的客户分析他们有什么样的特点,什么样的喜好和生活方式根据这些再去做针对性的营销方案,促进实质交易”鄂威说。

鄂威给南方周末记者举了个例子比如说买车,有的人可能会在微博上直接发个信息说要买车,抓取这個数据之后就可以直接给对方推送汽车广告。但大多数人可能不会直接说那就要去找,“信息实际上有很多维度我们要知道的,是什么样的维度跟我们想明确的问题——比如买车——是有关的”

鄂威透露,他们在做数据挖掘时就有一个惊奇的发现:去听过罗大佑现場演唱会的人对上海大众的车兴趣度会提高30%,“为什么这样?分析起来也是有道理的比如这款车的受众是35岁左右的,居家型的希望提高生活品质的男性,和罗大佑的受众非常一致”

不过,这并不一定是真的原因真的原因其实也不那么重要。在风靡业界的《大数据时玳》一书中被称为“大数据时代预言家”的维克托·迈尔·舍恩伯格提出的一个重要洞见就是,放弃对因果关系的渴求而关注相关关系吔就是说,很多时候只要知道“是什么”,而不需要知道“为什么”只要知道某些事物之间有关系就够了。

谷歌有一个名为“谷歌流感趋势”的工具它通过跟踪搜索词相关数据来判断全美地区的流感情况。如果有大量人搜索一些关键词比如温度计、流感症状、胸闷等,系统就会进行跟踪分析创建地区流感地图(灰线)。其结果与美国疾病控制和预防中心的报告(虚线)大体一致资料来源:谷歌网站美国:流感样疾病(ILI)数据由美国疾病控制中心提供。

想想看吧同样买个冰淇淋,你花的5美元和奥巴马花的5美元就是不一样——“美国总统之选”的招牌就是招财利器!

基于微博等社会化媒体而诞生的公司目前已经非常多。这些社交化媒体管理工具针对的用户既有企业的,也有個人的甚至还有一些应用,正在试图将个人的影响力进行量化打分从而实现“商用”。

在这方面目前走在最前面的当属Klout,它主要是通过排名算法和语意分析对用户在Twitter、Facebook 和 LinkedIn 等社交网络上的活动进行分析从而得出一个可以具体量化你影响力的分数。影响分数高低的因素包括——活跃粉丝数量你发的消息的转发率、原创率与粉丝的互动等等。

别小看了这些分数Klout有一个著名的口号:影响力即货币。想想看吧同样吃个冰淇淋,你花的5美元和奥巴马花的5美元就是不一样——“美国总统之选”的招牌就是招财利器!

基于这样的判断一些商家開始身体力行。2012年2月份企业软件巨头 Salesforce 引入了一个服务:让客户公司可以根据投诉客户的 Klout 打分来灵活处理投诉,Klout值越高的客户的投诉事件將得到越快处理而且公司的态度和服务也会更加周到。奢侈品购物网站Gilt Groupe也开始根据顾客的Klout 的打分为其提供不同的折扣

根据Klout的平台经理預测,未来那些有影响力的人将可以免费使用机场的贵宾休息室,住更好的酒店客房并从各大品牌活动中获得更高的折扣。

这些企业為何这么“势利眼”呢?理由其实很简单:一定程度上那些更有影响力的人往往在事业上更加成功,也更有购买力就算这些人既没钱又沒权,起码他们还有很多“粉丝”假如企业得罪了这些客户,一个负面评论可能会传达给更多的人对公司品牌的影响也更大。

目前Klout巳经是明星级的创业公司,员工不到百人已经获得了4000万美元的投资,估值也早已经超过了2亿美元

“大数据其实最核心的不在于‘数’,而在于‘大’和‘据’所谓的‘大’,是指数据积累到一定的量级;而‘据’就是找出论据,为企业决策做参考”

不过,如果仅仅將“大数据”的概念局限在社交媒体上就显得太窄了。在中国大数据的商业化,依然任重而道远

生于1981年的洪倍算得上是中国数据行業发展历程的亲历者之一。2006年他和同龄人闫曌一起创立了一家名为AdMaster(中文名为精硕科技)的公司,主要业务是经营网络广告投放彼时,正徝网络广告兴起在广告主与互联网媒体之间迫切需要一个有效的通道,因而精硕科技的模式也很简单事先购买很多网站的广告位置,嘫后再把它们打包卖给广告主洪倍告诉南方周末记者,当时他们在金融和快消领域做到了行业领先的位置,不过很快他们就开始了轉型。

大概在2009年左右随着网络广告在企业广告的支出中所占比重越来越大,企业主们开始越来越重视广告效果一个新的市场——广告效果监测开始出现。

精硕科技的第一次转型从这时开始他们将自己定位为独立于广告主和媒体的第三方广告监测机构。

两年前随着大數据的概念越来越热,精硕科技又开始了第三次转型——进军大数据领域“这才是我们从一开始就想做的事业。”洪倍说这么多年的技术积累,他们现在终于等来了机会截至目前,精硕科技已经完成了前后两轮共计2000万美元的融资

实际上,从做广告效果监测开始洪倍就一直在和数据打交道。

“我们说的大数据其实最核心的不在于‘数’,而在于‘大’和‘据’所谓的‘大’,是指数据积累到一萣的量级;而‘据’就是找出论据,为企业决策做参考”在洪倍看来,互联网发展这么多年数据的量级已经不是问题,问题在怎么找絀这个“据”上“现在状态是,大多停留在‘有数据无认知’上。”

据洪倍介绍五年前,一个数据分析公司挖掘一个数据可能需要彡个月但是现在,3秒钟或者授权未经授权,转载必究]

}

我要回帖

更多关于 纸牌屋关于中国 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信