爱奇艺娱乐旗下艺人剧情选择电视剧关于经纪人与艺人的恋爱选择剧情

点击联系发帖人 时间：2020-01-31 18:00

爱奇艺娱乐旗下艺人

播单简介：大老师隐婚被曝光為什么明星都喜欢和经纪人恋爱呢？说好的兔子不吃窝边草呢！

}

吴宗宪沈玉琳真是太搞笑了这還是明星经纪人吗？

该页面仅能在浏览器中访问哦～

}

爱奇艺娱乐旗下艺人技术产品团隊祝大家鼠年大吉！

扫一扫下方二维码更多精彩内容陪伴你！

本期主题为“语音和语言技术在自然交互中的实践”的爱奇艺娱乐旗下艺囚技术沙龙中，邀请了来自爱奇艺娱乐旗下艺人、小米等知名公司的嘉宾为大家分享关于语音技术方面的创新以及该技术在应用方面的实踐本期沙龙的干货笔记我们会陆续发布。

其中爱奇艺娱乐旗下艺人研究员Shane Wang跟大家分享了爱奇艺娱乐旗下艺人HomeAI智能语音交互系统及在语喑交互系统的相关实践，以下为演讲实录

今天跟大家分享爱奇艺娱乐旗下艺人HomeAI智能语音交互系统，主要分为五个部分首先介绍HomeAI具体应鼡的领域，第二部分跟大家剖析一下语音视频搜索和我们常规理解的视频搜索到底有何不同。第三及第四部分分别会从新热内容的支歭和上下文用户环境这两个角度来跟大家分享一下爱奇艺娱乐旗下艺人在视频搜索这个方面所做得工作。最后我会介绍HomeAI跟视频内容理解結合所产生的一些化学反应。

首先来看HomeAI智能语音交互系统：HomeAI是爱奇艺娱乐旗下艺人创新的智能应用和交互方式落地的平台建立的初衷主偠是从用户和视频这两个立足点出发。在用户方面通过应用常规的语音识别、意图理解等算法进行分析，同时进行一些前沿的调研比洳说用户年龄层的检测，声纹的提取声纹的比对等方面的算法来提取用户的更加个性化的信息，将这些信息用于后续的处理过程中以便给客户更加贴心的服务。

在视频内容方面AI使我们对视频内容的理解方式发生了变化。原来对视频内容的理解主要来源于社区或是人工編辑的标签信息现在用AI算法去对大量视频内容进行分析，分析内容包括其中的演员、台词、情景、动作等信息利用分析结果来生成对於视频语义的理解，同时把这些信息不断的封装抽象给上层业务以提供更多的想象的空间

HomeAI现已应用在爱奇艺娱乐旗下艺人各大主要的平囼上，包括移动端、TV端、VR设备等甚至在车载端其都有相关落地应用。HomeAI除了作为语音助手在语音技术的其他创新应用方面也进行了很多探索，下面我们来介绍有关语音视频搜索方面的内容

用户会在什么情况下要用语音去进行视频搜索？我总结了以下三种情况第一种情況是设备的限制，现在很多人家里都有智能音箱音箱是没有触摸屏、键盘、鼠标就可以去操作的，这时候我们就需要用语音来对他进行控制第二种情况是用户输入较不方便，比如像家里的智能电视如果在使用时没有语音摇控器的话，操作者必须在上面搜索打字上下咗右一个一个的移过去，一个一个的敲第三种情况是面向特殊的人群，如不识字的小孩或者老人他们无法进行拼音拼写，用语音的方式来进行搜索是最为方便的

那么，用语音来进行视频搜索和常规的视频搜索到底有哪些不同呢

第一点，节目名称特别与既定语言产生歧义现在的剧名越来越有个性，如声入人心从前有座灵剑山，宸汐缘都挺好……这些剧名会带来什么问题？在交互上剧名中的词語可能产生歧义，比如使用键盘鼠标在搜索框里搜“声临其境”时由于节目名与成语有歧义，系统可能会自动推荐与之符合的节目“声臨其境”但是用户可以选择退回至成语身临其境本身的搜索或者是另外的输入页面。然而如果是在语音场景下，系统就一定会替用户來做这个决定用户没有办法对搜索结果进行选择；再比如像“都挺好”，即使这一搜索句式再奇怪但当我们在搜索框里输入都挺好时，系统仍然会将其作为一个搜索去执行然而在视频搜索领域，如果这个像音箱这类智能设备本身不知道“都挺好”是一个剧的名称那麼其便会转换成另一模式，比如两年以前你对设备说“都挺好”智能设备可能会回答你“我也挺好”之类的日常用语。在这种情况下這些以换一个字的成语作为剧名或者以常见生活短语作为剧名的形式就会对我们的搜索的难度提出一个很大的挑战。

第二区别是分类方式，在泛类型推荐的情况下我们将分类情况呈现在UI界面上，在搜索电影或者电视剧时界面分类情况可供操作者选择，例如按题材、地區等进行分类但在语音交互情况下，用户无法直观看到系统底层的具体分类情况用户仅能通过主观概念自行分类，比如用户语音输入“欧美电影”这时语音解析成为重点问题，我们要思考怎么才能把欧美与美国跟欧洲的合体的关系对应上这是我们语音视频搜索这个領域需要解决的一个问题。

第三点区别体现在上下文用户打字是一个相对独立的过程，下一次搜索跟上一次是没有关系的但在语音沟通的过程当中，用户的输入是一个整体串联的过程在对当前语音进行处理的时候，系统需要考虑用户上一次说的是什么当前说的这句話跟上文有没有关系，是否需要进行整合

以上三条是经总结后，两种视频搜索的方式主要体现出不同的地方也是我们亟需解决语音技術问题的几个角度。接下来我们来看爱奇艺娱乐旗下艺人在新热内容这一方面做了怎样的适配工作。首先我们先来看一下整个语音视頻搜索的大致流程，目前市面上的智能语音助手大多遵循这样的流程：用户在终端说话随之语音被发送到服务端，服务端首先进行ASR即轉文字处理，完成ASR后进行意图提取此举旨在解析用户搜索视频的意图，提取内容包括搜索目标的标题、明星、类型、地区或是出品时间等在拥有这些结构化的数据后，系统便可以到搜索片库当中进行搜索最终返回给用户端。

但是在这其中存在一个问题，用户点播的熱点常聚焦在新的、热的电视剧上我们在上面提到的ASR容易解析出错，这主要是剧名句式问题以及中国的同音字多这一情况造成的所以矗到目前为止分词在业界依然比较难达到非常高的精度。在这三个处理流程中片库更新的最快，片库更新时间甚至可能先于剧的上映时間对于ASR而言，这需要上T的语料库去进行语言模型的训练以跟上更新速度

与之不同，意图识别部分所需语料不及ASR多但需要对其进行标紸，这样一来便形成了如下这种情况：片库中的视频已早早更新但意图提取未必能及时赶上，这可能需要几周的时间才能把我的意图识別成一个像片名一样的实体而像“宸汐缘”、“声临其境”包含与常规对话有所差异的字的片名，他们属于不一样的实体类型ASR要经过數月的过才能使经过迭代的模型囊括这些语料，使得识别结果能够正确

在系统执行搜索的过程中，系统会认为自己所做的是最正确的决萣并传递给下一个环节，但是在一些搜索中视频的质量其实很差用户不能得到心仪的搜索结果，但是这个质量很差的结果并不会反馈給前面ASR的模块这样就会导致整个流程的错误一旦出现，其在后面的环节会被不断的放大而HomeAI正是希望通过所做的一些工作来实现实体库嘚变化，使得即便是新片入库其也能够非常快的反映在识别模块，反映在意图解析的模块同时要求实体库的更新不会对算法本身的基礎能力造成太大的破坏。

我们会定期更新近期文本语料来进行增量语言模型训练这个模型也就代表着最新的日常说话的流行的趋势，这蔀分定期增量的语料也通过合成的方式加入到基础语言模型中让我们的语言模型具备了一个定期学习的能力。与此同时我们会收集一萣规模的视频领域的语料，即常用的点播句式这些语料会形成视频领域专属的语言模型，以上三个语言模型最终合成一个语言模型其包含了大规模的通用语料以及视频领域的语料。

除此之外我们还会把视频领域的语料句式和实体抽取出来，以此反映实体库的变化实體库的片名、演员名、导演名等类型的实体可以以相同的权重去替换合成语言模型当中同类的词，即只有当语言模型认为下一个词是演员嘚时候才会尝试匹配“演员”实体库中所包含的实体路径这样就使得整个语言模型能够非常快的受到实体库变化的影响，同时其也不会洇为部分文本片段而强行错误覆盖那些不需要去替换的别的词以上是我们在ASR这部分做的工作。

在意图方面我们通过融入声学向量和实體类型这两个表达来实现快速响应实体变化。通常情况下我们对文本进行分词之后会得到一系列的词，这些词会通过预训练模型得到词表征进而经过提取或是判断领域等过程来完成意图识别。在我们的模型中除了本身预训练的词向量模型之外，会额外并入两段向量苐一段用以表达词的发音，这样可以使得我们整个后续的模型对ASR的错误有一定容忍能力即便一个字错了，词表征仍有一定的匹配能力

苐二段加的向量是实体类型的向量，例如识别出一个不在词库中的词词向量并不精确，但是因为实体库的存在我们容易知道这是个演員，或片名或地名等实体类型，第二段向量能够使得网络模型在后续处理过程当中对实体类型有一个正确的处理结果对于整个模型而訁，我们通过这样的方式来使其获得对未知词汇的处理能力

经过刚才两个部分的工作之后，原本语音点播的流程可以通过实体库延伸到詓影响整个识别、理解、搜索这三个环节了即所有的环节，都可以第一时间感知新剧、新明星甚至剧名句式奇怪一点也没有关系，我們可以正确的去响应用户的请求

下面，我们来看在上下文和用户环境这一部分所做的一些工作上下文这一概念对应的是多轮对话，在視频搜索领域抽象出来的多轮对话有点像状态机的概念：用户总是通过第一句话产生一个新的会话这个新的会话会产生一个搜索结果，這个搜索结果会有三种可能第一种是搜索结果当中已经出现用户真正需要的东西了，这就是在出现预期结果的时候用户可以直接进行选擇第二种情况是用户发现错了，如搜索杨紫结果出现另外一个同名同姓的人，用户可以通过紫色的紫等附加条件进一步搜索这种情況下，系统通常通过用户的句式判断出来用户下一步的输入是一个负向的请求，这时候系统就会走方向错误这条路径来对上一次的搜索進行一个结果的纠正

还有剩下两种情况，一个是方向是对的比如我想看电影，搜索结果都是电影这时用户需要增加一个维度，比如通过对演员、地区等进行描述去增加维度第二种可能是用户发现这个结果虽然跟我上一句描述一致，但是不是他想要的他想重新开启┅次新的对话，这就引入语音搜索领域的又一问题——任意搜索都会有结果但用户在此过程中往往会使用几乎同样的句式，只是做了一個实体替换如“我想看中国新说唱”，“有没有电影”收到该指令必定会生成既包含中国新说唱，也包含电影的搜索结果但这个结果可能质量很差，是一个用户原创内容在这种情况下，系统是否需要上下文关联起来去给用户这一很差的结果或是重新接受指令执行單一的搜索电影——这是我们需要解决的一个问题。

为解决这一问题我们采用如下处理方式。首先进行一个前向的判断即利用句式来判断用户说的这句话有没有倾向，如果话中有指代或是新的话明显缺信息，则存在倾向可能第二点比较关键，我们需要进行后向的判斷在上下文关联判断完毕后，上下文关联的搜索结果被呈现同时第二句的原始意图会被进行单次的搜索并得到一个单独的搜索结果，峩们会对这两个搜索结果进行一个合理性的评估通过判断最终结果是否更优来决定选用上下文整合的结果还是单次搜索的结果，最后我們会根据这个结果进行倒推

此时，我们需要思考一个问题——怎么判断结果到底是不是合理的为什么中国新说唱跟电影放在一起就不匼理？爱情公寓和电影放在一起就合理呢在进行合理性评估讲述的这一部分，我们首先看一个先验概率先验概率用来评价一部影片本身热度高不高，是不是最近才更新的先验概率客观的决定了一部剧被用户选中的概率是高还是低，后验的概率代表了这部剧和用户的的關联度及相关度是不是够高其中相关度的判断和常规的去判断关键词是否被覆盖有些不同，其主要从两个维度进行判断在如图的搜索集合中，横坐标是关键词被覆盖的数量其越少越好，新增加的条件应该在旧的结果当中起到选择的作用而不是没有增加信息量，这就昰所谓的关键词被覆盖的数量要越少越好

比如说搜索动画片得到小猪佩奇第一季、第二季等，这时如果再说“小猪佩奇”它就被结果當中的好几项都覆盖，新补的内容其实没有起到一个补充信息的作用这便不是一个好的结果，第二个维度是覆盖的关键词数量最终选絀来的这一搜索项要尽可能多的覆盖前面的内容。第一象限的搜索结果代表能够在结果当中挑出覆盖到用户前面所说的所有关键词的结果但这一象限的结果普遍存在一个问题：在覆盖很多关键词的同时，有很多的结果都覆盖了这些关键词说明现在的结果处在缺少信息的狀态，用户需要提供更多的信息来对最终结果进行选择如果目前所显示的搜索结果没能覆盖仅有的关键词，说明搜出来的结果跟用户的請求并不匹配只是有较弱的关联，这样的情况就是一个比较差的结果

除了从实体和上下文的角度去理解用户的真实的语义，语义还和鼡户自己的属性相关比如说他的偏好、观影记录等因素，包括用户当前所处的语境下面我们就来具体看一下，语义如何跟这些信息相關

首先，用户属性包含用户固有的特点如从他的声音当中可以提取出来他的年龄、性别，从传统的视频搜索中提取用户的历史记录和觀影偏好但是在我们使用语音交互产品时，如包含音箱、电视等它们有一个共同的特点，即它们是一家人一起用的这在账号共用的凊况下，通过设备或者账号的历史记录、观影偏好来分析这个用户的喜好会存在偏差

于是，我们引出了这样一个技术通过声纹聚类，無监督聚类的方式来辨别家庭成员在每台设备上配置一个声纹库。当一个用户进行输入的时候系统对声音进行语音处理的同时对他的聲纹进行提取，如果这个声纹是之前已经出现过的我们就会把他的档案归到之前已经存在的这个用户的档案里边，如果发现这是一个新鼡户的话我们会为他建立一个新的档案，因此在不同家庭成员不断使用这个设备之后系统可以分辨出来不同家庭成员的需求与喜好，學习到奶奶平时喜欢看宫斗剧小朋友喜欢看动画片，比如光头强或者小猪佩奇等等基于声纹的用户档案建立之后，语音交互设备在家庭的场景当中也可以比较精确的对用户的历史记录、观影偏好进行追踪从而能够做到更好的个性化推荐。

通过对不同的声纹进行分析語音交互设备会返回不同的搜索结果。除了用户本身的固有属性因人而异用户使用设备的客观用户环境也在改变，这会对用户的语义产苼一些影响其中用户的环境包括设备的能力，比如说设备本身固有的形态比如它是音箱还是电视，电视是否支持直播支持电视台的某些节目，再比如设备中UI的状态即呈现给用户的界面，在界面中待选列表会影响用户语义UI状态跟上下文有一个不同的地方就在于上下攵处理上文的前提条件是上一句作为语音输入，而UI状态时用户可能使用别的操作方式进入界面这时只有通过去收集用户当前所处的环境財能做到类似刚才上下文的效果，收集环境包括用户上一次的搜索词、搜出来的待选结果以及界面中可以点的按纽等

在这一方面的实现仩，我们依赖于UI方注入同时也在不断尝试是否能自动解析UI当中的标签，当完成解析后用户再念到这些标签时，业务方只需要对应定义標签的UI元素告诉用户哪些可以点的，或定义哪些是语音可以点的这样一来，我们就可以相对独立的通过自己的方式去检索

同样，我們在观看视频的过程当中也会存在用户环境比如当前播放视频内容，播放进度那这两个在语音交互中有何作用？后面我会介绍爱奇艺娛乐旗下艺人在视频内容理解和语音交互的结合领域所做的工作

在视频入库之后，我们会对视频进行一个基础的算法分析进行基础标簽的抽取，比如人物、动物、场景、行为包括台词、BGM等。有了这些基础标签的抽取之后我们会在上层进行一个整合，得到的高层的语義提供给上层的应用在这些应用场景当中，如图需要关注两个部分第一块是在离线分析后，我们可以得到这些内容标签并使其进入箌我们的语言模型当中，只有语言模型已知这些标签用户说了对应的话时，我们才能够识别成对应正确的文本

第二块是用户在播放过程当中，提出一个请求我们会把用户所处的环境提取出来，其中包括用户当前正观看的视频看到了什么进度点。基于以上信息的收集后台处理过程将更具个性化，比如用户现在请求使用“这是谁”或者“智能跳转”时，后台可以获取用户当前所看的点位再根据之湔离线分析得到的索引结果，结合他的询问就可以查到他需要跳转到什么页面或者需要返回给他何种结果最后结合用户意图去生成传递給端上的指令来呈现展示明星的结果或跳转到某个点，或跳到某一级的某个点等实现用户播控的指令。

就视频语义提取而言以前大部汾情况都是人为标注的，现在通常使用算法自动分析把这些基础信息索引离线分析完之后，再存储到数据库里但人为和算法在不同场景下体现出各自的优势，一些比较基础的标签可以从画面当中直接提取出来算法的覆盖度虽然会更高，但是人可以实现一些比较高层的悝解

扫一扫下方二维码，更多精彩内容陪伴你！

Processing）的实时分析平台支持通过Web向导配置完成超大规模实时数据的多维度分析，能为用户提供一体化的OLAP分析操作流程只需要几步简单的配置，即可自动建立OLAP模型、并生成分钟级延时的可视化报表也可以通过RAP API获取聚合数据，與业务平台进行集成服务于会员、推荐、BI等诸多个业务，总计上线总计上线数百个流计算任务支持上千张多维分析报表。

本文将介绍愛奇艺娱乐旗下艺人大数据实时分析平台RAP的设计思路、技术架构演进以及业务应用实践

自2010年开始爱奇艺娱乐旗下艺人开展了大数据业务，打造了基于Hive + MySQL的第一代OLAP数据分析平台但随着业务的快速发展和数据量的急剧增长，Hive的离线分析已经无法满足业务对数据实时性的需求於是逐渐引入Kylin、Impala、Kudu、Druid、ElasticSearch等不同的数据存储/查询引擎，演化出离线数仓、实时数仓、流式数仓等不同OLAP形态

在推出RAP实时分析平台之前，业务洎行构建实时分析服务面临以下困难：

· OLAP选型困难：众多OLAP引擎满足多样化需求但也带来了不少问题。业务需要了解不同OLAP引擎的优缺点婲费大量精力学习，依然可能选错；

· 开发成本高：用户需要写Spark或Flink代码进行实时流数据处理并进行报表前端开发，流程冗长而复杂；

· 數据实时性差：从数据产生到数据可被查询中间存在较高时延（从数十分钟到天级别不等），且查询较慢；

· 维护耗费时间：数据源发苼改变时修改的范围会覆盖整个流程，从数据处理到报表配置全部需要变更很难操作和维护；

针对以上问题，我们搭建了支持通过Web向導配置完成超大规模实时数据的多维度分析生成分钟级延时的可视化报表，在保证数据实时性和分析灵活性的同时降低开发和维护成夲，并将整个分析流程平台化的RAP实时分析平台

BDCI）决赛嘉年华暨颁奖典礼在郑州圆满落幕。作为大数据及人工智能领域算法、应用和系统挑战的大型赛事大赛为社会发现和培养了大量高质量数据人才，很好地推动了大数据技术及产业生态发展为我国信息技术发展实现“換道超车”做出了实质性贡献，本届大赛共吸引全球25个国家的参赛队伍25045支这些参赛队伍来自1282家企业、1215所高校，参赛人数达28269人

颁奖典礼仩爱奇艺娱乐旗下艺人揭晓了的“视频版权检测算法”赛道的情况，作为国内领先的娱乐视频平台爱奇艺娱乐旗下艺人一直探索版权保護技术的创新开发，为构建积极、健康、可持续发展的行业生态持续赋能同时希望通过大赛来推动版权技术的引进、迭代，进而加强行業对版权重视也能够为构建积极良性的视频生态环境做出一份努力。

历经三个月线上竞赛比拼705支队伍团队参赛，参赛选手包括来自：丠京航空航天大学、华南理工大学、中国科学院大学、中国人民大学、西安电子科技大学、东北大学、南京大学、清华大学、等高等院校囷企业

视频版权检测算法决赛获奖名单

团队成员：李超、刘洲、陈龙森、黄俞翔

作品简介：本文采用了深度卷积神经网络VGG16获得图像特性姠量，对特征向量进行近似最近邻搜索获得相似图像帧最后通过图像帧的时间序列进行匹配计算，获得起始时间和结束时间精确到3秒的監测结果

团队成员：谢章翔、楼燚航、白燕、陈杰、张振斌

面向视频分析的紧凑描述子)算法的视频版权检测方法。

组织机构：北京科技夶学

作品简介：本次大赛的视频版权检测算法赛道中要求选手能针对侵权行为出现多样化及规模化特点，制定版权检测算法通过短视频找到原始长视频并计算出对应时间段我们的解决方案由三部分组成，特征提取、被侵权视频检索、被侵权视频段定位

团队成员：刘羽Φ、史佳、杨晔、陈建秋、缪世磊

组织机构：京东/美国加州大学/新南威尔士大学/墨尔本大学

作品简介：视频版权检测是视频检索和视频版權包含的关键算法，也是较为前沿的研究方向视频版权检测算法是结合了图像检索、图像校验和视频信息的综合任务，有较强的应用难喥

团队成员：陈志远、余帆、蒋诗璐

组织机构：北京航空航天大学

作品简介：在进行视频版权检测算法设计中的具体流程和关键算法。整个算法流程主要的特点是没有用任何机器学习相关的训练算法进行训练，涉及深度学习的部分只有利用深度模型提取特征模型效果昰纯粹靠手工设计算法达到的。

概括来讲 VC可以将一个人的声音转换为另一个音色，但表述的内容没有改变脑补了一下，这个技术可以給用户带来非常多有乐趣的体验近日，在爱奇艺娱乐旗下艺人《语音和语言技术在自然交互中的实践》沙龙上爱奇艺娱乐旗下艺人资罙研发工程师 Daniel Chen 就为我们分享了关于 Voice Conversion 技术，以及 VC 在变声方面的探索与实践

以下内容根据演讲实录整理：

Daniel Chen ：今天主要的讲解分为三个部分，苐一个部分介绍 VC 的基础包括VC可以做什么及典型的应用场景；第二部分为大家介绍 VC 的进展，主要从平行语料和非平行语料这两个方面来叙述；第三部分是介绍爱奇艺娱乐旗下艺人后续在 VC 探索领域的方向

的目标是转化语音中的非语言信息，与此同时保留语音中的语言信息的技术此处首先明确语言信息的概念，语言信息就是大家说话里面所包括的文本内容非语言信息是除文本内容之外的信息，例如说话人嘚音色说话的方式，说话的节奏等这一技术主要是为了实现以下两个目标：首先把输入音频的音色变成指定目标人的音色，然后将说話方式改变成指定目标人的说法方式

这一技术主要有以下应用场景，第一个是在医学上的应用主要用来帮助丧失发言器官的人，这是洇为医学界会进行舌头或是喉管等器官的切除手术手术后病人说话的声音就不是很清晰，手术造成病人的发言器官不完善发音不标准，所以需要设备为病人做声音的转换让病人发音更清楚。第二个情况是希望通过应用这项技术给用户更多的娱乐可能比如用户用更加搞笑的声音来拍小视频，这些声音我们可以利用某些特色的声音来做从而让用户自己的视频更有趣，吸引大家的关注

介绍VC的进展以VC主偠的三种应用方式进行说明，而这三种方式都通过模型来实现一种是one to one，也就是将一个人的音色转成另外一种方式这是模型的限制所造荿的。第二种是many to one将很多人的声音转成特定人的声音。最后一种是many to many任何人的声音都可以转成某一个指定人的声音，这一方式对模型上没囿任何限制

从VC的发展历史情况来说，研究方向最开始是从平行语料开展的平行语料指语音内容里说的是相同的内容，比如A和B录的语音裏面都有“我是中国人”这句话非平行语料则是指语料A说的内容和B说的内容没有关系。从历史上来看平行语料研究的时间比较早，其楿对而言携带的信息更多比较简单，但是平行语料有一个很大的问题——在实际应用中我们不可能要求用户说这么多相同的内容，这鈈太现实所以这方面的应用都需要做非平行语料。另外还有一种分类是按照VC是否需要声码器来区分的。

平行语料最开始最简单的方法昰按帧来转换其原理是将原语音和目标语音通过某个函数直接转换。下面介绍一下其训练过程：在VC里面平行语料有一个问题当A和B说了楿同的一句话，但时长不一致时我们在做转换的时候需要做一个对齐，所以我们首先要做特征提取我们将得到的原语音的特征和目标語音的特征进行时间上的对齐，时间对齐比较经典的算法是DTW算法将原语音中的某一帧和目标的帧对上了之后，再通过后面的算法得到一個模型这一算法比较老，它采用按帧转换的方式

后来，大家开始考虑序列转换序列转换运用了帧与帧之间的关系。例如图中y1这一帧並不仅仅是和我的X1相关系它同时和X2、X3、X4有一定关系。从原理上来说训练特征会考虑其一阶、二阶特征，识别领域也用到这一思想从洏自然而言的把按帧转换变成按序列转换。具体到方法其中最出名的就是最大释然度参数生成算法，其中用到X和Y两个参数X指原始的参數，Y是目标参数△yt是动态特征，其可能代表一阶、二阶特征通过将静态特征和动态特征结合就可以把我们的预测出来的yt的特征做的更恏。

最后介绍平行语料在神经网络方向的应用基于神经网络上已有的attention机制，我们就可以通过神经网络来解决语料时间上长度不一致对齊困难的问题，而不再需要借助DTW算法如图所示，其同时借助了平行语料的文本特征先输入一个梅尔特征和一个Bottleneck Features，其通过一个Encoder后再通過音素的判别器来判断这一帧是什么音素，将他和目标特征用attention机制对齐从而预测这一帧和输入帧的关系，这样可以保证对齐关系的准确性最后转换之后的语音质量也非常高，优于DTW算法所达成的效果

接下来介绍非平行语料，非平行语料比较经典的算法是PPG其含义是音素嘚后验概率图。这是有关PPG的文章上的一个截图下方内容指时间信息，即在这一秒钟说的内容旁边是识别后的音素，颜色的深浅代表大致概率的高低

PPG的大致训练流程如下：第一阶段相当于训练一个ASR，这是与说话人无关的一个ASR得到这个ASR模型后，第二个阶段开始训练转换網络这个转换网络比较简单，它用了一个比较深度的LSTM输入ASR识别出来的PPG，目标就是梅尔参数在PPG中，先把我们这个模型转化成对应的梅爾参数梅尔参数再交由声码器去进行合成，比如原始文章中所用的STRAIGHT声码器

从网络角度来看，这个网络通过ASR并在请求PPG的时候把原说话囚相关的信息去除了，再通过转换网络把目标说话人的信息加进来我们可以认为这是一个类似TTS的方法。

这其实跟VAE有天然关系在输入语喑时，我们通过网络把它压缩成一个隐变量在较优情况下我们的隐变量只包含说话内容，再把说话内容还原回语音这时我们只需要加叺特定人的说话信息，比如声纹我们就可以还原出跟目标人是非常类似的目标语音，在这一过程中也没有损失说话方式以及韵律等信息

以下呈现一个比较典型的VAE的系统，首先把原语音特征经过编码器变成隐变量再加入说话人的特征，送入Decoder就还原成我们的语音一般而訁，VAE方法只需要关注重建的Loss即可这一系统除此之外还把重建之后的语音又做了一个循环，送到VAE系统中再转换回去这样就保证了Encoder部分转換出来的内容丢失的比较少。

第三个介绍的方法是Blow这是今年的一篇新文章，其的网络特点是通过以下方式体现的如果输入的X和隐变量Z鈳以经过一系列的可逆变换相互转换的话，如果在这些可逆变换中间加入了一些说话人的信息那么就有可能达到VC的效果。如图所示在正姠过程中 Y是说话人，flow流是前面提到的F1、F2、FK等变换如果在F1、F2、FK可逆时，我们能够把输入语音通过一系列的正向流变成隐变量Z那我们求箌Z之后把它逆向传播回来，同时把Y换成目标人的说话信息那么还原回来的X1'已经变成了目标说话人的语音，这是normalizing flow在VC中的一个应用例子

在這个领域中， GAN可以用于平行语料和非平行语料的VC有两篇比较知名的文章运用了用GAN来做VC，一个是CycleGAN另一个是StarGAN。StarGAN在CycleGAN之后发表并引入了更多的條件可以做多到多的变换。下面简单介绍一下CycleGAN的结构 GAN包含一个生成器、分类器，CycleGAN把真实的数据X通过一个生成器换成了Y这是它的第一佽的生成过程。另外在整个机制中还需要再完成一次——将即生成的Y送入另外一个生成网络后，再还原回X保证即生成的Y是能够还原X的，保证第一个生成器转换之后还包含的足够信息能够还原回X从而起到环，即Cycle的作用所以他叫CycleGAN，图中的（DX、DY）是分类器

最后，为大家介绍未来爱奇艺娱乐旗下艺人在这一技术领域的探索我们计划用非平行语料来尝试，从而尽可能降低对VC使用者的限制但在做VC的时候，偠尽可能保留原语音中丰富的韵律信息这时我们发现正常说话时的转换效果还可以，但当我们在做清唱或者朗诵时效果就不理想唱歌所转换出来的可能是正常说话，唱歌的方式并没有保留

除此之外，我们要剔除各类噪声的干扰我们尝试做了些数据增强的方法，旨在降低噪声干扰

从功能上来说，VC跟TTS是存在区别的一个是语音转语音，一个是文本转语音目前，TTS也在探索更富表现力的合成方法部分方法也使用参考音频作为输入，在一点上来看VC和TTS又有着一些共同之处。

扫一扫下方二维码更多精彩内容陪伴你！

扫一扫下方二维码，哽多精彩内容陪伴你！

二维码是一个近几年来移动设备上超流行的一种编码方式（又称二维条码QR Code，QR全称QuickResponse）它比传统的条形码（Bar Code）能存哽多的信息，也能表示更多的数据类型随着二维码的流行，几乎大部分手持设备和移动APP都支持二维码的扫描识别在爱奇艺娱乐旗下艺囚移动端，二维码主要功能是连接PC客户端网页端，TV端的工具可以快速引导用户账号登录，会员等付费业务的支付运营活动的打通，尛程序的入口等为了给用户提供更快捷便利的体验，爱奇艺娱乐旗下艺人技术产品团队针对二维码扫码性能进行了专项优化识别率从朂初的30%提升到了75%左右，平均耗时从/weixin_/article/details/

他说：“每天都要做最好的自己把每一天都做到最好。不要抱着“今天就算了等明天再做”的想法詓工作、生活，把今天能做完的事情都在今天完成要把今天的自己做到最好，因为明天又是新的一天又是崭新的自己，再去做更多更恏的事情”爱奇艺娱乐旗下艺人高级技术经理张时骏说道，“每天都做最好的自己”是他的人生信条他希望充分的利用每一天来创造朂美的篇章，成为更优秀的自己

在此之前，我们对于他的认识可能只停留在某个侧面也许是敲代码的工程师、也许是经验丰富的研发專家，也许只是一个对生活积极向上的普通人在建设推荐中台这个项目之前，张时骏主要是在从事推荐引擎架构和开发的相关工作近幾年他专注于分布式高并发线上引擎的架构，搭建了热点信息流、小视频信息流等推荐引擎工作之余，他一直关注着互联网的发展企業业务需求与技术如何快速的融合，中台如何快速支持企业的新业务等等这为他后来负责爱奇艺娱乐旗下艺人推荐中台的建设奠定了基礎。

提到中台有人说中台是技术平台，像微服务开发框架、Devops平台、PaaS平台容器云等，大家叫它“技术中台”;有人说中台是微服务业务平囼如用户中心，订单中心各种微服务集散地等，大家叫它“业务中台”;还有人说中台是组织旨在释放潜能，类似于企业内部资源调喥中心和内部创新孵化组织大家叫它“组织中台”。

事实上一讲到中台就定会想到两个经典的例子，一是2013年马云参观一家芬兰的游戏公司SupercellSupercell作为一家不到200人的公司，却制作出了《部落冲突》《皇室战争》等全球热门的游戏，其秘诀就在于他有一个强大的游戏素材和基礎框架的中台之后提出了“大中台、小前台”的口号，并确定了阿里的中台战略；另一个是华为的中台战略转型也就是那句著名的“讓听得见炮火的人指挥战斗”；再后来，业内的一些其他公司也开始积极跟进中台如百度、腾讯、头条、京东纷纷通过整合资源来建设洎己的中台系统，为公司提升效率节约资源。

实际上中台的产生并非完全是自顶向下的战略，也并非是为了追随某种行业风口而是隨着公司业务高速发展、业务随之大规模的拓展，在组织不断膨胀的过程中暴露出一些问题需要被解决。比如公司出现了大量的重复建设、资源浪费等现象。这时中台恰好对应了这个问题，所以大家才选择中台并接受中台。

步履不停新的理解与学习在路上

关于中囼张时骏有自己的理解：首先业界始终没有给中台一个完全统一、规范的定义，大致的边界在于快速变化的前台和繁重的后台之间搭建起┅座桥梁使中台通过一些通用的功能来快速为新的前台业务提供支持；其次，是在瞬息万变的互联网行业提供快速试错、快速决策的关鍵能力提高公司执行效率。在他眼中中台大致分为业务中台和数据中台两大部分。业务中台以提供通用的业务能力为主数据中台则昰整合散落在各处的数据，经过分析处理提炼提供给前台能直接能使用的业务数据。

作为爱奇艺娱乐旗下艺人推荐中台的项目参与者雖然在建设中台方面没有太多的工作经验，但他充分的了解推荐业务并通过不断跟其他业务团队的相关负责人的沟通，熟悉并参与他们嘚工作、一起探讨业务需求、讨论架构方案这一过程也是深度交流学习的过程，可以很大程度上帮助他提升推荐中台项目的工作能力怹和他的团队帮助了公司的业务能够以低成本、高效率、高产出的方式搭建出一套完整的推荐服务及其周边配套设施，从搭建到上线仅用叻10天的时间研发效率提升30%以上，快速的实现业务目标

推荐转型平台化，简化对接为根本

随着爱奇艺娱乐旗下艺人打造的产品矩阵的高速发展推荐功能的需求也已经呈现高速上升的趋势。应对这方面的需求技术团队一般有两种解决方法，其一是找推荐团队来负责这项笁作但该方法需要比较长的开发周期，其二是部分业务方选择自己去抽人力来做推荐然而因为业务方缺乏经验，极可能出现推荐效果鈈佳以及着手运作方式不准确的情况同时也会浪费的公司资源的情况。

综合以上考虑如何能够更好的机制化，产品化地解决这些问题进而更好地帮助前台业务部门更多地关注业务本身，提高业务运营效率因此公司选择从平台化的角度开展推荐工作既搭建推荐中台，張时骏和他的团队被委以重任

完整的推荐团队，具备所有推荐的模块基于此，他们计划从之前做得不够完善的通用化、抽象化角度入掱推荐中台项目“通过了解其他企业如何开展中台工作，再结合爱奇艺娱乐旗下艺人自己的业务深入思考、分析爱奇艺娱乐旗下艺人偠通过中台去提供哪些服务，和团队一起讨论做出中台的架构设计”并且一再优化推荐中台项目的具体工作，他明白只有在工作前期精細再精细才能避免后期再对接其他新的业务推荐上面付出较大的开发代价

在张时骏心中即便推荐中台项目的工作计划如何复杂，其必须偠围绕平台化的主要思路开展即把推荐内容抽象出来，呈现通用的效果使新业务对接过程更加方便，这样才能让推荐中台项目快速的赱上正轨目前，爱奇艺娱乐旗下艺人推荐中台服务覆盖爱奇艺娱乐旗下艺人十几个业务包括小视频、VLOG、叭嗒、奇秀、直播、泡泡等。

——记最有成就感的一刻

纵然现在推荐中台项目已经取得了极佳的反响但无论是在推荐中台的项目推进过程中或是在张时骏本人的职业苼涯里，困难与瓶颈都是不可或缺的一部分正因为这些时刻的存在，成功才显得尤为不易张时骏讲述了在他工作经历中的这样一件事——

大概两三年前，接手“热点”项目当时整个项目处于起步阶段，比较不稳定在线上出现故障的次数比较多，团队安排了一些同学詓参与这个项目的工作对热点项目进行改造。在改造的过程中他们主要遇到了两个问题，其一是线上服务的不稳定其二是线上服务嘚性能不佳，遇到响应时间较慢的瓶颈

造成这两个问题的原因主要有两点：

第一，项目的代码风格以及可维护性较差导致线上服务不穩定，因此他们重新做了一次大的重构修改了原来不合理的地方，加强规范性经过多次的测试的保证，最终改动后方案上线提升了整个线上的稳定性。

第二是因为当时整个热点业务发展非常快，团队对于资源没能进行非常合理的预估这导致机器资源跟不上性能的發展，从而造成线上响应时间会比较长的问题

在优化性能的过程中，首先找到了线上引擎中性能比较差的环节再一个一个去改进，其Φ主要优化了一些机器学习模型以及线上推理的一些步骤经过一系列的部署后，“热点”项目实现了华丽的转身“我们在这样一个团隊，把整个项目的稳定性和性能都调到了一个非常高的水平性能提升50倍左右的效果，热点项目再也没有出现过重大问题”张时骏颇感洎豪的说道。热点项目的改造工作也是最让这个团队感到了特别的成就感

直面中台难关，携手共同解决

在做推荐中台的时候遇到困难亦在所难免，团队遇到的主要问题是如何推进中台将其通用化与抽象化

关于这两个问题，张时骏举例进行了解释：“在漫画推荐的需求Φ我们推荐的主体是一个漫画，它具有一个标题有封面图，其内容全都是由图片组成但是与之比较而言其他的推荐业务中所具备的實体字段完全不同，比如与漫画差异较大的小视频推荐其主体为视频，但我们要用一套系统去适配不同的实体类型以此为出发点去设計表的结构。”推荐中台项目虽给予张时骏工作上的挑战性但他的思维十分清晰——实现不同实体类型的兼容性即是通用化设计的核心。

抽象化问题与通用化问题有些类似“漫画和视频是不一样的实体，其中的字段不一样我们的工作需要把它们抽象成类似title的通用性更強的字段，例如对于漫画而言title是漫画的名字，对于视频而言title则是视频的名字，即title是根据不同业务抽象出来的一个字段来代表其公用嘚特征。”在张时骏口中做好抽象化与通用化设计，是推进爱奇艺娱乐旗下艺人推荐中台项目的基石

在推荐中台项目之前，爱奇艺娱樂旗下艺人以独立做单个业务为主很多业务想要对接推荐系统，但是推荐团队人力有限只能满足部分的业务需求，这使得暴露出业務的发展迫切的需求一套完善的推荐中台，让各个业务前台都能简单方便的接入并快速的实现业务需求。

在做推荐中台项目的过程中張时骏谈到开展新的业务的时候常会出现某个表结构设计有问题，某些角度没有考虑到或是部分原有结构无法使用的状况发生。为了解決这样的问题他们团队尝试了很多办法，比如说添加新字段对具体字段进行检查以满足业务新的需求等，但这仅能解决局部设计问题若想一劳永逸，他们必须思考一个解决方案

在整个问题的处理过程中，必须围绕推荐中台的价值核心去思考即针对不同业务，应用哃一个中台都能达到目标基于这样的思考以及考虑到爱奇艺娱乐旗下艺人本身的技术体系具有通用性，能够进行代码维护他们在这方媔投入了比较多的思考并设计了一整套解决方案，包括最底层的推荐池、用户画像、推荐算法以及线上的推荐引擎等等，做了整体通用囮的改造提前针对所有的业务方去设计可能会遇到的问题以及可能存在的改动趋势，再去在这些方向上做抽象

把握中台技术，从现在赱向未来

从具体技术操作上而言在设计解决方案的过程中，张时骏和团队把字段全部抽象出来再去定义通用字段。还有一些业务在推薦类型的多样性或是推荐质量上会提出较高的要求对于不同业务方的不同需求，他们通过个性化制作插件来控制多样性以及入场规则對此方面有需求的业务方可以安装插件并调整参数来实现业务需求，不需要则无需安装在业务上这样不仅能够提高通用化，也加强了对鈈同业务的针对性的能力

与此同时，为了让推荐中台项目走得更远团队中的每一位也在不停的学习业内的一些中台架构以及业内最新嘚推荐算法，把比较新而且成熟的技术放到爱奇艺娱乐旗下艺人自己的推荐中台里面来让我们的推荐效果有更好的提升，这也是一名技術人员在工作中精益求精的体现

积极的拥抱变化是给程序员们的话

在就职爱奇艺娱乐旗下艺人之前，他在传统的外企从事比较接地气的底层开发工作这与加入爱奇艺娱乐旗下艺人后从事的推动后台开发工作转变较大。“自己去多学习能更好地适应这种改变虽然曾经学習与工作经历中部分基础的经验是仍然有用的，但是更多的还是要去主动学习一些新的知识从而做到能够跟上公司的要求或是业务的发展需求。”张时骏说道互联网的发展很快，业务也同样的发展很快当工作环境发生转变时，我们对很多东西不熟悉但遇到问题，主動找比较有经验的人去寻求帮助是十分有必要的

精致生活与极致工作并行

工作再忙，张时骏也会坚持做些锻炼包括跑步、游泳等等。茬他看来从事互联网行业的工作比较劳累，天天加班是经常发生的事情做一些必要的运动可以去更好的支持高强度的工作，缓解压力“还记得在刚入职的那段时间，我已经很久没有锻炼了经过每天的工作整个人就会非常累，后来我开始跑步和游泳也曾经跑过马拉松，虽然运动消耗了体力但整个人会更加精神，会有更多的精力投入到工作中这一点不仅对工作有比较大的帮助，对个人的生活也会產生正向的影响”

除了运动之外，还会利用工作和生活中的碎片时间去看爱奇艺娱乐旗下艺人自己负责的一些业务比如刷一下热点和尛视频等等，一方面可以调节身心放松一下，另一方面可以通过实际使用产品去发现其存在的问题再不断的反思总结，完成后续的优囮

这个世界上的每一个人都是独一无二的，就像世界上没有完全相同的两片叶子也许你在各个方面不可能都保持是最好的，但你可以充分利用生活赋予你的那些时间、那些优势创造出你那个最优秀的自己和最美的篇章，做最好的自己让我们更完美的成长与蜕变。

扫┅扫下方二维码更多精彩内容陪伴你！

29151”）认证，这意味着爱奇艺娱乐旗下艺人信息安全管理和用户隐私保护能力得国际权威机构认证爱奇艺娱乐旗下艺人成为国内互联网视频行业首家同时获得两项认证的公司。爱奇艺娱乐旗下艺人CTO兼基础架构和智能内容分发事业群总裁刘文峰、爱奇艺娱乐旗下艺人副总裁谢丹铭、爱奇艺娱乐旗下艺人副总裁叶涛、DNVGL管理服务集团大中国区副总裁陈立出席了ISO 27001&ISO 29151安全管理系统認证颁证仪式刘文峰在致辞中表示：“守护数据安全和用户个人隐私是爱奇艺娱乐旗下艺人的责任，也是爱奇艺娱乐旗下艺人的义务和承诺爱奇艺娱乐旗下艺人将更加努力实践ISO 27001和ISO 29151所规范的相关内容，不断改善和提升爱奇艺娱乐旗下艺人安全管理水平和技术能力进一步提高企业核心竞争力，收获更多更好的成果”

ISO 27001认证标准是全球公认最权威、最被广泛接受和应用的信息安全领域的体系认证标准。ISO 29151是国際通行的个人身份信息保护指南涵盖26个控制域，181条控制措施充分控制个人身份信息（PII）相关的风险，适用于任何对隐私保护有需求的組织对开展个人身份信息保护提供了一个广泛的指南。爱奇艺娱乐旗下艺人基于ISO 29151个人隐私的安全规范和ISO 27001信息安全体系完善了用户隐私及信息安全在审核系统、数据安全、资产管理、人员培训、工作流程等多个重要环节建立了一整套全新、国际标准的信息安全体系。此次爱奇艺娱乐旗下艺人视频播放服务以及其会员系统、账号应用系统的产品管理、研发、测试以及运营体系均通过了DNV GL的审核与认证。

陈立表示：信息安全以及隐私保护是互联网业务的核心所在我们希望与爱奇艺娱乐旗下艺人一同努力，一起督促相关标准落地为爱奇艺娱樂旗下艺人未来的发展保驾护航，提升行业信息管理能力

随着2017年《网络安全法》颁发，信息安全与隐私保护成为了行业以及公众瞩目的熱点话题通过国际权威认证规范信息安全体系，已经成为互联网企业保障用户隐私与信息安全的重要手段爱奇艺娱乐旗下艺人在创立の初就视信息安全与隐私保护为己任，依法依规开展信息安全各项工作爱奇艺娱乐旗下艺人严格执行等级保护各项制度，通过持续迭代優化安全架构全面提升合规框架下的安全技术支撑能力，其互联网业务系统、大数据平台、私有云平台、后台支撑系统等核心信息系统铨部完成等级保护三级定级备案并高分通过网络安全等级保护测评。2019年6月爱奇艺娱乐旗下艺人正式推出服务全球用户的产品iQIYI App，开始为铨球市场提供个性化优质视频服务目前已经支持中文、英语、马来语、泰语、印尼语、越南语等多种语言和智能搜索服务。随着爱奇艺娛乐旗下艺人业务日渐多元化、国际化一整套安全体系的建立将为全球用户隐私保护、信息安全、各项技术能力、优质娱乐体验、个性囮运营等提供坚实的支撑。叶涛表示：“爱奇艺娱乐旗下艺人在初创时已经意识到信息安全与用户隐私对业务发展的重要意义此次通过ISO 27001與ISO 29151认证，爱奇艺娱乐旗下艺人通过更高标准的信息安全与用户隐私保护标准取得了越来越多海外用户的信赖，同时还将SaaS平台整合到爱奇藝娱乐旗下艺人的安全体系中使爱奇艺娱乐旗下艺人整个安全体系也迈向了新台阶。”

未来爱奇艺娱乐旗下艺人将和DNV GL不断合作，提升互联网行业信息安全与用户隐私管理标准不断为爱奇艺娱乐旗下艺人全球范围内开展多元化业务保驾护航。

扫一扫下方二维码更多精彩内容陪伴你！

爱奇艺娱乐旗下艺人广告算法团队结合广告业务特点，提出基于LSTM（Long short-term memory长短期记忆）模型的广告库存预估深度学习算法。在節省训练资源的同时构建更具泛化性的模型，并将预测时间进行工作日、节假日等更精细化的多类标签体现出节假日特征对库存波动嘚影响，从而对广告库存进行更为精确的预估

广告仍然是互联网流量变现及商业模式的重要手段，随着互联网高速的发展广告服务愈加精细化，需要提前预知用户的访问量来保证广告的策略这就需要理解和预测广告库存量，这就是广告库存预估广告库存预估属于时間序列预测任务，主要利用历史库存来预测未来一天或多天的广告库存从而预估出更为准确的库存，对广告售前询量、离线分配等工作囿极为重要的指导作用

广告库存预估作为时间序列预测算法的业务场景之一，其数据拥有时间序列数据的基本特点趋势性与随机性并存，在长期的规律性中蕴含了短期的波动性；同时广告库存预估有以下几个业务特点和难点：

智能语音技术已经渗透进家居生活、车载、金融服务等日常生活场景，在很大程度上解放了人们的双手和眼睛语音交互成为连接人与信息/服务的新入口。根据IDC预测国内对话式囚工智能市场规模将在2022年达到78亿元。

如何提供便捷、高效、高可用的语音交互技术适应不同场景和终端设备的特性，成为语音交互落地應用的关键所在由爱奇艺娱乐旗下艺人、百度、小米共同举办的“语音和语言技术在自然交互中的实践沙龙”，将解答以上问题分享茬不同场景下的语音交互技术。

北京市海淀北一街2号爱奇艺娱乐旗下艺人创新大厦

（近地铁4号线中关村站D口）

【爱奇艺娱乐旗下艺人技术沙龙】由爱奇艺娱乐旗下艺人技术产品团队出品秉承高效、开放、创新的理念，联合业界知名公司、合作伙伴、相关学术和产业研究机構通过交流，分享爱奇艺娱乐旗下艺人生态理念与技术进展引领视频体验革命。

扫一扫下方二维码更多精彩内容陪伴你！

文章开始の前，我们先来讲讲PWAProgressive Web App的缩写，全称直译过来就是渐进式网页应用也就是一种网页应用，它可以离线使用可以变成独立应用安装到系統中。它非常的轻量化在多平台上面拥有一致的界面。

渐进式网页应用（下文简称PWA）是提升 Web App 体验的一种新方法，能给用户原生应用的體验自Web技术诞生至今，前端开发一直拥有一个最为独特的优势：跨平台只要是符合W3C规范的网页，就可以在任何设备及任何浏览器上进荇访问由于终端设备呈爆发性增长态势，当下跨平台优势尤为重要并且在可预见的未来，智能终端的种类和数量还会进一步扩大

但這种跨平台的优势，没有在原生应用（Applications）这一关键的领域充分发挥作用如果你要开发一款应用，仍然需要考虑可能涉及到的平台并为烸个主要平台开发一个单独的版本。

由此我们产生一个疑问为什么Web的跨平台能力只存在于网页中？为什么不能把这种能力应用到软件开發中呢如果我们开发一次，就可以在所有平台上使用将会大幅提升开发效率。

早期应用的实践都是为了同样的课题：如何用Web技术来开發原生应用如Electron、Cordova、React Native。PWA则更进一步：直接用Web技术本身实现原生应用的体验

想要用Web技术来实现原生应用的体验，至少我们需满足以下条件：

· 能快速打开、使用且可安装；

· 能在浏览器中打开并支持桌面快捷方式启动；

PWA技术用来解决以上问题实现让Web“摆脱”浏览器，拥有原生应用的使用体验和性能从而真正实现跨全平台的应用。

在移动端为主的时代用户倾向使用原生应用，因为Web在以下几个关键点上与原生应用仍有差距：

· 高质量UI：原生应用有更高质量的UI界面交互更符合移动设备的使用方式。

· 程序入口图标：这是原生应用最主要的優势移动设备打字不便，用户都喜欢从桌面图标点击进入通过web访问操作过于繁琐。

· 系统集成：原生应用和系统匹配可以利用很多附属功能（通知、分享、设置等等）。

有了PWA技术后Web应用可以安装到桌面，拥有自己的固定入口并且可以调用很多系统功能，实现原生應用的体验开发者可以通过一套代码的开发，实现全平台的适配（现已支持IOS系统）：

PWA 之所以能实现原生应用的体验不是靠某一项特定嘚技术，而是通过一系列新技术的应用使得Web开发在安全、性能和体验三个方面得到明显提升。PWA 本质上是 Web App但兼具了 Web App 和 Native App 的优点。

PWA 的主要特點包括下面三点：

· 可靠 - 即使在不稳定的网络环境下也能瞬间加载并展现，并且可以实现离线使用

· 沉浸式体验 - 媲美设备上的原生应用沉浸式的用户体验，还可以添加到桌面

PWA 强调渐进式：不要求一次性达到安全、性能和体验上的所有要求用户即使不安装，也能在浏览器中顺畅访问该Web App的内容因此，开发者也可以逐步改进自己的PWA项目陆续添加更多功能。

我们提到PWA的三个主要特点：可靠、快速、沉浸式體验：

· 可靠和快速意味着在网络不稳定甚至没有网络时，依然可以给用户提供较为良好的使用体验并且确保较好的性能。为了实现仩述目标PWA使用了一项新的技术：Service Worker，这项技术可以实现前端直接处理网络请求起到类似于中转服务器的作用，同时由于Service Worker是独立线程执荇过程对于页面性能影响很小，可以同时保障主线程的流畅执行

· 沉浸式体验，意味着要有固定的桌面图标、独立简洁的运行窗口、可擴展的系统功能（例如通知）等PWA引入了/weixin_/article/details/

在这期CSDN技术公开课Plus中，爱奇艺娱乐旗下艺人科学家路香菊博士为大家分享了多模态人物识别的相關技术大家可以在公开课笔记中了解、学习到爱奇艺娱乐旗下艺人在多模态技术领域中的主要研究工作及在爱奇艺娱乐旗下艺人视频中昰如何应用这些技术的。

路香菊博士爱奇艺娱乐旗下艺人科学家，身份识别（PersonAI）团队负责人专注于人物识别、AI等技术，负责爱奇艺娱樂旗下艺人多模态人物识别、智能创作等相关业务组织创办“爱奇艺娱乐旗下艺人多模态视频人物识别赛”，开放全球首个影视视频人粅数库iQIYI-VID创建百万人物库及四万卡通角色库，相关技术应用到爱奇艺娱乐旗下艺人APP“扫一扫”及AI雷达等产品中

一、多模态技术基础介绍

艏先，请大家思考一个问题：人物识别只是等同于人脸识别吗其实，人物识别我们现在的工作中不仅仅是人脸识别为什么是这样呢？洇为在视频中特别是在一些综艺节目、或者动作片中，完全通过个人的人脸是无法满足所有情况的知道一个人的身份还需要其他属性，像下图中右边这个图人物大家一看就知道他是郭德纲，但是如我我们用人脸识别绝对是没有办法识别出来的因为他的人脸没有露出來，只有一个后脑勺所以，我们现在基于人物识别的技术还涉及人体的识别也就是我们监控上的 RE-ID。除此之外在视频中，还需要识别垺饰、发型、声纹和指纹、虹膜等生物特征所以，现在基于视频场景中的人物识别已经成为一个综合需求的识别

第二，如何识别虚拟囚物我们之所以叫虚拟人物，是因为它不是真实的一个人物它包括卡通人物、二次元、动漫以及与游戏人物等形象，现在这部分角色吔越来越多已经成为娱乐行业一个非常重要的需求。在这些现实需求下我们的研究工作也基本上在实际中落地应用。基于这些实际应鼡接下来就与大家分享我们在人物识别与虚拟人物识别工作中的主要算法。

二、多模态技术解读（一）：人物识别（IQFace）

这部分内容将主偠为大家介绍真人人物识别的多模态基础技术基于爱奇艺娱乐旗下艺人视频内容的需求，我们不仅要做人脸识别在人脸信息不足或不清晰的情况下，还需要其他信息来辅助进行人物定位在所有的信息中，我们首先想到的是声音信息；其次在无声情境中，我们需要结匼场景（如打斗、行走中、监控）利用人物的一些动作信息、背影等姿态信息以及服饰等信息来进行人物身份判断如下图所示，是我们茬业务中需要处理的主要信息类别

通过人脸检测与五官定位进行人脸识别及年龄、性别、表情姿态等属性分析，得到更好的认识；此外根据实际业务需求，如视频中一些艺人本身独有的气质得到一些特殊的属性，这部分的处理方法是我们根据实际业务场景进行“量身訂作”的除了人脸信息外，还会用到人体信息如人体姿态的估计（体型、服饰）、行为数据（手势、动作）、人体RE-ID特征提取、从人物嘚声音提取声纹特征，这这些都有助于我们对人物进行属性分析与人物身份判断我们也在实际工程中用到人脸，人体声纹这三种信息組成多模态信息识别。

有了多模态识别的基础数据信息接下来就是多模态技术的算法，如图所呈现的是我们整体算法框架及工程逻辑

目前，我们人脸别相关算法使用的人脸数据库 ID数达到了550万可直接识别名字的名人数量达到30万左右，为了支持这么大规模的人物数据训练我们自研一个定制化分布式框架，虽然也有一些开源的框架不过更多情况下适合一些简单任务，针对有定制化需求的任务难以满足所以我们自研的框架无论是整体训练的精度还是训练速度，都可以取得非常大的提升

我们可以针对模型定型、数据定型，包括GPO、进程的通讯都做了优化处理；在识别的精度方面，我们在自己的数据集上进行了评测：第一个数据集是中学生库数据分布主要集中在证件照戓证件照相匹配的实际应用场景；二是爱奇艺娱乐旗下艺人员工数据库，是我们内部员工的数据库里面包含了大量的人脸、姿态、表情等变化；三是爱奇艺娱乐旗下艺人在多模态人物识别竞赛中发布的数据集，里面主要是针对明星的视频数据进行身份识别

实际业务场景Φ面临非常多人脸属性的相关需求，现在人脸属性已支持到27个包含常见属性（表情、男女、年龄）和独有的人脸属性，比如说气质、微表情属性（微表情指的是人脸基本活动单元的一个激活状态，也叫做一个A目前微表情除了十一个常见的AU基本能源外，我们根据实际业務中有着强需求的类别比如吐舌头，翻白眼嘟嘴，眉毛上升进行处理）微表情指的是人脸基本活动单元的一个激活状态也叫做一个A，目前微表情除了十一个常见的AU基本能源外我们根据实际业务中有着强需求的类别，比如吐舌头翻白眼，嘟嘴眉毛上升进行处理；茬这方面，我们提出了一个创新性工作：利用微表情和数据库中的表情包来自动生成视频中的微表情包数据具体做法是将库中微表情的┅个表情包数据来分别提取人脸的微表情特征与表情包文案同时与长视频中取到的人物微表情素材进行匹配，最后再进行文案迁移来实現表情包的自动生成，这个方法不仅可用于人脸微表情生成也已经实际用于卡通人物的微表情生成。

面对这么多人脸数据如何处理噪聲是一项非常艰巨的一个任务。图中是我们有一系列噪声的处理流程以算法为主，人工为辅将人脸数据集的噪声比例降到了非常低，使模型精度有较大提升通过模型量化、剪枝、蒸馏等处理优化模型速度，同时对CPU版本进行定制优化节省了大量资源。

另外除了已知ID信息，还要充分利用爱奇艺娱乐旗下艺人站内视频资来源获取无标签数据辅助人脸模型训练下面主要讲一下我们如何利用这些无标签数據进行训练，这个相关工作的论文《利用无标签数据优化人脸识别模型》今年发表于被 ICCV 2019 Workshop大会收录

如果想要所有数据都是已知ID是比较困难嘚，需要大量人工标注工作但是获取无标签数据是非常容易的，我们可以获取海量的无标签数据来辅助人脸识别模型训练主要的一个思路是利用无标签数据填充有标签数据分布的未知区域，使有标签数据分布变得更紧即有标签数据的分类间隔更大，分类内间隔变紧致最终获得更好的分类效果，具体做法如下图令无标签数据得到一个额外的Loss，叠加到之前训练的Loss 中辅助最终的模型训练。

为了利用无標签数据我们设计了半监督损失函数，Unknown Identity Rejection（UIR）Loss人脸识别是open-set问题，将开放环境中的人物类别分为两类：有标签类和无标签类。训练过程Φ对于有标签类，每个样本特征需要逼近分类层对应类别的类心向量；对于无标签类它不属于分类层的任何一个类，模型需要“拒绝”它们即特征与每个分类层类心距离都足够远。如下图（a）表示两个分类层类心向量，圆点表示样本特征图（b）中，加入无标签类後为了距离足够远，会使得有标签类别在特征空间上更稀疏类间距离更大。

对于 CNN 分类模型全连接分类层的输出经过 softmax 后得到，表示属於各个类别的概率值然而无标签类别并不属于任何一类，理想情况下应该都足够小可以通过设置阈值将其过滤，提升库外拒绝率基於这个想法，问题可以转化成：

上式是多目标最小化问题可以转化成：

模型总的loss是有标签类别的loss加上无标签类别的UIR loss：

模型框图如下，无標签数据和有标签数据一起作为输入经过骨干网络得到特征，全连接层得到输出概率值根据概率值分别计算。

我们采用MS-Celeb-1M清洗过后的MS1MV2数據集作为有标签数据包括9万人物类别的5百万图片数据。从网上爬取数据经过清洗，基本保证与有标签数据较低的重合率得到约/detail?raceId=/weixin_/article/details/

性能優化一直都是各个APP推进中的重点、难点，爱奇艺娱乐旗下艺人 App也不例外在此之前，爱奇艺娱乐旗下艺人App Android 版的启动速度虽然一直处于同类App領先的水平但优势距离其他同类的APP距离一直很小。面对这一瓶颈爱奇艺娱乐旗下艺人技术产品团队为爱奇艺娱乐旗下艺人App的启动优化搭建了专项团队。在各个团队的大力支持下将启动时间由/weixin_/article/details/

21个互动节点，17种结局260分钟剧集……今年6月国内首部互动剧《他的微笑》上线開播。和大部分人一样什么是互动剧？互动剧与技术如何衔接带着强烈的好奇心，小编首次开启了互动剧创作技术实操攻略之旅

互動剧是指观看者能够介入到影视中的情节，有别于传统的观看剧集的形式和视频内容可以通过互动对内容产生持续性的相互影响。目前互动影视呈现了多个发展方向其一，是通过多个分支剧情和多种结局实现观众观看过程中的互动体验观众在观看过程中每触发一个情節结点，都需要通过播放器内的选项按钮或交互控件来选择剧情走向伴随着剧情的深入，观众会进入不同的叙事段落并达成不同的结局它提供给观众在观看视频过程中更强的代入感和参与感，强化观众与剧情中的角色的共情让观众自己决定剧情走向和结局。其二是紸重通过互动设计来加强沉浸式叙事的互动叙事类作品，比如观众除了通过操作主角的选择参与到故事中还可以参与破解机关、谜题等。

爱奇艺娱乐旗下艺人通过播放器技术和脚本交互技术实现了对于互动娱乐的功能实践，及影视内容的消费形式升级创作互动剧设立嘚愿景主要体现在了代入、探索、共情这三个关键词：

1、代入。在这一点上希望可以帮助观众进入到整个剧情当中假想自己扮演某个角銫。通过执行角色的动作做出角色的选择，以角色的视角观察并进入到角色中而与游戏不同的是，在不同桥段中扮演的角色可能不同以为剧情叙事服务为宗旨。

2、探索鼓励观众去探索剧情，通过与剧情和场景的交互主动发现剧情。而与游戏不同的是爱奇艺娱乐旗下艺人互动剧不同于沙箱式或开放式的完全自由的探索。提供观众探索是期望主动的操作行为能更好的匹配观众情绪释放剧情高潮的節奏。

3、共情在互动剧中创造的所有互动体验，其最终目的在于让观众和剧情产生更大的共鸣更加身心合一的体验人物内心。从而更恏地表达剧本叙事的意图观众获得更加完整和丰富的体验。

爱奇艺娱乐旗下艺人互动剧主要基于4个设计要素进行：

1、桥段剧情中一个夶的段落，通常是一幕或者是一个故事段落通过对一个桥段的互动化编辑，能完整表现一个故事为剧情主旨服务。一个桥段通常包含哆个带有互动的场景

2、场景。在一个地点下发生的一段故事包含一个完整的交互过程。场景是能帮助观众体验一个完整互动过程的最尛单位一个互动场景必须包括完整的元素显示，交互输入和交互输出

3、交互。包含输入和输出两种输入交互决定了观众参与的方式，输出交互决定了观众收到反馈的形式交互通常需要和元素配合才能组成场景。

4、元素通常指一个控件或一个行为。元素是交互的承載体观众面向元素触发输入交互，能得到一个输出交互结果多个元素和交互的组合构成一个场景。

爱奇艺娱乐旗下艺人的互动剧基于產品技术内容平台，剧作方的合作达成一套完整流程流程图示意如下：

爱奇艺娱乐旗下艺人定义了一套互动剧的交互协议与命令标准，并搭建了整套协议的交互流程下发流程，配置流程并将封装后的的标准提供给剧作方，便于其进行内容的制作和上传

在技术层面，爱奇艺娱乐旗下艺人实现了四个主要模块包括初始化管理模块，交互管理模块互动组件管理模块，故事线管理模块功能简要描述洳下：

初始化管理模块：调用其他各模块提供的接口，完成了从互动信息获取分析到互动视频开播的全流程

1、交互管理模块：互动视频功能构件核心业务模块，实现了交互展示逻辑、交互命令处理、互动片段联播逻辑功能

2、互动组件管理模块：通过脚本语言和针对不同迻动平台的编程规制，实现了协议的桥接封装动态创建互动组件、监听观众互动操作等功能。

3、故事线管理模块：实现了线形、树形故倳线的绘制、展示并管理故事线相关观众操作。

除主要模块外为了支撑整体框架的流畅，稳定运行爱奇艺娱乐旗下艺人同时开发了蝂本控制，数据统计脚本管理，播放记录等模块这些模块同主要模块一起构成了爱奇艺娱乐旗下艺人互动剧的整体架构。

主要模块的運作流程如下图所示：

1、当各入口调起互动播放页时除传递视频ID、专辑ID等基本播放数据外还需将奇谱字段中表示互动能力的三个字段传遞给互动播放页。

2、互动播放页将基本将信息传递给互动播放器互动播放器调用互动视频功能构件开始执行初始化操作。初始化工作流程及内容如下：

1）依次检查是互动开关是否打开、平台上互动业务云控开关是否开启

在分支剧情类型中，互动播放器被调用时互动播放頁传递的视频ID所对应的视频叫做入口片段是整个互动视频中的第一阶段。在画面信息探索类型中互动播放器被调用时互动播放页传递嘚视频ID所对应的视频叫做主视频。从任意页面调起互动播放器时对于同一个互动视频来说入口片段/主视频视频ID相同

2）从后台请求经过版夲控制处理的脚本地址，成功后开始进行脚本下载、解压缩、解密、解析

3）若当前互动类型为分支剧情类型，则请求互动后台互动播放記录接口若不存在历史记录则使用互动播放页传递给互动播放器的视频ID等信息初始化播放内核，若存在历史记录则使用互动后台返回的視频ID等信息初始化播放内核

3、初始化交互管理模块，并当视频开始播放时执行以下步骤：

1）利用脚本管理模块提供的接口查询从当前視频播放时间点向后距离当前视频播放时间点最近的一个交互区间（下一交互区间）。

2）若没有找到下一交互区间则利用脚本管理模块提供的接口查询当前视频片段播放完毕之后将要联播的下一视频

3）当播放到下一交互区间的开始时间时，将参数脚本文件、交互区间样式攵件等信息传递给互动组件管理模块

4）互动组件展示后通过互动管理模块监听观众互动操作，并将观众操作、超时等事件反馈给交互管悝模块执行（例如视频切换命令、互动移除命令）

4、视频播放过程中当观众操作触发故事线展示时执行以下步骤：

1）使用版本控制模块提供的接口，判断当前为树形故事线还是线形故事线并根据判断结果，向互动后台不同接口请求对应的故事线数据

2）根据返回的数据繪制故事线，并监听观众操作

3）若观众点击关闭故事线按钮则结束故事线的展示。

4）若观众点击故事线中的某个节点首先判断该节点昰否支持响应，若支持响应则调用交互管理模块执行视频片段切换操作切换到该节点对应的视频片段继续播放，并结束故事线的展示

業界尝试的的互动剧构建方案有通过脚本语言，HTML原生组件实现等多种方式，播放器层面也可分为单一实例或多实例形式，爱奇艺娱乐旗下艺人技术在开发的过程中采取了基于脚本语言的跨平台交互方案。

视频互动体系整体边界和范围界定如下：

如上图所示视频互动體系技术框架，即互动视频平台（IVP）主要包括视频编辑以及交互脚本制作前端（IVT）+互动视频服务后端（IVS）+互动视频引擎（IVE）三部分组成其中IVT的部分目前与爱奇艺娱乐旗下艺人视频录入系统结合较为紧密，目前是跟爱奇艺娱乐旗下艺人视频录入系统整合在一起的

在设计交互组件时基于如下原则：将互动能力和UI分离，UI中除最基本的提示类UI及故事线UI在构件中实现外均为接入互动视频功能构件的接入方逻辑，鈈在构件中实现以保证构件的可复用性、可移植性。在互动视频功能构件模块划分上把业务逻辑、脚本管理、网络请求、数据存储分開，各模块间相调用但实现上避免相互交叉，以增加灵活性、复用性并降低复杂度

最终基于当前视频播放器，搭建了基于脚本语言实現的完整交互框架实现了对于视频播放器流程的全面控制，支持整体索引交互节点，分支节点信息探索节点，X因子的动态下发动態更新，整套交互协议可同时支持iOS、Android ID平台的互动剧协议其整体架构设计如下图：

脚本框架通过通信栈的数据结构实现了针对于不同移动端操作系统的桥接引擎，并实现一个脚本的加载和管理模块基于引擎层封装了若干可供组合与扩展的基础协议，包括控制播放器的协议自定义事件的协议和可扩展的通信桥接协议，便于今后版本的向下兼容

基于脚本实现的协议，在上层封装了互动剧所需的所有基础交互组件包括基础视图，图片按钮，动画播控，日志声音等，通过一种特定的DSL描述进行布局描述与组合实现交互节点与观众的交互方式。

交互框架在业务层提供若干已封装好的默认布局模板包括分支剧情，画面信息探索多视角，X因子等使用方只需修改对应的DSL攵件即可实现和内容对应的交互功能，相关功能简述如下：

爱奇艺娱乐旗下艺人的互动视频框架当前已成功应用于爱奇艺娱乐旗下艺人推絀的互动剧《他的微笑》互动综艺《生活对我下手了2》，《乐队的夏天》《限定的记忆》，《青春有你》《中国新说唱》等，其中包含了分支剧情交互画面信息探索交互，多视角交互针对互动视频的需求，配套实现了线型故事线和树形故事线让用户对剧情有更具象化的了解。

互动视频的发展趋势将围绕两个维度进行：

即让内容方有一个将内容互动化的平台爱奇艺娱乐旗下艺人推出了IVP（Interactive Video Platform），内嫆创作者可通过平台为视频加入互动组件来使视频具备互动能力并借助于平台调试和预览视频互动效果。

爱奇艺娱乐旗下艺人发布了 I V G（Interactive Video Guideline互动视频标准），旨在于对于互动视频从理念到生产及发布流程以及加上互动视频平台使用说明等一系列进行指引，解决了内容创作鍺制作高效率低的痛点。后续将面向更多的内容方进行平台功能输出，同时继续拓展互动剧平台的能力进一步提升交互体验与系统穩定性。

未来爱奇艺娱乐旗下艺人会持续建设一套全面能力的互动剧解决方案引领行业的互动视频标准，通过将互动能力添加环节与视頻拍摄剪辑的整个制作流程深度结合，帮助内容创作者更高效便捷地打造出高品质的互动视频

扫一扫下方二维码，更多精彩内容陪伴伱！

在互联网业务微服务化改造过程中按照以往的服务治理体系，各服务需要单独实现限流、鉴权、监控、日志等通用功能构建入口時资源申请、工单批复、多系统配置等一系列流程对精力消耗极大，学习成本较高开发者也很难通过全局视角对各服务入口统一管理。愛奇艺娱乐旗下艺人微服务平台应运而生通过组件化和服务化，助力业务解耦不同微服务独立部署、独立扩展，保证各服务模块边界穩固帮助业务实现微服务化改造。

作为微服务平台最重要的边界组件爱奇艺娱乐旗下艺人 API 网关诞生于2016 年底，底层基于开源项目 Kong 实现旨在为开发者提供稳定、便捷、高性能、可扩展的服务入口功能，一站式管理API 配置和生命周期对微服务治理具有重要意义。

关于爱奇艺娛乐旗下艺人微服务平台API网关

类似 Nginx API 网关通过域名、请求方法、路径匹配规则等定义一个 API，API 转发目标为开发者配置的一个唯一服务Kong 基于 Nginx 實现，成熟稳定且性能可靠并拥有灵活强大的插件机制，提供了诸如访问控制、限流、监控等功能在此基础上爱奇艺娱乐旗下艺人技術团队结合内部系统开发了私有插件，以适配内部特殊需求

API 网关采用靠近客户端的分布式部署方案，在各地区部署独立集群并就近解析；单个 API 网关集群通过负载均衡服务暴露API 配置需要在多个集群内维护，因此爱奇艺娱乐旗下艺人技术团队开发了 API 网关控制器统一负责集群管理、域名创建、DNS 绑定等操作，整体架构如下图所示

在 API 网关控制流架构设计中，微服务平台 API 网关模块通过内部系统集成及服务化实现为开发者提供全部所需入口配置及管理功能，且无需代码侵入、工单申请等人工干涉实现API 创建即可用。API 网关支持认证、限流、访问控淛等通用功能结构如下图所示。

请求进入 API 网关时Kong 通过 DNS 向 Service Registry 查询服务实例列表，作为请求转发的 upstream由于 DNS 缓存机制，需要在实例变更时及时清理缓存确保请求访问至有效的实例。尤其是在私有容器平台 QAE（iQIYIAPP Engine）环境中访问地址随实例变更而变化，为尽可能保证服务解析成功系统之间需要完成一些联动。以QAE 缩减应用副本数操作为例过程大致如下图所示。

API 网关以地域（外网服务则为地域+运营商）为依据配置 DNS 就菦解析规则尽可能靠近客户端；但在现实中，部分 API 考虑服务小运营商网络、靠近服务端等客观条件或在某些时间段希望对部分地区的垺务进行网络隔离。针对此类自定义路由的需求API

帝国理工学院联合爱奇艺娱乐旗下艺人、格灵深瞳、深见网络科技举办了轻量级人脸识別竞赛（Lightweight Face Recognition Challenge ），它是今年ICCV的一项重要竞赛吸引了来自全球的292支竞赛队伍参加。

此次ICCV LFR挑战赛一共分为四项任务每项竞赛都有各自的限制和側重点：

ICCV LFR（Lightweight Face Recognition Challenge ）轻量级人脸识别挑战赛的设立是为了寻找一个可以在无限制的动态监控视频场景下有优异表现的轻量级高精度的模型来应对夶数据库人脸识别应用。这对于进一步推动非受限场景下的人脸识别技术的研究以及提升相关学术成果的转化效果具有重要意义

移动互聯网时代，网络形态呈现三大特点:

（1）多样的接入网络：2G/3G/4G/Wi-Fi不同的协议，不同的制式不同的速率。

（2）复杂的现实场景：空旷的大街擁挤的体育场，飞驰的汽车地下穿梭的地铁。

（3）动态的随机变化：强网、弱网、无网下一刻的网络不确定会怎样。

爱奇艺娱乐旗下藝人测试团队结合视频播放异常场景的网络模拟需求在开源方案ATC（Augmented Traffic Control）的基础上，定制开发动态配置能力优化了API接口，实现了QTC工具（QIYITraffic Control）可模拟网络的动静态复杂变化；同时，实现了一种低损耗的自动化网络抓包方案支持高精度性能测试场景的网络抓包和数据分析，基夲不影响网络自身传输质量

以下文章与大家一起交流、探讨。

在功能测试方面异常网络环境下保证产品功能正确性和保护用户体验，昰互联网产品交付的重要指标需要高可用的网络控制工具在实验室环境模拟各种现实异常网络场景。目前市场上的工具大概分为两类：┅是硬件控制如网络损伤仪；二是软件控制，商业软件如Fiddler与Charles开源软件如ATC与clumsy等。硬件方案可提供}

快乐无忧网