我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:六合公式 > 仿射变换 >

今日芯声 拒绝大众化!不整容也能让你得到一张独一无二的脸

归档日期:04-13       文本归类:仿射变换      文章编辑:爱尚语录

  “今日芯声”是读芯术推出的一档简读栏目,汇聚每日国内外最新最热的AI应用资讯,敬请关注。

  万圣节刚过不久,小编在一直被 Cos的过程中感到瑟瑟发抖......在鬼面具,小丑面具,各种惊悚面目的突袭氛围中刚回神儿,就在公众号被种草了一个大胆的想法:

  要是所有凶恶的脸,用CV给合成为一张脸,是不是就能出现一张独一无二、天下第一凶恶的脸呢?

  通过 Image Morphing 技术,给定两张图片 I 和 J ,就可以叠加(或者叫做混合)I 和 J 来获得一张中间状态的图片 M。I 和 J 的叠加由一个参数[0,1]区间内的参数 alpha 来控制。

  当 alpha=0时,M 就等同于 I,而 aphla=1时,M 就为 J。换言之, M 中的每一个像素 M(x,y),都可以通过这样一个公式来得到它的值:

  当 alpha=0.5的时候,I 和 J 就五五开,平均贡献了 M。如果 I 和 J 是两张人脸照片的话,M 自然也就成了它们的“平均脸”。

  妈耶,重影图是什么意思??差强人意。那假如我们把两个人的眼睛和嘴对齐,看看是什么效果。(Show time!)

  要想对齐两张人脸,需要建立两张照片中像素的对应关系。对 I 中的某一个像素点(xi,yi),找到它在 J 中的对应点 (xj,yj),进一步找到 M 中这两个点叠加之后所处位置(xm,ym)。再用下面算式1(记住这个标号,后面有用)计算出 M 中对应点的像素值:

  将上面的过程运用到整幅画每一个像素点上算式2(记住这个标号,后面有用):

  接下来,可以把一张人脸分割成若干三角形的区域,叠加两张脸上对应的三角区域。

  在获得了68个面部基准点之后,我们结合人脸所在的矩形的四个顶点和每条边的中心点,将人脸所在的矩形分割成如下图所示的三角形的组合。

  得到这些Delaunay剖分三角形后,再分别对齐各个区域,对其中像素值进行平均。

  使用前述的算式1,根据图像I和图像J中已经获得的76个点,在叠加的结果图像M中找到76个点(xm, ym),从图像I中选取一个三角形 ti,在 M 中找到对应区域 tm,通过 ti 三个顶点到 tm 三个顶点的映射关系来计算 ti 到 tm 的仿射变换。同理计算出tj到tm的仿射变换。

  重复这个过程,处理图像 I 中的每一个三角形,得到一个扭曲的(warped)图像 I。用同样的方法处理图像 J,获得扭曲的图像 J。得到了扭曲的图像 I和图像 J。这两个图像就可以直接使用算式2进行叠加了。最后得到叠加结果:

  万圣节上演一出“变脸”好戏!种草种草,cos了我的小怪们要不要出来战斗?(无敌是多么多么寂寞~~~)

  出国旅游,语言是最大障碍。虽然现在手机上也有很多翻译软件,但是从小编的使用经历来看,却是贼不!靠!谱!

  手机的翻译软件,在家安安静静的环境,有时候都可能翻译错误,更何况到了旅游景点,人来人往嘈杂的环境,收音不清,翻译半天也没出个结果……

  每次对话,都要对着手机大喊,结果翻译出来的内容风马牛不相及,整天举着手机翻译,电量唰唰唰就没了,等真要用到手机联系人的时候才发现已经开不了机了……

  准儿GO翻译机是由来自清华大学的团队研发一款主打旅游服务的翻译机,针对不同地域的语言之间存在的口音差别,通过搭载深度学习,口音修复,解决不同国家的口音识别。

  所以准儿GO不仅仅是机械的翻译标准口音,而在遭遇“方言”时也能轻松的应对。在旅游的时候使用翻译机,最怕的就是周边环境最嘈杂,而这个准儿GO也帮你想到了。它采用的是四麦降噪技术,可以有效的抑制环境噪音,对人声的识别更准确。

  从语言的掌握程度来看,这款准儿GO可以说是翻译机界的翘楚了,绝对秒杀市面上大部分的翻译机。它包含了45种语言之间的互译,不仅支持中文对外语的互译,同时支持外语对外语的互译,这样强大的功能,虽然是一款专门针对旅游研发的翻译机,但是放在商务场合也是非常合适的。

  另外,准儿GO还贴心考虑到了方言的问题,拥有9种英语口音、2种法语、2种西班牙语……在内的57种口音,面对“口音重”的英语也不担心出现听不懂的问题。

  出门在外,不可能随时都有网络,如果网络不通的地方需要用到翻译机怎么办?有了准儿GO离线照样沟通不误。

  它内置了离线翻译引擎,支持中英日韩俄法6国离线翻译,采用TZ-NMT神经递归离线算法,将翻译模型压缩到1/50,提升离线双向翻译准确率及响应速度。以后再也不用担心,出门在外网络差或者没网络时,翻译机不能用啦~

  出国旅游,到餐厅吃饭翻菜单的时候看着那密密麻麻的外文是不是又要头疼了,准儿Go,它的AI拍照翻译,文章、菜单、路牌、商品标签都难不倒它,可以支持15 语种言的对中/英的拍照翻译。

  一路上有任何看不懂的路牌,一拍就翻译出来,那些奇特的建筑、美丽的画作、城市的雕塑,拍一下就知道其历史和典故,不但悠闲的一路看风景,还能预防路痴在同一个地方来回转。

  神奇的AI识物功能,强大的OCR识别技术,只要你将动物、植物拍摄下来,就可以通过AI识别图像,并且看到这个图像的详细介绍哦~

  景区导览功能让你在游玩的同时,不再是走马观花,大字不识的状态。比如你在法国巴黎,卢浮宫是必去之地吧,只要你问AI语音秘书,它就能给你科普这个景点的历史、故事,让你成为移动的百科全书。

  在看过那么多女孩在国外遭遇不测的新闻之后,我们才意识到,关键时候的自保能力是一件多么重要的事情。

  这款准儿GO贴心的考虑到了旅途中可能出现的任何状况,开启它的SOS功能,准儿罗列了N多个国家的国家区号、报警电话、急救电话、中国领事馆地址、电话等,有了准儿GO,单身妹纸在国外旅游是不是更有安全感了呢?

  家庭 / 公寓租赁服务公司 Airbnb 发表论文,公布了他们如何将 AirBnB 的主要列表搜索引擎转换为基于神经网络的系统的详细信息。

  本文重点强调了在产品和研究中部署AI系统的不同,并表示这是继谷歌在 2015 年用“RankBrain”增强其搜索引擎之后的另一大突破。

  “RankBrain”是一个基于神经网络的系统,发布之后几乎在一夜之间成为选择向用户显示搜索结果的最重要因素之一。 “这篇论文面向的是那些拥有机器学习系统并开始考虑使用神经网络(NN)的团队,”研究人员写道。

  AI 研究的其中一个秘密之一,就是前沿研究于生产用例之间的鸿沟,研究人员偏爱在样本任务中的新方法,而行业和大企业却偏爱可以大规模泛化的简单技术。

  该研究的目的就是解决这样的问题,研究人员从开始使用单层神经网络模型,之后使用更复杂的系统,再选择扩大规模的解决方案作为最终产品。 “通过简单地将训练数据缩放 10 倍并移动到具有 2 个隐藏层的 DNN,这并不复杂。”

  Airbnb的主要搜索引擎采用深度学习进一步表明,深度学习已进入工业化阶段,大型公司将会采用该技术并将其整合到最重要的产品中。

  小编已然感受到了AI“润物细无声”地不可缺少之处,“寒冬将至”这种言论当然也不攻自破。

  想象力技术公司(Imagination Technologies)推出了PowerVR PVRIC4,这是该公司新一代强大的图像压缩技术,能够在平板电脑和智能手机上实现更好的图像质量。

  总部位于伦敦的想象力技术公司(Imagination Technologies)表示,采用这种技术的客户正瞄准数字电视、智能手机和平板电脑等设备以降低成本,同时又不会明显降低图像质量。

  PVRIC4实现了随机访问的视觉无损图像压缩,确保了至少50%的带宽和内存占用,并使系统能够克服性能带宽限制。

  想象力使PVRIC4成为一个系统芯片(SoC)制造商集成到他们的多媒体管道的独立知识产权块。

  这一区块已经被包括Chips & Media在内的Imagination合作伙伴所使用,这些合作伙伴可以访问PVRIC4,这是最近的一项合作的一部分,目的是为一个利用PowerVR GPU和WAVE5视频编解码器的系统提供一个最佳的解决方案。

  “对内存带宽和占用空间的日益增长的需求是SoC制造商真正关心的问题,因此结合无损压缩和视觉无损压缩的能力可以节约成本和带宽。”

  PVRIC4的特点是双管道框架缓冲压缩引擎。一种新的有损管道,仅在无损管道不能达到50%压缩的情况下使用,可以确保即使难以压缩的“噪声”图像也能以最高的保真度进行压缩。

  一个决策逻辑块决定应该使用哪个输出来保证压缩比,由于高度调优的算法,图像质量的变化是难以察觉的。

  由于这种混合解决方案,PVRIC4为SoC制造商提供了两种方法中最好的一种,最高的保真度确保了在图形和视频内容上节省带宽和帧缓冲分配。这都是在硬件中执行的,实现时没有任何性能开销。

  PVRIC4带宽的储蓄转化为更好的电池寿命为消费者和成本节约系统制造商,使更多的内存和带宽被释放为其他用途,如启用同步快5 g下载在GPU使用或减少系统中使用的内存芯片数量。

  想象力公司PowerVR执行副总裁奈杰尔·利德(Nigel Leeder)在一份声明中表示:“随着更高分辨率4K和8K显示器的需求不断增加,以及降低系统成本的愿望,将内存带宽最小化的需求一直是我们客户的首要任务。

  他们需要一个能降低成本、降低电力的解决方案。通过在我们的GPU中引入视觉无损压缩,我们现在可以保证减少内存带宽和使用。”

  PVRIC4将作为下一代PowerVR GPU的一个特性被使用,现在可以作为一个独立的IP块获得授权。

本文链接:http://renfriends.com/fangshebianhuan/8.html