AD
宝山新闻>科技>影像技术发展世纪图谱:从传统机器影像到智能影像生产

影像技术发展世纪图谱:从传统机器影像到智能影像生产

2019-12-02 19:35:13 作者:匿名 阅读量:223
摘要: 影像技术历经近两个世纪的发展,目前在视频影像分析、图像识别、人脸识别、智能驾驶、医疗影像检测等影像行业综合应用领域风生水起。智能影像技术是借助人工智能的再度突破而催生的影像生产技术。通过对影像数据的多

从2d静止图像到3d运动图像,从机器图像到智能图像,图像给人类带来真实、生动的视觉体验,并日益丰富日常生活。我们还利用视觉技术构建新的图像,不断改变经济和社会生产方式。经过近两个世纪的发展,图像技术现已广泛应用于视频图像分析、图像识别、人脸识别、智能驾驶、医学图像检测等图像行业。接下来,本文将对其发展过程进行简要总结和梳理。

作为图像生成技术的基础,计算机视觉最早诞生于20世纪60年代。一个世纪前,许多专家、学者和专业人士一直在不断探索和创新图像技术。

从19世纪初到20世纪初:图像形成的初始阶段是无声的图像阶段。在这个阶段,科学家首先发现了这个原理,然后发明家和该行业的专业人士进行了技术创造和机器实验。

1829年,比利时物理学家约瑟夫·普拉托(Joseph prato)发现了“视觉持久性原理”,这被广泛认为是动画和电影的理论基础。当一个物体在人眼前消失时,该物体的图像将在人类视网膜上保留0.1-0.4秒。真正把运动图像技术带入人们眼中的是法国卢米埃兄弟,他们在1895年成功开发了“运动电影机器”。在他的作品《火车停在车站》中,原始静态单一图像被转化为分镜头和连续动态图像的视觉捕捉,使传统的视觉感知模式经历了裂变转向,增强了逻辑和叙事的视觉内容。

1903年,美国电影的先驱埃德温·波特(Edwin Porter)在他的代表作《火车大劫案》中用“遮挡法”代替了“背景投影法”。他创造性地应用了一系列创新技术,如镜头分割、移动摄影和定位拍摄。最大的突破是通过交叉编辑直接切换,并使用蒙太奇以一定的顺序组合镜头。

从20世纪20年代到60年代,图像与声音的结合技术越来越成熟,开始了全息技术时代。

1926年,华纳兄弟和通用电气公司开发了“维塔风”录音系统,1927年应用于“爵士歌手”,被称为第一部有声电影。

1947年,英国匈牙利物理学家丹尼斯·加博尔发明了全息术,标志着全息成像技术的到来。20世纪60年代末,古德曼和劳伦斯等人提出了新的全息概念“数字全息技术”。作为计算机技术、全息技术和电子成像技术的结合,它开创了精确全息技术的时代。

从20世纪60年代到21世纪,作为图像制作技术基础的计算机视觉和计算机图形学诞生了。机器产业化开始占据主导地位,图像产业彻底改变。

在此期间,计算机视觉的概念诞生了,3d成像、cg等技术相继应用于图像作品中。在标准化方面,由sgi开发的opengl开放三维图形标准、微软的标准接口directx、adobe的postscript等。进一步加快了影像生产的产业化。

同时,视觉算法中人工设计特征和机器学习算法的结合通用性较差。图像生产中的大量重复劳动严重限制了生产效率,并且难以大规模商业使用。推进产业升级迫切需要智能化、自动化的图像制作技术。

21世纪以来,随着深度学习、大数据和计算能力的突破和发展,成像行业已经进入智能成像时代。

进入21世纪后,特别是2006年以来,随着深入学习技术的突破性效果、计算能力的提高和海量数据的积累,人工智能在图像、语音、文本等多模态识别方面不断提高其图像感知和理解能力,形成了主要包括智能图像理解(sense and think)和自动图像生成(act)两部分的智能图像生成技术,推动了智能图像产业的快速发展。网飞、迪士尼、iQiyi、优酷等国内外文化传媒巨头正积极尝试在数字视频内容制作或制作等关键领域运用智能技术迭代,试图变得更加强大。

中国人工智能企业Moviebook阴影光谱技术是智能图像系统的开发者和倡导者。它可以支持大量的数字内容视频,集成多模态图像识别、情感背景和关键帧捕获等关键技术,分析和理解视频元数据,然后机器可以自动生成新的视频。电影图书(Moviebook)将这一技能延伸到整个产业链,为文化和媒体领域提供全程服务,包括智能视频的批量制作、视频资产管理和分析、智能视频操作以及智能视频的商业化。

智能成像技术的开发者认为,智能成像技术的应用将帮助企业在多个场景和维度上产生直接的财务绩效,并将在视频内容创作、视频智能营销、视频结构化商务、视频大数据领域、机器人加工等领域产生财务绩效,通过自动图像处理和生产技术为产业升级提供动力。

弗雷斯特“视频人工智能技术预测2019-2020”中的一组数据显示,到2021年,全球娱乐市场将超过2.6万亿美元,智能成像技术在全球娱乐市场的渗透率将在3年内从不到10%上升到60%,成为基础设施之一。本发明解决了大规模视频内容制作工作时间长、成本高的问题,能够提高视频内容的实现率和制作效率,降低劳动成本60%以上。

智能图像技术是随着人工智能的突破而诞生的一种图像生成技术。通过对图像数据的多模态语义理解,借助深度学习技术实现图像再处理和图像生成,为传统的人工组合cg的图像生成模式带来效率和质量的提高。应该指出,智能图像技术不同于影视行业的图像制作技术。后者侧重于如何呈现高水平的艺术效果,而智能图像技术侧重于图像产品生产力的飞跃。它可以在现有图像数据的基础上进行大量的编辑、叠加和嵌入,可以为广大受众产生个性化的输出,同时挖掘图像数据的增值。

技术创新在影像行业的发展中发挥着重要作用,为行业的蓬勃发展增添了超级助燃剂。变革将在2019年继续。随着5g技术的大规模商业应用,高分辨率视频流量将呈指数级增长。根据英特尔2018年10月发布的报告,未来视频图像将占5g网络数据流量的90%。智能化、规模化、自动化的图像制作技术将成为必然趋势。

(编辑:王庆余)

黑龙江快乐十分开奖结果 五百万彩票网 甘肃11选5投注 快乐赛车pk10 贵州11选5