当前位置:首页 >百科 >程序员应知应会之视频描述算法 描述 随着ChatGPT的程序火爆

程序员应知应会之视频描述算法 描述 随着ChatGPT的程序火爆

2024-06-30 21:17:23 [百科] 来源:避面尹邢网

程序员应知应会之视频描述算法

作者:信息时代风之影 人工智能 机器翻译的程序基本思路是: 将输入的源语句和目标语句表示在同一向量空间内,首先使用编码器将源语句编码为一个中间向量,视频算法然后再通过解码器将中间向量解码为目标语句。描述

随着ChatGPT的程序火爆,人们对于人工智能领域的视频算法发展产生了极大的兴趣。很多专家认为,描述一个人工智能的程序时代将随着软硬件技术的快速发展即将到来。那么,视频算法作为信息技术领域的描述先锋队,对于程序员们来说,程序学习人工智能技术也就成了必然的视频算法课题。

通常来讲,描述人工智能可以分为三个研究方向:计算智能、程序感知智能和认知智能。视频算法

程序员应知应会之视频描述算法 描述 随着ChatGPT的程序火爆

计算智能是描述人们比较熟悉的计算机的常规操作,例如数值运算、矩阵分解、微积分计算等。

程序员应知应会之视频描述算法 描述 随着ChatGPT的程序火爆

感知智能是指将物理世界的信号通过摄像头、麦克风或者其他传感器的硬件设备,借助语音识别、图像识别等前沿技术,映射到数字世界,再将这些数字信息进一步提升至可认知的层次,比如记忆、理解、规划、决策等等。

程序员应知应会之视频描述算法 描述 随着ChatGPT的程序火爆

认知智能则更类似于人类的思维理解、知识共享、行动协同或博弈等,也就是说基于获取的信息做出思考与决策。这一阶段需要运用计算智能、感知智能的数据清洗、图像识别等能力。除此之外,还需要拥有对于业务需求的理解以及对分散数据、知识的统筹治理能力,从而能够针对业务场景进行策略构建和决策。

目前来说,大量的人工智能工作集中在感知智能阶段,对于认知智能,则相对来说进展较为缓慢。

在认知智能领域,与人们生活最为接近的是视频描述技术。通过感知智能技术中的视频分类、物体检测等技术,我们可以对于视频中出现了什么物体进行识别。但是这并不能使人们理解视频到底描述了什么,只能机械的描述说,一个红脸的男人、一把刀和一匹红色的马之类的。

视频描述需要识别出视频中的物体,并理解物体之间的相互关系,同时理解场景的不同,物体运动和行为的不同,结合相应的已存储知识,作出符合实现的描述。这都在技术上带来了很大的挑战性。是一个整合了计算机视觉和自然语言处理的综合技术,类似于将一段视频翻译成一段话。不仅要正确理解视频内容,还要用自然语言表达出视频中物体之间的关系。

当前视频内容描述算法主要分为基于语言模板的方法、基于检索的方法和基本编码器解码器的方法。下面我们分别来介绍一下。

一、基于语言模板的方法

基于语言模板的方法首先通过视频分类或目标检测等方法检测出视频中目标、属性、动作以及目标之间的关系等,然后将检测到的物体,依据一定的规则,填入到事先制定好的语言模板中,从而形成一句完整的描述语句。

基于语言模板的方法简单直观,但是由于受到固定模板的限制,生成的句子语法结构单一,表达形式缺乏灵活性。同时这种方法必须进行前期细致的标注工作,为视频中包含的每个物体、动作、属性等制定统一的类别标签。而且该方法对于超出模板范围的视频,会给出差异很大的结果。

图片

二、基于检索的方法

基于检索的方法,首先需要建立一个数据库,数据库中每个视频都有对应的语句描述标签。输入待描述的视频,然后找到数据库中与之最相似的一些视频,经过归纳和重置,把该相似视频对应的描述语句迁移到待描述的视频。

通常来讲,基于检索的方法生成的描述语句更加贴近人类自然语言的表达形式,句子结构更加灵活。但是此方法严重依赖数据库的大小,当数据库中缺少与待描述视频类似的视频时,生成的描述语句将和视频内容存在较大的误差。上述两种方法都严重依赖视觉前期复杂的处理过程,且存在对后期生成句子的语言模型优化不足的问题。对于视频描述问题,这两类方法都难以生成描述准确、表达形式多样的高质量语句。

三、基于编码器解码器的方法

基于编码解码器的方法,是目前视频描述领域的主流方法。这主要受益于基于深度神经网络的编码解码模型在机器翻译领域取得的突破进展。

机器翻译的基本思路是: 将输入的源语句和目标语句表示在同一向量空间内,首先使用编码器将源语句编码为一个中间向量,然后再通过解码器将中间向量解码为目标语句。

视频描述问题本质上也可以看做是一个“翻译”问题,即把视频翻译成自然语言。此方法前期不需要对视频采取复杂的处理过程,能够直接从大量的训练数据中学习视频到描述语言的映射关系,实现端到端的训练,并且能够产生内容更加精确、语法灵活和形式多样的视频描述。

责任编辑:武晓燕 来源: 活在信息时代 程序员视频算法

(责任编辑:焦点)

    推荐文章
    • 单日8家IPO公司集体大考 多公司闯关涉及官司

      单日8家IPO公司集体大考 多公司闯关涉及官司进入12月,IPO项目的审核工作将陆续开展。根据安排,12月2日将有合富(中国)医疗科技股份有限公司、益方生物科技(上海)股份有限公司(以下简称“益方生物”)在内的8家企业集体 ...[详细]
    • 斑鸠哥是什么梗

      斑鸠哥是什么梗达稼与达仑是指什么?一夜,秀才与达仑纳凉于竹下,竹忽弯头勾达仑发,摔之卧地,四脚朝天。达仑怒而砍断竹,拟作柴火烧之,为同村一老妪乞去,作织布机上线筒。自是老妪每田间劳...农村老话“三虎出一豹,三斑出 ...[详细]
    • 法外狂徒张三沃尔沃什么梗

      法外狂徒张三沃尔沃什么梗法外狂徒张三是什么梗?揭秘罗翔老师出圈之路?就是罗翔老师经常把罪犯的名字叫张三,一犯罪就是张三的名字,所以张三是法外狂徒就是罗翔老师经常把罪犯的名字叫张三,一犯罪就是张三的名字,所以张三是法外狂徒罗翔 ...[详细]
    • 陈皮可以和桑葚一起泡吗

      陈皮可以和桑葚一起泡吗桑椹子和陈皮可以泡水喝吗?病情分析:意见建议:桑葚--可以促进血红细胞的生长,防止白细胞减少,并对治疗糖尿病、贫血、高血压、高血脂、冠心病、神经衰弱等病症具有辅助功效。皮。桂圆,桑葚,陈皮一起泡水像我 ...[详细]
    • 绿色债券迎密集发行期 银行参与绿色金融债券发行的热情高涨

      绿色债券迎密集发行期 银行参与绿色金融债券发行的热情高涨银行正在积极开展绿色金融业务,据北京商报记者11月10日不完全统计,今年以来,已有长沙银行、工商银行、南京银行、重庆银行、苏州银行、马鞍山农商行等多家银行获批或已获批发行绿色金融债券。除绿色债券外,在 ...[详细]
    • 导管是什么意思梗

      导管是什么意思梗导管是什么意思网络用语?网络用语导管意思是指维管植物木质部由柱状细胞构成的水分与无机盐长距离运输系统,次生壁厚薄不匀地加厚,端壁穿孔或完全溶解,从而形成纵向连续通道。同时,还...血栓是什么?血栓是什 ...[详细]
    • 鹿晗什么梗

      鹿晗什么梗鹿晗关晓彤什么梗?王牌对王牌只要关晓彤在的地方,鹿晗的名字就随处可见,因此有人说关晓彤应该领双份工资王牌对王牌只要关晓彤在的地方,鹿晗的名字就随处可见,因此有人说关晓彤...鹿晗的年龄是什么梗?鹿晗的 ...[详细]
    • 手表辨别方向的方法

      手表辨别方向的方法哪位大神清楚用手表怎么判断方向_饰品装修你好,一、手表判断方向的方法:方法很简单,将你手表当前的时间除以2,再在表盘上找出商数的相应位置,然后将这个数字对准太阳,表盘上“12”点所指的方向就是北。手表 ...[详细]
    • 中盐集团实现一季度生产经营“开门红” 各项指标稳中向好

      中盐集团实现一季度生产经营“开门红” 各项指标稳中向好2022年一季度,中盐集团实现营业收入同比增长48.8%,利润总额同比增长163.0%,净利润同比增长163.3%,再创历史新高,其他指标稳中向好、增速明显,“四利两率”全面优 ...[详细]
    • 歌曲问情

      歌曲问情前言:答:《问情》演唱:蔡幸娟山川载不动太多悲哀岁月禁不起太长的等待春花最爱向风中摇摆黄沙偏要将痴和怨掩埋一世的聪明情愿糊涂一身的遭遇向谁诉爱到不能爱聚到终须散繁华过后成一梦啊海水永不干天也望不穿红尘 ...[详细]
    热点阅读