打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
有关视频的一些常用名词解释

     虽然记得几年前有人说不能使用几个字母的缩写之类来进行简称,但是实际上还是有许多是不能一下更改的,这几天在做和视频相关的一些工作,简单记录一下这些小知识。

     PAL和NTSC

      PAL制式是电视广播中色彩编码的一种方法。全名为 Phase Alternating Line 逐行倒相。除了北美,东亚部分地区使用 NTSC制式 ,中东、法国及东欧采用 SECAM制式以外,世界上大部份地区都是采用 PAL。PAL 由德国人 Walter Bruch 在1967年提出,当时他是为德律风根(Telefunken)工作。“PAL”有时亦被用来指625 线,每秒25格,隔行扫瞄,PAL色彩编码的电视制式。

     PAL 发明的原意是要在兼容原有黑白电视广播格式的情况下加入彩色讯号。PAL 的原理与 NTSC 接近。“逐行倒相”的意思是每行扫瞄线的彩色讯号,会跟上一行倒相。作用是自动改正在传播中可能出现的错相。早期的 PAL 电视机没有特别的组件改正错相,有时严重的错相仍然会被肉眼明显看到。近年的电视会把上行的色彩讯号跟下一行的平均起来才显示。这样 PAL 的垂直色彩分辨率会低于NTSC 。但由于人眼对色彩的灵敏不及对光暗,因此这并不是明显问题。

       NTSC是National Television System Committee的缩写,其标准主要应用于日本、美国,加拿大、墨西哥等等。

NTSC电视标准,每秒29.97帧(简化为30帧),电视扫描线为525线,偶场在前,奇场在后,标准的数字化NTSC电视标准分辨率为720*486, 24比特的色彩位深,画面的宽高比为4:3。NTSC电视标准用于美国、日本、加拿大、墨西哥等国家和地区。

  这两种制式是不能互相兼容的,如果在PAL制式的电视上播放NTSC的影响,画面将变成黑白,NTSC制式的也是一样。而做为视频拍摄工具的数码摄像机,也同样有制式的问题,比如我国使用PAL制式,在我国销售的数码摄像机都是PAL制式的,如果是NTSC制式的摄像机拍摄出来的图象不能在PAL制式的电视机上正常播放。因此,可以肯定的说,在我国销售的数码摄像机行货一定是PAL制式的,如果是NTSC制式的数码摄像机,则一定是水货。

  PAL制式和NTSC的分辨率也有所不同,PAL制式使用的是720×576,而NTSC制式使用的是760×480,在分辨率上PAL稍稍占有优势。而PAL制式的画面解析度720×576,约40万象素,也决定了PAL制式的数码摄像机的CCD大小应该为40万的倍数或者半倍数,比如2倍或者1.5倍,所以PAL制式数码摄像机都是80万,或者107万(接近100万,40万的2.5倍)、155万(接近160万,40万的4倍)。而NTSC制式的画面解析度为720×480,约34万象素,所以NTSC制式的数码摄像机一般为68万象素等等。

  由于制式的不同,一般数码摄像机厂商在发行数码摄像机的时候,都会发行两种数码摄像机:一种是PAL制式的,一种是NTSC制式的。而型号也会有所不同,比如佳能的中高端数码摄像机MVX150i,其NTSC制式的对应机型为OPTURA 20。三星的PAL制式一般是VP-D107,而对应的NTSC制式为SDV107。只要了解机身的型号,一般都能辨认出是NTSC制式还是PAL制式。这样分清水货行货也就容易多了。

  以NTSC电视机为例,在工作的时候,把一幅525行图像分成两场来扫,第一场称奇数场,只扫描奇数行(依次扫描1、3、5…行),而第二场(偶数场)只扫描偶数行(依次扫描2、4、6…行),通过两场扫描完成原来一帧图像扫描的行数,由于人眼具有视觉暂留效应,因此看在眼中时仍是一幅完整的图象,这就是隔行扫描。NTSC制节目共525行扫描线,每秒60场图像,表示为60i或525i,如果是逐行扫描的,就称作60P或525P。PAL制节目为625行,每秒50场图像,表示为50i或625i,逐行则称为50P或625P。记住,这是针对CRT电视机的。

       以上的表示方法,不仅代表了CRT电视的扫描格式,也代表摄像机拍摄的图像的格式。因为电视系统最初都是隔行扫描系统的,因此对应NTSC和PAL制电视节目的摄像机,也全部是隔行扫描的,就是说凡是电视摄像机拍摄的NTSC/PAL制节目,全部是隔行扫描信号,分别表示为525/60i和625/50i。记住,这是针对电视摄像机的。

  对于模拟电视图像,以扫描行表示,PAL制表示为625/50i;NTSC表示为525/60i。对于数字信号,则以像素或分辨率来表示,比如PAL制节目,分辨率为720*576,逐行可表示为576P,隔行为576i。NTSC分辨率为720*480,逐行为480P,隔行为480i。记住,这是针对电视图象的。

  CIF 、D1 、D1 IPC 、HD-SDI和960H

  CIF:352*288
  D1:就是4cif, (352*2 )*(288*2)
  D1 IPC 就是指的是D1分辨率的IPC(网络摄像头)
  HD-SDI是一个接口标准或者协议,应该是用在模拟摄像机上,分辨率应该也是1080p。
  960H:960*576

  WD1:是在D1分辨率(704×576)基础上提出的更清晰的适应宽屏的分辨率 960×576
 上面这些分辨率都是在PAL制下的,在NTSC下则不同。

case PIC_QCIF: pstSize->u32Width = 176; pstSize->u32Height = (VIDEO_ENCODING_MODE_PAL == enNorm) ? 144 : 120; break; case PIC_CIF: pstSize->u32Width = 352; pstSize->u32Height = (VIDEO_ENCODING_MODE_PAL == enNorm) ? 288 : 240; break; case PIC_D1: pstSize->u32Width = 720; pstSize->u32Height = (VIDEO_ENCODING_MODE_PAL == enNorm) ? 576 : 480; break; case PIC_960H: pstSize->u32Width = 960; pstSize->u32Height = (VIDEO_ENCODING_MODE_PAL == enNorm) ? 576 : 480; break; case PIC_2CIF: pstSize->u32Width = 360; pstSize->u32Height = (VIDEO_ENCODING_MODE_PAL == enNorm) ? 576 : 480; break;

 这是我在代码中遇到的PAL和NTSC的分辨率的不同。

 HD就是平常下载的高清电影 1280X720 1920X1080

 4K 分辨率即4096×2160 ,根据定义不同3840*2160也属于4K分辨率的范畴,毕竟4K的容量要求还是比较大的 885万像素

 定义就是要求达到一定的分辨率,所以4096×2160并不是固定4K大小

 DTS和PTS的解释 

FFmpeg里有两种时间戳:DTS(Decoding Time Stamp)和PTS(Presentation Time Stamp)。顾名思义,前者是解码的时间,后者是显示的时间。要仔细理解这两个概念,需要先了解FFmpeg中的packet和frame的概念。 
FFmpeg中用AVPacket结构体来描述解码前或编码后的压缩包,用AVFrame结构体来描述解码后或编码前的信号帧。对于视频来说,AVFrame就是视频的一帧图像。这帧图像什么时候显示给用户,就取决于它的PTS。DTS是AVPacket里的一个成员,表示这个压缩包应该什么时候被解码。如果视频里各帧的编码是按输入顺序(也就是显示顺序)依次进行的,那么解码和显示时间应该是一致的。可事实上,在大多数编解码标准(如H.264或HEVC,当出现B帧的时候)中,编码顺序和输入顺序并不一致。于是才会需要PTS和DTS这两种不同的时间戳。  

FPS(每秒传输帧数(Frames Per Second))

FPS是图像领域中的定义,是指画面每秒传输帧数,通俗来讲就是指动画或视频的画面数。FPS是测量用于保存、显示动态视频的信息数量。每秒钟帧数愈多,所显示的动作就会越流畅。通常,要避免动作不流畅的最低是30。

FPS”也可以理解为我们常说的“刷新率(单位为Hz)”,例如我们常在CS游戏里说的“FPS值”。我们在装机选购显卡和显示器的时候,都会注意到“刷新率”。一般我们设置缺省刷新率都在75Hz(即75帧/秒)以上。例如:75Hz的刷新率刷也就是指屏幕一秒内只扫描75次,即75帧/秒。而当刷新率太低时我们肉眼都能感觉到屏幕的闪烁,不连贯,对图像显示效果和视觉感观产生不好的影响。

电影以每秒24张画面的速度播放,也就是一秒钟内在屏幕上连续投射出24张静止画面。有关动画播放速度的单位是fps,其中的f就是英文单词Frame(画面、帧),p就是Per(每),s就是Second(秒)。用中文表达就是多少帧每秒,或每秒多少帧。电影是24fps,通常简称为24帧。

电脑中所显示的画面,都是由显卡来进行输出的,因此屏幕上每个像素的填充都得由显卡来进行计算、输出。

当画面的分辨率是1024×768时,画面的刷新率要达到24帧/秒,那么显卡在一秒钟内需要处理的像素量就达到了“1024×768×24=18874368”。

如果要求画面的刷新率达到50帧/秒,则数据量一下子提升到了“1024×768×50=39321600”。

FPS与分辨率、显卡处理能力的关系如下:

处理能力=分辨率×刷新率。这也就是为什么在玩游戏时,分辨率设置得越大,画面就越不流畅的原因了。

I帧 B帧 P帧

关键帧 
关键帧也叫作I帧,它是帧间压缩编码的最重要帧。视频的编码是按照“组”来进行的,每一个组叫作GOP(Group of Picture,图像组)。GOP与GOP之间是没有联系的。编码关系只在GOP之间产生。每一个GOP都是由关键帧开始的,关键帧是一幅完整的画面,GOP中间的帧都是不完整的,需要由关键帧、前面帧以及后面帧等一起运算得到。关键帧的间隔调节会影响GOP的长度,进而影响到读取GOP的速度。如果关键帧的间隔设置过大的话(GOP长度过大),在必须用到关键帧的场合就可能被迫使用B/P帧来代替,这就会降低画面质量。关键帧是帧间压缩的基础,典型的GOP(IBP帧包)结构一般是:IBBPBBPBBPBBPBBPBB。

前后参考帧叫做B帧,即参考前面和后面两帧的数据加上本帧的变化而得出本帧的数据。

向前参考帧叫做P帧。 
假设I帧损坏,那么整个GOP结构就坏掉了,即IBBPBBPBBPBBPBBPBB这么多帧一起坏掉,你设置过长的间隔也会导致编码出来的东西不稳定。

 音频平没有帧的概念。

 

RTP, RTSP,RTCP和RTMP

       RTP(Real-time Transport Protocol) 威胁多媒体数据传输的一个尖锐的问题就是不可预料数据到达时间。但是流媒体的传输是需要数据的适时的到达用以播放和回放。rtp协议就是提供了时间标签,序列号以及其它的结构用于控制适时数据的流放。在流的概念中”时间标签”是最重要的信息。发送端依照即时的采样在数据包里隐蔽的设置了时间标签。在接受端收到数据包后,就依照时间标签按照正确的速率恢复成原始的适时的数据。不同的媒体格式调时属性是不一样的。但是rtp本身并不负责同步,rtp只是传输层协议,为了简化运输层处理,提高该层的效率。将部分运输层协议功能(比如流量控制)上移到应用层完成。同步就是属于应用层协议完成的。它没有运输层协议的完整功能,不提供任何机制来保证实时地传输数据,不支持资源预留,也不保证服务质量。rtp报文甚至不包括长度和报文边界的描述。同时rtp协议的数据报文和控制报文的使用相邻的不同端口,这样大大提高了协议的灵活性和处理的简单性。
     rtp协议和udp二者共同完成运输层协议功能。udp协议只是传输数据包,不管数据包传输的时间顺序。 rtp的协议数据单元是用udp分组来承载的。在承载rtp数据包的时候,有时候一帧数据被分割成几个包具有相同的时间标签,则可以知道时间标签并不是必须的。而udp的多路复用让rtp协议利用支持显式的多点投递,可以满足多媒体会话的需求。
rtp协议虽然是传输层协议但是它没有作为osi体系结构中单独的一层来实现。rtp协议通常根据一个具体的应用来提供服务,rtp只提供协议框架,开发者可以根据应用的具体要求对协议进行充分的扩展。

实时传输控制协议(Real-time Control Protocol,RTCP) 也定义在1996年提出的RFC 1889中。多媒体网络应用把RTCP和RTP一起使用,尤其是在多目标广播中更具吸引力。当从一个或者多个发送端向多个接收端广播声音或者电视时,也就 是在RTP会话期间,每个参与者周期性地向所有其他参与者发送RTCP控制信息包,如图16-14所示。RTCP用来监视服务质量和传送有关与会者的信 息。对于RTP会话或者广播,通常使用单个多目标广播地址,属于这个会话的所有RTP和RTCP信息包都使用这个多目标广播地址,通过使用不同的端口号可 把RTP信息包和RTCP信息包区分开来。

RTCP的主要功能是为应用程序提供会话质量或者广播性能质量的信息。每个RTCP信息包不封装声音数据或者电视数 据,而是封装发送端和/或者接收端的统计报表。这些信息包括发送的信息包数目、丢失的信息包数目和信息包的抖动等情况,这些反馈信息对发送端、接收端或者 网络管理员都是很有用的。RTCP规格没有指定应用程序应该使用这个反馈信息做什么,这完全取决于应用程序开发人员。例如,发送端可以根据反馈信息来修改 传输速率,接收端可以根据反馈信息判断问题是本地的、区域性的还是全球性的,网络管理员也可以使用RTCP信息包中的信息来评估网络用于多目标广播的性 能。

实时流放协议(Real-Time Streaming Protocol,RTSP)是一个刚开始开发的协议,它的设想描述在RFC

播放的数据流被分成许多信息包,信息包的大小很适用于客户机和服务器之间的带宽。当客户机已经接收到足够多的信息包 之后,用户软件就可开始播放一个信息包,同时对另一个信息包解压缩和接收第三个信息包。这样用户就不需要把整个媒体文件从服务器上下载之后就可立即播放。 广播源可以是现场的数据流也可以是存储的数据流。

RTSP协议想要提供控制多种应用数据传送的功能,提供一种选择传送通道的方法,例如UDP, TCP, IP多目标广播通道,以及提供一种基于RTP协议的递送方法。正在设计的RTSP将工作在RTP的上层,用来控制和传送实时的内容。

RTSP能够与资源保留协议一起使用,用来设置和管理保留带宽的流式会话或者广播。

持续更新,添加编解码不同格式

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
5d4相机拍视频怎样设置参数?
分辨率、帧率、宽高比、像素宽高比等视频参数的概念和区别
用格式工厂FLV转换MPG的方法
理解高清和标清视频格式的图像尺寸
3D家用显示设备
EOS 60D短片拍摄的2个要点
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服