PNG
注 : 笔记中拓扑图 xmind 源文件在其图片目录下
什么是PNG
PNG 是 20 世纪 90 年代中期开始开发的图像文件存储格式,其目的是替代 GIF 和 TIFF 文件格式,同时增加一些 GIF 文件格式所不具备的特性。流式网络图形格式 (Portable Network Graphic Format,PNG) 名称来源于非官方的 “PNG's Not GIF”,是一种位图文件(bitmap file) 存储格式,读成“ping”。PNG 用来存储灰度图像时,灰度图像的深度可多到 16 位,存储彩色图像时,彩色图像的深度可多到 48 位,并且还可存储多到 16 位的 α 通道数据。PNG 使用从 LZ77 派生的无损数据压缩算法。
文件结构
PNG 图像格式文件由文件署名和数据块(chunk)组成。
文件署名域
8 字节的 PNG 文件署名域用来识别该文件是不是 PNG 文件。该域的值是:
137
89
80
50
78
4e
71
47
13
0d
10
0a
26
1a
10
0a
其中第一个字节 0x89 超出了 ASCII 字符的范围,这是为了避免某些软件将 PNG 文件当做文本文件来处理。文件中剩余的部分由3个以上的 PNG 的数据块(Chunk)按照特定的顺序组成,因此,一个标准的 PNG 文件结构应该如下:
数据块
这里有两种类型的数据块,一种是称为关键数据块(critical chunk),就是必须要有的块;另一种叫做辅助数据块(ancillary chunks),这是可选的数据块。
每个数据块都由下表所示的的4个域组成。
Length(长度)
4字节
指定数据块中数据域的长度,其长度不超过$(2^{31}-1)$字节
Chunk Type Code(数据块类型码)
4字节
数据块类型码由 ASCII 字母(A-Z和a-z)组成
Chunk Data(数据块实际内容)
可变长度
存储按照 Chunk Type Code 指定的数据
CRC(循环冗余检测)
4字节
存储用来检测是否有错误的循环冗余码
其中 CRC(cyclic redundancy check)域中的值是对 Chunk Type Code 域和 Chunk Data 域中的数据进行计算得到的,可以看做一种校验码。
关键数据块
关键数据块中的4个标准数据块是:
IHDR 文件头数据块(header chunk)
它包含有 PNG 文件中存储的图像数据的基本信息,并要作为第一个数据块出现在 PNG 数据流中,而且一个 PNG 数据流中只能有一个文件头数据块。
文件头数据块由 13 字节,组成结构如下:
Width
4 bytes
图像宽度,以像素为单位
Height
4 bytes
图像高度,以像素为单位
Bit depth
1 byte
图像深度:索引彩色图像:1,2,4 或 8 ; 灰度图像:1,2,4,8 或 16 ; 真彩色图像:8 或 16
ColorType
1 byte
颜色类型:0:灰度图像, 1,2,4,8 或 16;2:真彩色图像,8 或 16;3:索引彩色图像,1,2,4 或 84:带α通道数据的灰度图像,8 或 16;6:带α通道数据的真彩色图像,8 或 16
Compression method
1 byte
压缩方法 (LZ77 派生算法)
Filter method
1 byte
滤波器方法
Interlace method
1 byte
隔行扫描方法:0:非隔行扫描; 1: Adam7(由 Adam M. Costello 开发的 7 遍隔行扫描方法)
PLTE 调色板数据块(palette chunk)
它包含有与索引彩色图像((indexed-color image))相关的彩色变换数据,它仅与索引彩色图像有关,而且要放在图像数据块(image data chunk)之前。真彩色的 PNG 数据流也可以有调色板数据块,目的是便于非真彩色显示程序用它来量化图像数据,从而显示该图像。结构如下:
Red
1 byte
0 = 黑色, 255 = 红
Green
1 byte
0 = 黑色, 255 = 绿色
Blue
1 byte
0 = 黑色, 255 = 蓝色
PLTE 数据块是定义图像的调色板信息,PLTE 可以包含 1~256 个调色板信息,每一个调色板信息由 3 个字节组成,因此调色板数据块所包含的最大字节数为 768,调色板的长度应该是 3 的倍数,否则,这将是一个非法的调色板。
对于索引图像,调色板信息是必须的,调色板的颜色索引从 0 开始编号,然后是 1、2……,调色板的颜色数不能超过色深中规定的颜色数(如图像色深为 4 的时候,调色板中的颜色数不可以超过 2^4=16),否则,这将导致 PNG 图像不合法。
真彩色图像和带 α 通道数据的真彩色图像也可以有调色板数据块,目的是便于非真彩色显示程序用它来量化图像数据,从而显示该图像。
IDAT 图像数据块(image data chunk)
它存储实际的数据,在数据流中可包含多个连续顺序的图像数据块。
IDAT 存放着图像真正的数据信息,因此,如果能够了解 IDAT 的结构,我们就可以很方便的生成 PNG 图像。
IEND 图像结束数据(image trailer chunk)
它用来标记 PNG 文件或者数据流已经结束,并且必须要放在文件的尾部。
如果我们仔细观察 PNG 文件,我们会发现,文件的结尾 12 个字符看起来总应该是这样的:
不难明白,由于数据块结构的定义,IEND 数据块的长度总是 0(00 00 00 00,除非人为加入信息),数据标识总是 IEND(49 45 4E 44),因此,CRC 码也总是 AE 42 60 82。
最后,除了表示数据块开始的 IHDR 必须放在最前面, 表示 PNG 文件结束的 IEND 数据块放在最后面之外,其他数据块的存放顺序没有限制。
辅助数据块
PNG 文件格式规范制定的 10 个辅助数据块是:
bKGD 背景颜色数据块 (background color)。
cHRM 基色和白色度数据块 (primary chromaticities and white point)。所谓白色度是指当 R=G=B= 最大值时在显示器上产生的白色度。
gAMA 图像 γ 数据块 (image gamma)。
hIST 图像直方图数据块 (image histogram)。
pHYs 物理像素尺寸数据块 (physical pixel dimensions)。
sBIT 样本有效位数据块 (significant bits)。
tEXt 文本信息数据块 (textual data)。
tIME 图像最后修改时间数据块 (image last-modification time)。
tRNS 图像透明数据块 (transparency)。
zTXt 压缩文本数据块 (compressed textual data)。
数据块摘要
关键数据块、辅助数据块和专用公共数据块(special-purpose public chunks)综合下表中:
IHDR
文件头数据块
否
否
第一块
cHRM
基色和白色点数据块
否
是
在 PLTE 和 IDAT 之前
gAMA
图像 γ 数据块
否
是
在 PLTE 和 IDAT 之前
sBIT
样本有效位数据块
否
是
在 PLTE 和 IDAT 之前
PLTE
调色板数据块
否
是
在 IDAT 之前
bKGD
背景颜色数据块
否
是
在 PLTE 之后 IDAT 之前
hIST
图像直方图数据块
否
是
在 PLTE 之后 IDAT 之前
tRNS
图像透明数据块
否
是
在 PLTE 之后 IDAT 之前
oFFs
(专用公共数据块)
否
是
在 IDAT 之前
pHYs
物理像素尺寸数据块
否
是
在 IDAT 之前
sCAL
(专用公共数据块)
否
是
在 IDAT 之前
IDAT
图像数据块
是
否
与其他 IDAT 连续
tIME
图像最后修改时间数据块
否
是
无限制
tEXt
文本信息数据块
是
是
无限制
zTXt
压缩文本数据块
是
是
无限制
fRAc
(专用公共数据块)
是
是
无限制
gIFg
(专用公共数据块)
是
是
无限制
gIFt
(专用公共数据块)
是
是
无限制
gIFx
(专用公共数据块)
是
是
无限制
IEND
图像结束数据
否
否
最后一个数据块
tEXt 和 zTXt 数据块中的标准关键字:
Title
图像名称或者标题
Author
图像作者名
Description
图像说明
Copyright
版权声明
CreationTime
原图创作时间
Software
创作图像使用的软件
Disclaimer
弃权
Warning
图像内容警告
Source
创作图像使用的设备
Comment
各种注释
案例分析
文件署名域 八个字节的文件头标志,标识着 png 文件
IHDR 数据块
IDAT 数据块
IEND 数据块