文件格式定义
文件标准格式

文件标准格式在日常工作和学习中,我们经常需要编写各种文件,而文件的格式规范与否直接影响到文件的整体质量和美观程度。
因此,了解和掌握文件的标准格式显得尤为重要。
本文将就文件标准格式进行详细介绍,以便大家能够在日常生活中更加规范地进行文件编写。
首先,文件的标准格式包括了文件的基本要素,如页眉、页脚、标题、正文等。
在文件的顶部应当设置页眉,包括作者姓名、日期等信息;而在底部设置页脚,一般包括页码等信息。
标题应当居中设置,并在上方空出一定的距离,使其与页眉有所区分。
正文部分应当采用宋体或仿宋字体,字号一般为小四号。
段落的首行应当空两个字符,以便于阅读。
这些基本要素的设置能够使文件整体看起来更加规范和整洁。
其次,文件的标准格式还包括了文件的排版要求。
在排版方面,我们需要注意行间距、段间距、缩进等问题。
一般来说,行间距宜选择1.5倍行距或者固定值,以便于阅读和修改;段间距宜选择1.5倍行距,使得段落之间有明显的分隔;而段落的首行应当空两个字符,以突出段落的开头。
这些排版要求不仅能够提高文件的可读性,还能够使文件整体更加美观。
最后,文件的标准格式还包括了文件的保存与提交要求。
在保存文件时,我们需要选择合适的格式,如doc、docx等,以便于文件的打开和修改;在提交文件时,我们需要注意文件的命名规范,一般来说应当包括作者姓名、日期等信息,以便于管理和查找。
这些保存与提交要求能够提高文件的整体管理水平,使得文件更加规范和便于管理。
总之,文件的标准格式对于我们日常工作和学习都具有重要的意义。
通过了解和掌握文件的标准格式,我们能够更加规范地进行文件编写,提高文件的整体质量和美观程度。
希望大家在日常生活中能够重视文件的标准格式,使得我们的文件更加规范和整洁。
文件的必备内容及格式要求

文件的必备内容及格式要求在日常生活和工作中,我们经常需要写文件。
不论是申请文件、报告文件还是其他种类的文件,都需要我们按照一定的格式来书写。
本文将介绍文件的必备内容及格式要求,帮助您编写整洁美观、符合规范的文件。
一、文件的必备内容1. 标题:文件的首要内容是明确主题或目的的标题。
标题应简洁明了,并准确概括文件的内容。
理想情况下,一个好的标题应该能够一目了然地传达文件的主旨。
2. 日期:文件的日期是指文件起草或完成的日期。
日期应位于标题下方,使用常见的日期格式,例如“年-月-日”。
3. 收件人和发件人信息:在文件中,应列明收件人和发件人的详细信息。
收件人信息应包括姓名、职务、单位、地址等。
发件人信息则应包括发件人的姓名、职务、单位和联系方式。
4. 正文:正文是文件中最主要的内容部分。
在正文中,要清晰地陈述问题、陈述事实、阐明意见或论点。
正文要有逻辑性,段落之间的内容要有连贯性。
5. 结尾与落款:文件的结尾部分是表明发件人身份的部分。
一般来说,结尾部分应包括“敬礼”或类似的礼貌用语,以及发件人的姓名、职务和单位信息。
二、文件的格式要求1. 用纸规格:在书写文件时,要根据需要选择适当的用纸规格。
常见的用纸规格有A4纸、信纸等。
根据文件的复杂性和正文的长度,选择适当的用纸规格能够更好地展示文件的整体效果。
2. 字体和字号:在文件中,选择合适的字体和字号是保证整体美观的一部分。
常见的字体有宋体、黑体等,字号选择一般在12号至14号之间。
3. 行间距与段间距:适当的行间距和段间距能够让文件更易于阅读和理解。
一般情况下,行间距选择在1.5倍至2倍之间,段间距选择在1个空行至2个空行之间。
4. 标题和正文的区分:在文件中,标题和正文要有明确的区分。
可以通过字体加粗、居中、加下划线等方式来区分标题和正文。
同时要保证标题和正文之间的格式一致性。
5. 段落缩进:在文件的正文中,要注意段落的缩进。
一般情况下,每段落的开头应缩进2个字符的距离,以增加段落的整体清晰度。
所有的文件格式介绍

所有的文件格式介绍文件格式是一种特定的编码方式,用于存储和传输不同类型的数据。
在计算机系统中,各种不同的文件格式被设计用于存储和呈现文本、图像、音频、视频等多媒体数据。
下面是一些常见的文件格式的介绍:1.文字文件格式:- .txt:纯文本文件,只包含文本字符,没有任何格式化属性。
- .doc/.docx:微软 Word 文档格式,支持排版、字体设置、图表等功能。
- .pdf:便携式文档格式,可跨平台阅读和打印文档,保留文档原始格式。
2.图像文件格式:- .jpg/.jpeg:常见的有损压缩格式,适用于照片和图像。
- .png:无损压缩格式,支持透明度,适用于图像和图标。
- .gif:支持动画和透明度的格式,通常用于简单的动画效果。
3.音频文件格式:- .mp3:最常见的有损压缩音频格式,平衡了音质和文件大小。
- .wav:无损音频格式,保留了音频的原始质量,文件较大。
- .flac:无损音频格式,压缩效率高,音质无损。
4.视频文件格式:- .mp4:最常见的视频格式,支持高压缩比和高质量的音视频。
- .mkv:开放式多媒体容器格式,支持多种编码和多个音频、字幕轨道。
- .avi:最早的视频格式之一,现在仍然广泛使用。
5.压缩文件格式:- .zip:常见的文件压缩格式,可以将多个文件和文件夹打包成一个文件。
- .rar:高压缩比的压缩格式,支持分卷和密码保护功能。
-.7z:非常高的压缩比和较快的解压速度,适用于大文件压缩。
6.数据库文件格式:- .xls/.xlsx:微软 Excel 文件格式,用于存储和分析表格数据。
- .csv:逗号分隔的值文件格式,常用于存储和交换数据。
- .sql:结构化查询语言文件格式,用于数据库的创建、查询和修改。
7.电子书文件格式:- .epub:开放式电子书格式,适用于多种设备和阅读器。
- .mobi:亚马逊 Kindle 电子书格式,适用于 Kindle 设备和阅读器。
常见的文件格式

常见的文件格式常见的文件格式一、doc简介doc,是电脑文件常见副档名的一种,现在2009版为:DOCX。
该格式原是纯文字文件使用的,多见于不同的操作系统中,软硬件的使用说明。
至1990年代,微软在文书处理软件Word中,使用了doc作为副档名,并成为流行的格式,而前者的纯文字式已几近绝迹。
微软的“doc”格式是一种自己的专属格式,其档案可容纳更多文字格式、脚本语言及复原等资讯,比其他的文件档格式如RTF、HTML等要多,但因为该格式是属于封闭格式,因此其兼容性也较低。
在Palm OS系统中,“doc”是Palmdoc 所使用的副档名,一个完全无关的格式,主要用于电子图书的编码。
在外贸单据中,DOC (Document charges) 还有“文件费”的意思。
DOC : DiskOnChip一种在板存储芯片,工控计算机领域应用广泛。
1) 32Pin DIP单芯片大容量FLASH存储器,容量8M~1G字节,盛博系列核心模块可直接支持2) 内置TureFFS仿真系统实现全硬盘仿真,如硬盘一样读写3) 非易失性固态盘,掉电数据不丢失,低功耗4) 支持多种操作系统(DOS、WINDOWS、QNX、VxWorks、Linux、pSOS等)DOC: Dissolved Organic Carbon 溶解有机碳程序/转换器* Microsoft Word* wps office* 或StarOffice* Wordperfect* AbiWord* KOffice* DisplayWrite* Interleaf* Wordpad* WordStar类似文件格式* dOCX – Microsoft Office Open XML* ODT – OpenDocument Text* OASIS Open Office XML (又称为OpenDocument)* PDF - Adobe Portable Document Format* RTF - 微软的Rich Text Format* XPS – XML Paper SpecificationDOCWord文档格式。
常见的文件格式与扩展名解析

常见的文件格式与扩展名解析概述在计算机领域中,文件格式和扩展名是十分重要的概念。
文件格式指的是文件的内部结构和组织方式,而扩展名是用来标识文件格式的一部分,通常是由一个或多个字母组成的文件名的最后几个字符。
文件格式和扩展名有助于计算机正确识别和解析文件的内容,并将其与相应的程序关联起来。
下面将介绍一些常见的文件格式和扩展名,以及它们的特点和用途。
1. 文本文件 (*.txt)文本文件是由纯文本内容组成的文件,不包含格式和样式。
它们通常由记事本等文本编辑器创建和编辑。
文本文件的扩展名为".txt",在各种操作系统中都能被识别和打开。
它们广泛用于存储和传输纯文本数据,如代码文件、配置文件等。
2. Word 文档 (*.docx)Word 文档是由微软开发的一种文字处理文件格式。
其扩展名为".docx"。
与纯文本文件不同,Word 文档能够包含丰富的格式和样式信息,如字体、颜色、图表等。
Word 文档通常使用 Microsoft Word 或其他兼容软件进行创建和编辑。
它们被广泛应用于写作、办公、教育等领域。
3. Excel 表格 (*.xlsx)Excel 表格是一种电子表格文件格式,由 Microsoft Excel 创建和使用。
其扩展名为".xlsx"。
Excel 表格可以包含行和列的数据,支持各种运算、公式和函数。
Excel 是一款功能强大的数据分析和处理工具,广泛应用于商业、科学等领域。
4. PowerPoint 演示文稿 (*.pptx)PowerPoint 演示文稿是一种用于制作幻灯片演示的文件格式,由Microsoft PowerPoint 创建和编辑。
其扩展名为".pptx"。
PowerPoint 演示文稿可以包含文字、图像、音视频等多种元素,用于进行报告、展示和教育培训等活动。
5. 图像文件 (*.jpg, *.png, *.gif)图像文件是存储图像数据的文件,常见的图像文件格式有 JPEG、PNG 和 GIF。
电脑文件夹格式是什么

电脑文件夹格式是什么什么是文件名后缀说起来Windows工作界面下的文件名简直是随心所欲,比如:某编辑部的2000年工作计划。
文件名即可用中文直接表达,而且长度最长可达256个字符,让人看起来真是一目了然。
然而在Windows环境中,安装的软件中却大量存在着类似CALENDAR.EXE、GAMES.GRP等等的文件名,这又是为什么呢?原来这些文件名都是根据DOS环境的文件名命名规则而定的。
DOS环境下的文件名在DOS下,文件名采用8+3结构,即:最长8位的文件名,由小数点分隔后再跟上最长3位的后缀名,如:READ.ME、SETUP.EXE,一般情况下文件名不允许使用汉字,只能由字母、数字和一些符号组成。
如READ.ME用中文理解就是“读我”,即提示用户在使用软件前先看看这个文件的内容,以获取更多的提示信息。
而更重要的是,DOS下规定用后缀名来区分各种不同的文件。
在DOS下最容易遇到的首先是可执行文件,后缀名有两类:*.exe、*.com(此处的*表示文件名任意),它们是由汇编语言或其它高级语言编出的程序经过编译后直接在DOS下运行的文件。
有时由于软件功能多、内存偏小,不能一次性全部调入内存还可能有同文件名的ovl文件,如ws.exe、ws.ovl。
另外还有一种文件可以直接运行,*.bat,即批处理文件,其中有许多命令或可执行文件名,主要用于提高工作效率,其中最有用的是Autoexec.bat,这个文件在开机时会被自动执行(自动执行在英文中就是Automatically execute)。
而另外一种可以加载但不能直接运行的文件即是系统扩展管理文件*.sys(sys即系统system),它主要提供某些非标准设备如鼠标、扩充内存等的驱动程序,如mouse.sys、himem.sys。
为了统一管理还专门规定了一个config.sys 的文本文件来一次性地在开机时自动调入这些必需的设备驱动程序,这些文件一旦被误删或换名或被病毒侵袭则将直接导致系统工作不正常。
COMTRADE录波文件格式定义

电力系统暂态数据交换(COMTRADE)共用格式目录电力系统暂态数据交换(COMTRADE)共用格式 (2)1 范围 (2)2 定义 (2)2.1 数据表示Data Representation (2)2.1.1 二进制数据Binary Data (2)2.1.2 ASCII(美国国家信息交换标准代码)数据ASCII(AmericanNationalStandard Code for Information Interchange)Data (2)2.2 必需的/非必需的Critical/Non-Critical (2)2.3 一次/二次比Primary/secondary Ratios (2)2.4 浮点记数法Floating Point Notation (3)2.5 文件范畴Categories of Files (4)2.5.1 可执行文件Executable Files (4)2.5.2 文本文件Text Files (4)2.5.3 数据文件Data Files (4)2.6 文件的存取方法Methods of Accessing data in files (5)2.6.1 随机存取文件Random Access Files (5)2.6.2 顺序文件Seqnential Files (5)2.7 数据分隔符、定界符、区长、数据最小和最大值Data Separators,delimiters,field lengths,data minimum and maximum values (5)2.7.1 回车/换行定界符 (5)2.7.2 逗号定界符Comma Delimiter (5)2.7.3 区长,数据最大和最小值Field Lengths,data maximum andminimum values (5)3 COMTRADE文件 (6)3.1 头标文件(XXXXXXXX.HDR) (6)3.2 配置文件(XXXXXXX.CFG) (6)3.3 数据文件(XXXXXXXX.DA T) (6)3.4 信息文件(XXXXXXXX.INF) (6)4 头标文件 (7)4.1 内容 (7)4.2 文件名 (7)4.3 格式 (7)5 配置文件 (7)5.1 内容 (8)5.2 文件名 (8)5.3 格式 (8)5.3.1 站名、标识符和标准修改年份 (8)5.3.2 通道的数量和类型 (8)5.3.3 模拟通道信息 (9)5.3.4 状态(数字)通道信息 (10)5.3.5 线路频率 (10)5.3.6 采样率信息 (11)5.3.7 日期/时间标记 (11)5.3.8 数据文件类型 (12)5.3.9 时间标记乘数系数 (12)5.4 配置文件中的缺失数据 (12)5.5 配置文件排版 (12)6 数据文件 (13)6.1 内容 (13)6.2 数据文件名称 (13)6.3 ASCII数据文件格式 (13)6.4 ASCII数据采样实例 (14)6.5 二进制数据文件 (14)6.6 二进制数据采样实例 (16)7 信息文件 (16)7.1 内容 (16)7.2 信息文件名称 (16)7.3 信息文件结构 (17)7.3.1 公共部分 (17)7.3.2 专用部分 (17)7.4 文件特征 (17)7.5 分节标题的确定 (18)7.5.1 公共的、专用部分头标名称格式化规则 (18)7.5.2 公共部分头标命名举例 (18)7.5.3 专用部分头标命名举例: (18)7.6 输入行 (18)7.6.1 说明行 (19)7.6.2 数值链 (19)7.7 增加、修改和删除信息 (20)7.7.1 删除信息 (20)7.7.2 增加信息 (20)7.8 公共部分头标和输入行定义 (20)7.9 公共记录信息部分 (20)7.9.1 分节头标定义 (20)7.9.2 公共记录信息输入行定义 (20)7.10 公共事件信息定义 (21)7.10.1 分节标题定义 (21)7.10.2 公共事件信息输入行定义 (21)7.11 公共文件描述部分 (22)7.11.1 分节标题定义: (22)7.11.2 公共文件描述输入行定义: (22)7.12 公共模拟通道部分 (23)7.12.1 分节标题定义:[Pnblic Analog_Channel_#n] (23)7.13 公共状态通道部分 (24)7.13.1 分节标题定义:[Pnblic Status_Channel_#n] (24)7.13.2 公共状态通道输入行定义 (24)7.14 .INF文件示例 (24)8 附录A (27)8.1 暂态数据的来源和交换媒体 (27)8.1.1 (信息性) (27)9 附录B (29)9.1 数据交换采样率 (29)9.1.1 (信息性) (29)10 附录C (33)10.1 采样文件 (33)10.1.1 (信息性) (33)10.1.2 引言 (33)10.1.3 .HDR实例 (33)10.1.4 采样.CFG (33)11 附录D (39)11.1 用于采样频率转换的采样程序 (39)11.1.1 (信息性) (39)12 附录E (42)12.1 转换系数的采样应用 (42)12.1.1 (信息性) (42)13 附录F (44)13.1 文献 (44)13.1.1 (信息性) (44)引言本标准定义了用于不同类型的故障、试验和模拟数据的交换所需要的数据文件和交换媒体的共用格式。
SGF文件格式定义

SGF (Smart Go Format) 文件定义 Post By:2012-2-7 8:40:47IGS等大多数围棋站点采用SGF(MGT)文件格式记录棋谱,绝大多数围棋客户端软件也支持用这种格式存盘,下面是关于SGF(MGT)格式的定义(它实际上是一种文本文件)!DEFINITION OF THE SMART-GO FORMATFrom the Dissertation of Anders Kierulf"Smart Game Board:a Workbench for Game-PlayingPrograms, with Go and Othelloas Case Studies"Entered by Greg Hale with permission for distribution. See the many sa mplefiles from the 'My Go Teacher' series for examples.------------A standard file format to exchange machine-readable games, problems, and opening libraries would save time and work. That goal may not betoo far away. A standard for exchanging collections of Othello gamesis being worked out by Erik Jensen, Emmanuel Lazard, and Brian Rose incollaboration with the author. For Go, a new standard has recentlybeen proposed [Connelley 89, High 89]; it seems to suffer from a wealthof features, but any standard for exchanging Go games is welcome, and will be supported by the Smart Game Board.The current file format is specialized for the needs of the Smart Game Board. It is based on an earlier proposal for a standard for Go games [Kierulf 87b] which was not widely adopted. The following descriptionis not a new proposal; it is intended for those who want to read orwhite files that are compatible with the Smart Game Board.The game collections (documents) of the Smart Game Board are stored as text files. This has the advantage that files can be manipulated withstandard text utilities, and that it's easier to exchange games by electronic mail. The disadvantage is that text files are less compactthan binary files.The Smart Game Board stores the game trees of each document, with alltheir nodes and properties, and nothing more. Thus the file format reflects the regular internal structure of a tree of property lists.There are no exceptions; if a game needs to store some information on file with the document, a (game-specific) property must be defined forthat purpose.I will first define the syntax of the game collections, then discusssyntax and semantic of various properties.GAME COLLECTIONSA collection of game sis simply the concatenation of the game trees.The structure of each tree is indicated by parentheses. A tree iswritten as "(" followed by a sequence of nodes (as long as the tree is unbranched) and a tree for each son, and terminated by ")". Each nodeis preceded by a separator, and contains a list of zero or more properties.Thus the main branch of the game is stored first in the file, and programs can easily read that part (until the first closingparenthesis) and ignore the rest.The conventions of EBNF are discussed in [Wirth 85]. A quick summary:"..." : terminal symbols[...] : option: occurs at most once{...} : repetition: any number of times, including zero(...) : grouping| : exclusive-orThe overall definition of the file format is as follows:Collection = {GameTree}.GameTree = "(" Sequence {GameTree} ")".Sequence = Node {Node}.Node = ";" {Property}Any text before the first opening parenthesis is reserved for future extensions and is ignored when reading a file. Spaces, tabs, line breaks and so on can be inserted anywhere between properties and are also ignored.GAME-INDEPENDENT PROPERTIESEach property is identified by one or two capital letters. Theproperty value is enclosed in brackets; lists of points or integers arewritten as a sequence of property values. Within text, a closing bracket is prefixed by a backslash, and a backslash is doubled. Movesand points are game-specific and are defined later.Property = PropIdent PropValue {PropValue}.PropIdent = UpperCase [UpperCase | Digit].PropValue = "[" [Number | Text | Real | Triple| Color | Move | Point | ... ] "]"Number = ["+" | "-"] Digit {Digit}.Text = { any character; "\]" = "]", "\\" = "\"}.Real = { Number ["." {Digit}].Triple = ("1" | "2").Color = ("B" | "W").Move and Point are game-specific and are described later. The following properties are understood by all games. The property type isgiven in brackets.weiqiok加好友发短信等级:管理员帖子:1 421积分:8734威望:0精华:2注册:2009-1-10 8:36:53Post By:2012-2-7 8:41:06The normal value for such properties is one, properties that are doubled for emphasis have the value two."BL": time left for Black [real]"WL": time left for White [real]All times are given in seconds, or fractions thereof {Hale: these canbe negative, indicating player is playing past time limit set}."FG": figure [none]The figure property is used to divide a game into different figures forprinting: a new figure starts at the node with a figure property."AB": add black stones [point list, game specific]"AW": add white stones [point list, game specific]"AE": add empty stones [point list, game specific]"PL": player to play first [color]The above properties are used to set up positions in games with only black and white stones. The following properties are all part of thegame info:"GN": game name [text]"GC": game comment [text]"EV": event (tournament) [text]"RO": round [text]"DT": date [text]"PC": place [text]"PB": black player name [text]"PW": white player name [text]"RE": result, outcome [text]"US": user (who entered game) [text]"TM": time limit per player [text]"SO": source (book, journal...) [text]The format in these game-info strings is free, but to be able to searchfor specific games in game collections, it is recommended to adhere tothe following conventions:- Date is ISO-standard: "YYYY-MM-DD".- Result as "0" (zero) for a draw, "B+score" for a black win,and "W+score" for a white win, e.g. "B+2.5", "W+64"- Time limit as a number, in minutes.In addition, names, events, and places should be spelled the same im a ll games.The following properties may only be present at the root node:"GM": game [number] (Go=1, Othello=2, chess=3, Nine Mens Morri s=5)"SZ": board size [number]"VW": partial view [point list, game-specific]"BS": black species [number] (human=0, modem=-1, computer> 0)"WS": white species [number]The game number helps the program reject games it cannot handle (this property was mandatory as long as an application could play different games). The view gives two corner points of a rectangular subsection;an empty list denotes the whole board. The species denotes the kind o fplayer (the source of the more input), with different version ofcomputer algorithms denoted by positive numbers (default algorithm = 1).Computer algorithms may add the following properties:"EL": evaluation of computer move [number]"EX": expected next move [move, game-specific]Some games support markings on the board: selected points,triangles/crosses, or letters (a sequence of letters is shown on the points given in the list, starting with "A"):"SL": selected points [point list, game-specific]"M" : marked points [point list, game-specific]"L" : letters on points [point list, game-specific]GO-SPECIFIC PROPERTIESIn my proposal for a standard [Kierul 87b], I intentionally broke withthe tradition of labeling moves (and points) with letters "A"-"T" (excluding "i") and numbers 1-19. Two lowercase letters in the range"a"-"s" were used instead, for reasons of simplicity and compactness.This was criticized mainly because it was not human-readable, but as that is not an important feature of this file format, I continue to usethat notation.(Hale: diagram omitted)The first letter designated the column (left to right), the second therow (top to bottom). The upper left part of the board is used for smaller boards, e.g. letters "a"-"m" for 13*13. (Column before row follows the principle "horizontal before vertical" used in x-ycoordinate systems. The upper left corner as origin of the board corresponds to the way we read, and most modern computers use it as origin of the screen coordinates to simplify integration of text and graphics.) A pass move is written as "tt".The board must be quadratic, no smaller than 2x2, and no larger than 19x19.Additional game info properties are defined for Go:。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
文件格式定义
对于硬盘机或任何电脑存储来说,有效的信息只有0和1两种。
所以电脑必须设计有相应的方式进行信息-位元的转换。
对于不同的信息有不同的存储格式。
编辑本段概述
有些文件格式被设计用于存储特殊的数据,例如:图像文件中的JPEG 文件格式仅用于存储静态的图像,而GIF既可以存储静态图像,也可以存储简单动画;Quicktime格式则可以存储多种不同的媒体类型。
文本类的文件有:text文件一般仅存储简单没有格式的ASCII或Unicode的文本;HTML文件则可以存储带有格式的文本;PDF格式则可以存储内容丰富的,图文并茂的文本。
同一个文件格式,用不同的程序处理可能产生截然不同的结果。
例如Word 文件,用Microsoft Word观看的时候,可以看到文本的内容,而以无格式方式在音乐播放软件中播放,产生的则是噪声。
一种文件格式对某些软件会产生有意义的结果,对另一些软件来看,就像是毫无用途的数字垃圾。
编辑本段规范
许多文件格式都有公开的、不同程度规范或者建议的格式。
这些规范或者建议描述了数据如何编码,如何排列。
有时也规定了是否需要特定的电脑程序读取或处理。
有两种情况下,文件格式没有公开。
第一种情况是:开发者将文件格式视作商业秘密不愿公开;第二种情况是:开发者不愿或花去很少的时间用于规范文档。
需要注意的是,使用不公开的文件格式可能会带来额外的成本。
要了解这类文件格式或者需要通过对获得的文件进行逆向工程,或者通过向开发者付费来获得文件的格式。
第二种方式中往往还需要与开发者签订不扩散协议。
不论怎样两种方式都是费时,费钱的。
编辑本段识别文件的类型
从程序的角度来看,文件是数据流,文件系统为每一种文件格式规定了访问的方法。
例如:元数据。
不同的操作系统都习惯性的采用各自的方式解决这个问题,每种方式都有各自的优缺点。
当然,现代的操作系统和应用程序,一般都需要这里所讲述的方法处理不同的文件。
编辑本段扩展名
用扩展名识别文件格式的方式最先在数字设备公司的CP/M操作系统被采用。
而后又被DOS和Windows操作系统采用。
扩展名是指文件名中,最后一个点(.)号后的字母序列。
例如,HTML文件通过.htm或.html扩展名识别;GIF图形文件用.gif扩展名识别。
在早期的FAT文件系统中,扩展名限制只能是三个字符,因此尽管现在绝大多数的操作系统已不再有此限制,许多文件格式至今仍然采用三个字符作扩展名。
因为没有一个正式的扩展名命名标准,所以,有些文件格式可能会采用相同的扩展名,出现这样的情况就会使操作系统错误地识别文件格式,同时也给用户造成困惑。
扩展名方式的一个特点是,更改文件扩展名会导致系统误判文件格式。
例如,将filename.html 简单改名为filename.txt会使系统误将HTML文件识别为纯文本格式。
尽管一些熟练的用户可以利用这个特点,但普通用户很容易在改名时发生错误,而使得文件变得无法使用。
因此,现代的有些操作系统管理程序,例如Windows Explorer加入了限制向用户显示文件扩展名的功能。
编辑本段特征签名
一种广泛应用在UNIX及其派生的操作系统上的方法是将一个特殊的数字存放在文件的特定位置里。
最初这个数字一般是文件开始处的2个字节。
现在一般是将任何可以独一无二字符序列都可以作为特征签名。
例如GIF
图形文件是将文件开始处的六个字节作为特征签名的,它可以是GIF87a或者GIF89a。
但也有些文件很难通过这种方式识别,比如HTML文件。
采用这种方式可以更好的防止对文件格式发生误判,并且特征签名可以给出关于文件格式的更详细的信息。
这种方式的缺点是效率较低。
特别是显示大量的文件时,由于每种特征签名具有不同的识别方式,将消耗系统大量的资源对文件格式进行判断。
扩展名和后面将提到的元数据方式由于采用固定格式数据,可进行快速匹配。
应用程序往往利用特征签名来判断文件是否完整和有效。
编辑本段元数据
最后一种方式将文件格式信息存放到磁盘特定的位置。
采用这种方式,元数据与文件本身分开存放。
此法的缺点是可移植性差。
因为不同的文件系统之间元数据可能需要转换。
编辑本段苹果Macintosh的类型码
苹果计算机的文件系统为每个文件的目录入口都存储了创建者和类型码。
这些代码称作OSType。
例如一个苹果计算机创建的文件的创建者会是AAPL而类型也是APPL。
RISC 操作系统采用类似的系统,用一个12比特位的数字索引描述表。
例如:十六进制的FF5代表PoScript,文件类型就是PostScript文件。
编辑本段IBM/Microsoft 的扩展文件属性
HPFS, NTFS, FAT12, FAT16, 及FAT32文件系统可以保存额外的文件属性信息。
它是由名字和与名字对应的值组成。
例如扩展属性“.type”用于判断文件的类型,可能是值包括“Plain Text”或“HTML document”。
一个文件可以有多种属性。
编辑本段Unix的扩展文件属性
ext2,ext3,ReiserFS版本3,XFS,JFS和FFS文件系统允许存储扩展的文件属性。
它是由名字和与名字对应的值组成。
名字应当是独一无二的。
编辑本段Mime类型
MIME广泛地用于许多Internet有关的应用,并且正在被广泛地采用到其他的应用中。
最初在RFC 1341中说明。
MIME用一个类型/自类型表示文件的类型。
例如:text/html代表文件是HTML文件,image/gif表示GIF 文件。
MIME最初是用于表示电子邮件的附件的类型。