Word 文書
拡張子 .doc
MIMEタイプ application/msword[1]
UTI com.microsoft.word.doc
開発者 マイクロソフト
種別 Word 文書
包含物 テキスト、画像、マクロ
テンプレートを表示

DOCファイルフォーマットは、本来は「ドキュメント」の略であるが、今日ではMicrosoft Wordのドキュメントのファイルフォーマットを指す。

概要

編集

拡張子の「.doc」は今日では多くの場合Microsoft Wordで扱うファイルを指す。しかし本来「(拡張子) .doc」は「document」(文書)の略であり、DOS時代には、「拡張子 .txt」と同様に、主にテキスト形式で書かれた説明書に広く使用された。

このためマイクロソフトが同社の独自フォーマットであるMicrosoft Wordのファイルの拡張子を「.doc」とした事には、当時批判があったが、Microsoft Wordが広く普及したため、現在では主に「Microsoft Wordのファイルフォーマットの拡張子」とみなされるようになった。

Microsoft Wordのdocファイルフォーマットはバイナリ型のフォーマットで、今日のフォーマットはMicrosoft Word 97を基にしたもので、Microsoft Word 97以前のものとは異なっている。Microsoft Word 2003までの標準のファイル フォーマットとなっていたが、Microsoft Office Word 2007からOffice Open XML Document (.docx) が標準のファイル フォーマットとなった。

Microsoft Wordのdocファイル フォーマットは今日、Microsoft Office Wordに限らず、多くのワープロソフトで使用されている。

Microsoft Wordバイナリファイル形式

編集

バイナリ形式のDOCファイルは、他のRTFやHTMLと比べると書式情報やスクリプト、Undoなどの情報を豊富に保持するが、他アプリでの再現性では劣るところがある。

DOCファイル形式はMicrosoft Wordのバージョンにより違いがある。Word 97以前のフォーマットとWord 97 - 2003のバイナリファイル形式は異なっている。

Microsoft Word 2007以後では、標準のファイル形式はバイナリファイル形式からOffice Open XMLファイル形式に替わったが、Wordは以前のバージョンのDOCファイル形式も生成することが出来る。

アプリケーションによるサポート

編集

DOCファイル形式はMicrosoft Word固有の物であるが、その他のワードプロセッサーソフトである、OpenOffice.org WriterIBM Lotus SymphonyApple PagesAbiWordなどでもDOC形式の読み書きは可能である。しかしながら互換性には制約もある。

Unix系オペレーティングシステムのコマンドラインによるプログラムでは、DOC形式をプレーンテキスト形式に変換できるwvライブラリがあり、AbiWordで使われている。

仕様

編集

DOC形式の仕様は長年にわたって非公開であったため、DOCの読み書きが可能とするワードプロセッサ製品でも情報の取扱いが不完全なために書式情報が損なわれるケースが多かった。

Office 97のバイナリファイル形式については、1997年に制限付きのライセンスで公開されたが、1999年にはダウンロードが取り止められている[2][3][4][5]。以後のバージョンのファイル形式は非公開になり[6]、2006年から[7]RANDライセンスにより2008年2月まで公開された。サン・マイクロシステムズOpenOffice.orgはファイル形式に対しリバースエンジニアリングを行っている。

マイクロソフトは2008年6月にOpen Specification Promise[8][9] によりDOC形式の仕様を公開したが、仕様は全ての機能を網羅した物ではなく、現在もなおリバースエンジニアリングの必要性は残っている[10]

脚注

編集
  1. ^ https://www.iana.org/assignments/media-types/application/msword (英語)
  2. ^ Comparing ODF and OOXML” (pdf) (2006年). 2011年5月23日閲覧。
  3. ^ Beware of Geeks Bearing Gifts, (2006), http://www.robweir.com/blog/2006/11/beware-of-geeks-bearing-gifts.html 2011年5月23日閲覧。 
  4. ^ A Word 8 converter for Unix”. 2011年5月23日閲覧。
  5. ^ Microsoft Word 97 Binary File Format”. 2011年5月23日閲覧。
  6. ^ Royalty-free specifications for Microsoft Office binary file formats”. 2011年5月23日閲覧。
  7. ^ Mapping documents in the binary format (.doc; .xls; .ppt) to the Open XML format” (2008年1月16日). 2013年12月19日閲覧。
  8. ^ Microsoft Open Specification Promise”. Microsoft Corporation. 2013年12月19日閲覧。
  9. ^ Office のファイル形式およびスキーマの抽出方法に関する情報”. Microsoft Corporation. 2013年12月19日閲覧。
  10. ^ Joel Spolsky. “Why are the Microsoft Office file formats so complicated? (And some workarounds)”. 2013年12月19日閲覧。

外部リンク

編集

📚 Artikel Terkait di Wikipedia

Matroska

マトリョーシカにちなんで名付けられた。オープンソース(GNU LGPL)で開発が行われている。 データ構造仕様にEBML(Extensible Binary Meta Language)を採用し、後方互換性と拡張性を両立させている[要出典]。 家電のDVDプレーヤーなどでも一部対応した機種が存在する

MPEG-4

TSが用いられる。 さらに、複数のオブジェクトを組み合わせて扱うことを可能にするためのシーン記述のための仕様として、VRML97をベースとしたBIFS(Binary Format for Scenes)が規定されている。例えば、人物や背景の動画および音声をそれぞれ別個のオブジェクトとして符号化し、それらを重ね合わ

FBX

SDKは内部文字列表現にUTF-8を使用する。Windows環境向けに変換APIが用意されている。 Autodesk FBX Overview FBX binary file format specification — Blender Developers Blog http://wiki.blender.org/index

PLY (ファイル形式)

の行を含むマジックナンバーで始まる。二行目はPLY形式のバリエーションを示す。これは以下のどれかである必要がある: format ascii 1.0 format binary_little_endian 1.0 format binary_big_endian 1.0 この標準の将来のバージョンでは、最後の部分にあるリビジョ

File (UNIX)

35-4_armhf.deb # (on Linux) libmagic-dev_5.35-4_armhf.deb: Debian binary package (format 2.0) - current ar archive - data 非標準オプション-kを使用すると、プログラムは最初にヒットが

Preferred Executable Format

Preferred Executable Format (PEF) とは、Classic Mac OS及びmacOSの実行ファイル・オブジェクトファイルのフォーマット。BeOSのPowerPC版システムにも使われていた。 Classic Mac OSではPowerPCの搭載に伴い導入され、内部にPo

WebAssembly

WASM外に存在する対象へのアクセスをWASMランタイムが提供する。 Wasmはバイナリフォーマット(英: binary format)およびテキストフォーマット(英: text format)を定義している。フォーマットの設計方針として Compact / Modular / Efficient /

Microsoft Open Specification Promise

OpenDocument Format for Office Applications v1.0 OASIS OpenDocument Format for Office Applications v1.0 ISO/IEC 26300:2006 OpenDocument Format for Office