XML訊息集XML Information Set,縮寫XML Infoset)是W3C規範(specification),該規範使用一套訊息項(information item)來描述XML文檔的一個抽象的資料模型。[1] XML訊息集這個規範意圖用於其他規範中以引用良好建構的XML文檔英语Well-formed XML document中的訊息。

一個XML文檔,只要是良好建構的並且滿足XML命名空間的約束,就存在有訊息集。一個XML文檔存在訊息集並不需要該XML文檔有效。

訊息集可以包含的總共11種不同類型的訊息項。

  1. 文檔訊息項 (總是存在)Document Information Item
  2. 元素訊息項(Element Information Item)
  3. 屬性訊息項(Attribute Information Item)
  4. PI訊息項(Processing Instruction Information Item)
  5. 未擴展實體引用訊息項(Unexpanded Entity Reference Information Item)
  6. 字元訊息項(Character Information Item)
  7. 注釋訊息項(Comment Information Item)
  8. 文檔型別宣告訊息項(The Document Type Declaration Information Item)
  9. 非解析實體訊息項(Unparsed Entity Information Item)
  10. 格式訊息項(Notation Information Item)
  11. 命名空間訊息項(Namespace Information Item)

訊息集推薦標準第二版於2004年2月4日被採納。

信息集补充(Infoset Augmentation)

编辑

信息集补充或信息集修改是指在Schema合法性检查期间对信息集的修改的过程,例如,添加缺省的属性。补充后的信息集被称为post-schema-validation infoset(简称PSVI)。[2]

信息集补充是存在争议的,有人认为它破坏了模块化,并容易导致互操作性问题。这是由于是否进行了信息集补充,会使应用程序得到不同的信息。 [3]

XML Schema支持信息集补充,而RELAX NG并不支持信息集补充。

参见

编辑

XML信息集的实例包括:

参考文献

编辑
  1. ^ W3C XML Infoset
  2. ^ XML Schema 1.1 Part 1: Structures. [2009-11-10]. (原始内容存档于2022-05-14). 
  3. ^ RELAX NG and W3C XML Schema页面存档备份,存于互联网档案馆), James Clark, 4 Jun 2002

外部链接

编辑

📚 Artikel Terkait di Wikipedia

DSSSL

- Document description and processing languages. ISO. 5 March 2008 [2009-12-25].  ISO JTC1/SC34. JTC 1/SC 34 - Document Description and Processing Languages

AlexNet

Patrice Simard. High Performance Convolutional Neural Networks for Document Processing. Lorette, Guy (编). Tenth International Workshop on Frontiers in Handwriting

文档分类

复合项分析(英语:Compound term processing) 基于概念的图像索引(英语:Concept-based image indexing) 基于内容的图像检索 文档 监督式学习, 非监督式学习 文档检索 文档聚类(英语:Document clustering) 信息检索 信息组织(英语:Knowledge

處理器

文档处理器(英语:Document processor),一种表面上类似于文字处理器,但是强调文档的视觉布局的计算机程序 信息处理器(英语:Information processor),一以某种形式获取信息,在通过算法处理后将其转换为另一种形式的信息的系统。 数据处理系统(英语:Data processing

SCRIPT/VS

Stuart E. Madnick and Allen G. Moulton (1968) SCRIPT, An Online Manuscript Processing System (PDF). [2012-09-12].  IEEE Transactions on Engineering Writing

可支援開放文件軟體列表

(純匯入;匯出功能開發中) Google Docs and Spreadsheets,線上文書處理及試算表程式,可以讀寫OpenDocument word processing (ODT)格式的文件。 Zoho Writer,線上的文書處理程式,可以讀寫ODT 格式的文件。 ajaxWrite,線上文書處理程式,可以讀寫ODT

自然语言处理

自然語言處理(英語:Natural Language Processing,缩写作 NLP)是人工智慧和語言學領域的交叉學科,研究计算机处理、理解与生成人类语言的技術。此領域探討如何處理及運用自然語言;自然語言處理包括多方面和步骤,基本有认知、理解、生成等部分。

Gemini (语言模型)

真实大小写处理(英语:Truecasing) 自动摘要(英语:Automatic summarization) 多文档摘要(英语:Multi-document summarization) 句子抽取(英语:Sentence extraction) 文本简化(英语:Text simplification)