Autor: Mariusz 痚browski.
Lokalizacja:
http://www.antyspam.pl/w3c/REC-xml-infoset-20040204/
Dokument ten jest t硊maczeniem rekomendacji XML Information Set (Second Edition). Przek砤d ten
nie jest przek砤dem normatywnym i mo縠 zawiera b酬dy wynikaj眂e z
t硊maczenia. Status normatywny posiada jedynie wersja angielskoj陑yczna na
stronie W3C
http://www.w3.org/TR/2004/REC-xml-infoset-20040204/.
Dokument jest chroniony prawem autorskim. Copyright © 2004 W3C®
(MIT, ERCIM, Keio).
Prosz zobaczy errat辄/strong> dla tego dokumentu, kt髍a mo縠 zawiera pewne normatywne poprawki.
Zobacz tak縠 t硊maczenia.
Copyright ©1999-2004 W3C® ( MIT, ERCIM, Keio), Wszystkie prawa zastrze縪ne. W3C stosuje powy縮ze zasady dotycz眂e odpowiedzialno禼i cywilnej, trademark, u縴wania dokumentu i licencji oprogramowania.
Ta specyfikacja oferuje zestaw definicji dla u縴cia w innych specyfikacjach, kt髍e potrzebuj odnosi si do informacji w dokumencie XML.
Ten paragraf opisuje status tego dokumentu od czasukiedy jest opublikowany. Inne dokumenty mog zast眕i ten dokument. Lista bie勘cych publikacji W3C i najnowsz weryfikacj tego raportu technicznego mo縩a zanale兼 na W3C technical reports index na http://www.w3.org/TR/.
Ten dokument jest Rekomendowany przez W3C. Zosta on zbadany przez cz硂nk體 W3C i inne strony zainteresowane oraz zatwierdzony przez dyrektora jako Rekomendacja W3C. To jest dokument stabilny i mo縠 by u縴wany jako materia odniesienia lub cytowany jako odniesienie normatywne z innego dokumentu. Zadaniem W3C w wydaniu tej rekomendacji jest przyci眊ni阠ie uwagi do tej specyfikacji i promowanie jej szerokiego zastosowania. Wzbogaci to funkcjonalno舵 i interoperacyjno舵 sieci Web.
Ten dokument uaktualnia Infoset b阣眂 nak砤dk na wersj XML 1.1 i przestrze nazw 1.1, wyja秐ia konsekwencje pewnych rodzaj體 niepoprawno禼i sk砤dniowej i poprawiania pewnych b酬d體 typograficznych. To jest produkt W3C XML Activity. Tylko angielska wersja specyfikacji jest wersj normatywn? Jednak縠, szukaj眂 t硊macze tego dokumentu zobacz http://www.w3.org/2003/03/Translations/byTechnology?technology=xml-infoset.
Documentacja z intelektualn w砤禼iwo禼i mo縠 odnosi si do tych rekomendacji mo縠 by znaleziona na publicznej stronie Working Group IPR disclosure page.
Prosimy zg砤sza b酬dy w tym dokumencie na adres www-xml-infoset-comments@w3.org (publiczne archiwa s?#160; dost阷ne). Lista erraty dla tej rekomendacji jest dost阷na na http://www.w3.org/2001/10/02/xml-infoset-errata.html.
Ta specyfikacja definiuje abstrakcyjny zbi髍 danych Zbi髍 informacyjny XML (ang. XML Information Set (Infoset)). Jego celem jest dostarczanie sp骿nego zbioru definicji do wykorzystania w innych specyfikacjach, kt髍e potrzebuj odnosi si do informacji w poprawnie sk砤dniowo uformowanym dokumencie XML [XML].
Celem jej nie jest bycie wyczerpuj眂胞 G丑wnym kryterium przy doborze przedmiot體 informacyjnych albo w砤禼iwo禼i jest spodziewana u縴teczno舵 w przysz硑ch specyfikacjach. Tak縠 nie stanowi zestawu minimum informacji, kt髍e musz by zwracane przez procesor XML.
Dokument XML posiada zbi髍 informacyjny je縠li jest poprawnie sformu硂wany i zachowuje ograniczenia przestrzeni nazw opisane w below. Aby dokument XML posiada zbi髍 informacyjny nie jest wymagane aby by poprawny sk砤dniowo.
Zbiory informacyjne mog by tworzone przez inne metody (nie opisane w tej specyfikacji) inne ni analiza gramatycza dokumentu XML. Patrz Synthetic Infosets poni縠j.
Zbi髍 informacyjny dokumentu XML sk砤da si z pewnej liczby przedmiot體 / element體 informacyjnych; zbi體 informacyjnych dla ka縟ego poprawnie sformu硂wanego dokumentu XML b阣zie zawiera conajmniej przedmiot / element informacyjny document oraz kilka innych. Przedmiot informacyjny jest abstrakcyjnym opisem pewnej cz阠i dokumentu XML; ka縟y element informacyjny posiada zwi眤any z nim zbi髍 nazwanych w砤禼iwo禼i. W tej specyfikacji nazwy w砤禼iwo禼i s przedstawione w nawiasach kwadratowych, [thus]. Typy przedmiot體 informacyjny s wymienione w section 2.
Zbi髍 informacyjny XML nie wymaga lub preferuje szczeg髄nego interfejsu lub klasy interfejs體. Ze wzgl阣u na jasno舵 i prostot? ta specyfikacja przedstawia zbi髍 informacyjny jako zmodyfikowane drzewo, jednak縠 nie jest wymagane aby Zbi髍 Informacyjny XML by dost阷ny jako struktura drzewiasta; mo縧iwe s inne typy interfejs體 mi阣zy innymi oparte na zdarzeniach i zapytaniach w celu dostarczania informacji w spos骲 zgodny z Zbiorem Informacyjnym XML.
Terminy "zbi髍 informacyjny" i "przedmiot / element informacyjny" s podobnie rozumiane jak powszechnie u縴wane w informatyce terminy "drzewo" i "w陑e?quot;. Jednak縠 w tej specyfikacji u縴wane s pierwsze z tych okre秎e w celu ograniczenia mo縧iwo禼i pomy砶i z innymi modelami danych. Elementy informacyjne nie przek砤daj si jeden-do-jeden na w陑硑 DOM lub "drzewa" i "w陑硑" modelu danych XPath.
W tej specyfikacji zak砤da si znaczenie s丑w "musi", "powinien" i "mo縠" zgodnie z [RFC2119], z takim wyj眛kiem 縠 s硂wa te nie s przedstawione kapitalikiem.
R罂ne wersje specyfikacji XML mog przedstawia r體ne regu硑 analizy. Zbi髍 informacyjny dokumentu XML jest zdefiniowany aby by jedynym otrzymanym poprzez jego analiz zgodnie z regu砤mi specyfikacji, kt髍ej wersja odpowiada wersji z dokumentu. Dokument kt髍y nie specyfikuje numeru wersji jest uwa縜ny za dokument w wersji 1.0. Je秎i procesor XML akceptuje dokument z numerem wersji, kt髍ej nie zna, niekoniecznie oznacza to 縠 bedzie w stanie utworzy poprawny zbi髍 informacyjny.
XML dokumenty, kt髍e nie s zgodne z [Przestrzeniami nazw], chocia s technicznie dobrze ukszta硉owane, nie s uwa縜ne za posiadaj眂e znacz眂e zbiory informacji. To znaczy, 縠 ta specyfikacja nie okre秎a zbior體 informacji dla dokument體, kt髍e posiadaj nazwy elementu, lub atrybutu zawieraj眂e dwukropki, kt髍e s u縴wane w inny spos骲, ni zalecany przez [Przestrzenie nazw].
W dodatku, ta specyfikacja nie okre秎a zbioru informacji dla dokument體, kt髍e u縴waj wzgl阣nych odno秐ik體 URI w deklaracjach przestrzeni nazw. Jest to zgodne z decyzj Plenarnej Grupy Interesu W3C XML opisanej we [Wzgl阣nych Odno秐ikach Przestrzeni Nazw URI].
Warto禼i w砤sno禼i [namespace name] (nazwa przestrzeni nazw) jest znormalizowana warto舵 odpowiadaj眂ego atrybutu przestrzeni nazw; 縜den dodatkowy uwalniany URI nie odnosi si do tego przez procesor.
Zbi髍 informacji opisuje jego dokument XML z ju rozszerzonymi odno秐ikami element體 rekordu, tj. przedstawiany przez elementy informacyjne odpowiadaj眂e tekstowi, kt髍y jest na ich miejscu. Jednak s r罂ne okoliczno禼i, w kt髍ych procesor mo縠 nie wykona tego rozszerzenia. Element rekordu mo縠 nie by zdeklarowany, lub mo縠 nie by mo縧iwy do odzyskania. Procesor niewaliduj眂y mo縠 wybra nie czyta wszystkich deklaracji, a nawet je秎i nie, mo縠 rozszerzy wszystkie zewn阾rzne elementy rekordu. W takich przypadkach element infomacyjny nierozszerzonego odno秐ika elementu rekordu jest u縴wany do przedstawiania odno秐ika elementu rekordu.
Warto禼i wszystkich w砤sno禼i w Zbiorze informacji bior pod uwag normalizacj ko馽a wiersza opisan w [XML], 2.11 "Obs硊giwanie ko馽a wiersza".
Niekt髍e elementy informacyjne posiadaj w砤sno禼i [base URI] (podstawowy URI) lub [declaration base URI] (deklaracja podstawowego URI). S one wyliczone zgodnie z [Podstaw XML]. Zauwa? 縠 odzyskanie 紃骴砤 mo縠 zawiera przekierowanie na poziom analizatora sk潮dni (np. w przeliczniku elementu rekordu) lub ni縠j; w tym przypadku podstawowy URI jest ko馽owym URI u縴wanym do odzyskania 紃骴砤 po wszystkich przekierowaniach.
Warto舵 tych w砤sno禼i nie odzwierciedla 縜dnego uwalnianego URI, co mo縠 by wymagane do odzyskania 紃骴砤, ale mo縠 zawiera uwalniane znaki, je縠li by硑 okre秎one w dokumencie, lub oddane przez serwer w celu przekierowania.
W niekt髍ych przypadkach (takich jak czytanie dokument體 z 砤馽ucha znak體 lub potoku) zasady [Podstawy XML] mog doprowadza do podstawowego URI, kt髍y jest zale縩y od aplikacji. W takich przypadkach ta specyfikacja nie okre秎a warto禼i w砤sno禼i [podstawowego URI] lub [deklaracji podstawowego URI].
Podczas rozwi眤ywania wzgl阣nych w砤sno禼i URI [podstawowy URI] powinny by u縴wane w preferencji do warto禼i atrybut體 xml:base; mog by sprzeczne w przypadku Syntetycznych Zbior體 Informacji.
Niekt髍e w砤sno禼i mog czasem posiada warto禼i nieznany lub brak warto禼i, i powiedziano, 縠 warto舵 w砤sno禼i jest nieznana, lub 縠 w砤sno舵 odpowiednio nie posiada warto禼i. Te warto禼i r罂ni si od siebie i od wszystkich innych warto禼i. W szczeg髄no禼i r罂ni si od pustego ci眊u znak體, pustego zbioru i pustej listy, ka縟y z kt髍ych poprostu nie ma element體. Ta specyfikacja nie u縴wa terminu warto舵 zerowa poniewa w niekt髍ych spo砮czno禼iach ma to szczeg髄ne znaczenie, co mo縠 nie pasowa do tych przeznaczonych tutaj.
Jak zanotowano powy縠j, dokument XML nie musi by wa縩y, aby posiada zbi髍 informacji. Jednak pewne rodzaje niewa縩o禼i wp硑waj na warto禼i przypisane pewnym w砤sno禼iom. Elementy rekordu, zapisy, elementy i atrybuty mog by niezdeklarowane. Zapisy i elementy mog by wielokrotnie zdeklarowane (wielokrotne deklaracje s wa縩e dla element體 rekordu i atrybut體). ID mo縠 by niezdefiniowany lub wielokrotnie zdefiniowany. Takie przypadki s zauwa縜ne w stosownych miejscach, w poni縮zych definicjach Element體 Informacyjnych.
Ta specyfikacja opisuje zbi髍 informacji wynikaj眂y z analizowania dokumentu XML. Zbiory informacji mog by skonstruowane przy pomocy innych 秗odk體, na przyk砤d przy u縴ciu API takich jak DOM lub przez przekszta砪anie istniej眂ych zbior體 informacji.
Zbi髍 informacji odpowiadaj眂y prawdziwemu dokumentowi b阣zie koniecznie zgodny na wiele sposob體; np. w砤sno舵 [przestrzeni nazw in-scope] elementu b阣zie zgodna z w砤sno禼iami [atrybut體 przestrzeni nazw] elementu i jego przodk體. To nie mo縠 by prawdziwe przy zbiorze informacji skonstruowanego innymi sposobami; w takim przypadku nie b阣zie 縜dnego dokumentu XML odpowiadaj眂ego zbiorowi informacji i aby dokona jego serializacji b阣zie wymaga rozdzielenia niezgodno禼i (np. przez uzyskanie deklaracji przestrzeni nazw, kt髍e odpowiadaj przestrzeniom nazw w zakresie).
Zbi髍 informacji mo縠 zawiera do jedenastu r罂nych typ體 przedmiot體 informacyjnych, jak wyja秐iono w nast阷uj眂ych sekcjach. Ka縟y przedmiot informacyjny posiada w砤禼iwo禼i. Dla u砤twienia odnoszenia, ka縟a w砤sno舵 posiada nazw? An information set can contain up to eleven different types of information item, as explained in the following sections. Every information item has properties. For ease of reference, each property is given a name, wskazan [w ten spos骲]. Odno秐iki do definicji i/lub sk潮dni w Rekomendacji XML 1.0 [XML] s podane dla ka縟ego przedmiotu informacyjnego.
Definicja XML: dokument (Cz甓 2, Dokumenty)
Sk砤dnia XML: [1] Dokument (Cz甓 2.1, Dobrze ukszta硉owane Dokumenty XML )
Jest dok砤dnie jeden przedmiot informacyjny typu dokument w zbiorze informacji i wszystkie inne przedmioty informacyjne s dost阷ne z w砤禼iwo禼i przedmiotu informacyjnego typu dokument, zar體no bezpo秗ednio, jak i po秗ednio poprzez w砤禼iwo禼i innych przedmiot體 informacyjnych.
Przedmiot informacyjny typu dokument posiada nast阷uj眂e w砤禼iwo禼i:
Definicja XML: element (Cz甓 3, Struktury Logiczne)
Sk砤dnia XML: [39] Element (Cz甓 3, Struktury Logiczne)
Wyst阷uje przedmiot informacyjny typu element dla ka縟ego elementu pojawiaj眂ego si w dokumencie XML. Jeden z przedmiot體 informacyjnych typu element jest warto禼i w砤sno禼i [elementu dokumentu] przedmiotu informacyjnego typu dokument, odpowiadaj眂ego korzeniowi drzewa element體 i wszystkie inne elementy informacyjne typu element s dost阷ne porzez rekurencyjne wyst阷owanie po ich w砤sno禼iach [potomk體]:
xmlns
, kt髍ych w砤sno舵 [prefiks] nie ma
warto禼i)
maj przestrze nazw URI
http://www.w3.org/2000/xmlns/
.
je縠li element nie posiada deklaracji przestrzeni nazw, ten zbi髍 nie ma element體.
xml
, kt髍y jest domniemany, zwi眤any z nazw przestrzeni nazw
http://www.w3.org/XML/1998/namespace
.
Nie zawiera przedmiotu z prefiksem
xmlns
(u縴wanego dla
deklarowania przestrzeni nazw), poniewa aplikacja nigdy nie mo縠 napotka elementu lub atrybutu z tym prefiksem.
Zbi髍 b阣zie zaweira przedmioty przestrzeni nazw odpowiadaj眂e wszystkim elementom [atrybuty przestrzeni nazw],
z wyj眛kiem jakichkolwiek deklaracji przedstawiaj眂ymi formularz xmlns="" orlub
xmlns:name="", kt髍y nie deklaruje przestrzeni nazw, ale raczej nie deklaruje domy秎nej warto禼i przestrzeni nazw
i prefiks體.
Podczas roz潮czania prefiks體 nazw z硂縪nych ta w砤sno舵 powinna by u縴wana w odniesieniu do w砤sno禼i
[atrybuty przestrzeni nazw]; mog by niezgodne z przypadkiem
Syntetyczne zbiory informacji
.
Definicja XML: atrybut (Sekcja 3.1, Znaczniki pocz眛kowe, znaczniki ko馽owe, i znaczniki pustych element體)
XML Syntax: [41] atrybut (Sekcja 3.1, Znaczniki pocz眛kowe, znaczniki ko馽owe, i znaczniki pustych element體)
Jest przedmiot informacyjny typu atrybut dla ka縟ego atrybutu (okre秎onego lub domy秎nego) ka縟ego elementu w dokumencie, 潮cznie z tymi, kt髍e s deklaracjami przestrzeni nazw. Te drugie jednak pojawiaj si jako elementy w砤sno禼i element體 [atrybuty przestrzeni nazw] raczej ni jego w砤sno禼i [atrybuty].
Atrybuty zdeklarowane w DTD bez warto禼i domy秎nej i nieokre秎one w znaczniku pocz眛kowym elementu nie s reprezentowane przez przedmioty informacyjne typu atrybut.
Przedmiot informacyjny typu atrybut posiada nast阷uj眂e warto禼i:
Definicja XML: instrukcja przetwarzania (Cz甓 2.6, Instrukcje przetwarzania)
Sk潮dnia XML: [16] PI (Cz甓 2.6, Instrukcje Przetwarzania)
Jest przedmiot informacyjny typu instrukcja przetwarzania dla ka縟ej instrukcji przetwarzania w dokumencie. Deklaracja XML i deklaracje tekstowe dla zewn阾rznych zanalizowanych element體 rekordu nie s uwa縜ne za instrukcje przetwarzania.
Przedmiot informacyjny typu instrukcja przetwarzania posiada nast阷uj眂e w砤sno禼i:
xml:base
na elementach.
Definicja XML: Cz甓 4.4.3, Zawarty w przypadku walidacji
przedmiot informacyjny typu nierozszerzony odno秐ik elementu rekordu s硊縴 jako miejsce dla kt髍ego procesor XML mo縠 wskaza? 縠 nie zosta rozszerzony zewn阾rzny element rekordu. Taki przedmiot informacyjny istnieje dla ka縟ego nierozszerzonego odno秐ika do zewn阾rznego elementu rekordu w obr阞ie zawarto禼i elementu. Waliduj眂y procesor XML, lub niewaliduj眂y procesor czytaj眂y wszystkie zewn阾rzne og髄ne elementy rekordu, nigdy nie b阣 nigdy generowa przedmiot體 informacyjnych typu nierozszerzalny odno秐ik elementu rekordu dla wa縩ego dokumentu.
Przedmiot informacyjny typu nierozszerzalny odno秐ik elementu rekordu posiada nast阷uj眂e w砤sno禼i:
Sk砤dnia XML: [2] Char (Cz甓 2.2, Znaki)
Wyst阷uje przedmiot informacyjny typu znak dla ka縟ego znaku danych pojawiaj眂ego si w dokumencie, zar體no dos硂wnie, jak i odno秐ik znaku, lub w obr阞ie sekcji CDATA.
Ka縟y znak jest logicznie oddzielnym przedmiotem informacyjnym, ale aplikacje XML mog dzieli znaki w wi阫sze grupy je秎i jest to konieczne lub wymagane.
Przedmiot informacyjny typu znak posiada nast阷uj眂e w砤sno禼i:
Definicja XML: komentarz (Cz甓 2.5, komentarze)
Sk砤dnia XML: [15] Komentarz (Cz甓 2.5, Komentarze)
Jest przedmiot informacyjny typu komentarz dla ka縟ego komentarza XML w oryginalnym dokumencie, z wyj眛kiem tych pojawiaj眂ych si w DTD (kt髍e nie s przedstawione).
Przedmiot informacyjny typu komentarz posiada nast阷uj眂e w砤sno禼i:
Definicja XML: typ dokumentu i deklaracji (cz甓 2.8, J陑yk Prolog i typ deklaracji )
Sk砤dnia XML: [28] doctypedecl (cz甓 2.8, J陑yk Prolog i typ deklaracji)
Je縠li dokument XML posiada deklaracj typu dokumentu, wtedy zbi髍 informacji zawiera pojedynczy przedmiot informacyjny deklaracji typu dokumentu . Zauwa? 縠 elementy rekordu i zapisy s zapewnione jako w砤sno禼i przedmiotu informacyjnego dokumentu, nie jako przedmiot informacyjny deklaracji typu dokumentu.
Przedmiot informacyjny deklaracji typu dokumentu posiada nast阷uj眂e w砤sno禼i:
Definicja XML: element rekordu (cz甓 4, Struktury fizyczne)
Sk砤dnia XML: [71] GEDecl (cz甓 4.2, Elementy rekordu)
Wyst阷uje przedmiot informacyjny typu niezanalizowany element rekordu dla ka縟ego niezanalizowanego og髄nego elementu rekordu zdeklarowanego w DTD.
Przedmiot informacyjnytypu niezanalizowany element rekordu posiada nast阷uj眂ych w砤sno禼i:
Definicja XML: zapis (cz甓 4.7, Zapisy)
Sk砤dnia XML: [82] NotationDecl (cz甓 4.7, Zapisy)
Jest przedmiot informacyjny typu zapis dla ka縟ego zapisu zdeklarowanego w DTD.
Przedmiot informacyjny typu zapis posiada nst阷uj眂e w砤sno禼i:
Ka縟y element w dokumencie posiada przedmiot informacyjny przestrzeni nazw dla ka縟ej przestrzeni nazw, kt髍a jest w zasi阦u tego elementu.
Informacja o przestrzeni nazw posiada nast阷uj眂e w砤禼iwo禼i:
xmlns:
.
Je縠li nazw atrybutu jest po prostu
xmlns
,
tak, 縠by deklaracja by砤 jego domy秎n przestrzeni nazw, ta w砤sno舵 nie ma warto禼i.
Poniewa celem zbioru informacji jest zapewnienie zbioru definicji, zgodno舵 jest w砤sno禼i specyfikacji u縴waj眂ych tamtych definicji raczej ni implementacji.
Specyfikacje odnosz眂e si do zbioru informacji musz苞
Je縠li specyfikacja zezwala na konstruowanie zbioru informacji, kt髍y zawiera niezgodno禼i jak opisano poni縠j Syntetyczne zbiory informacji, mo縠 opisa jak te niezgodno禼i maj by rozwi眤ane i tak powinna zrobi? je縠li zapewnia serializacj zbioru informacji.
http://www.w3.org/TR/REC-xml-names
.
http://www.w3.org/TR/xml-names11
.
http://www.ietf.org/rfc/rfc2119.txt
.http://www.w3.org/TR/REC-xml
.
http://www.w3.org/TR/xml11
.
http://www.w3.org/TR/xmlbase
.
http://www.w3.org/TR/REC-DOM-Level-1
.
http://www.w3.org/TR/NOTE-xptr-infoset-liaison
.http://www.w3.org/2000/09/xppa
.
http://www.w3.org/TR/xml-infoset-rdfs
.
Pomimo, 縠 Rekomendacja [XML] jest zasadniczo zwi眤ana ze sk砤dni XML, r體nie zawiera troch specjalich wymaga raportowania dla porocesor體 XML.
Wymagania raportowania zawieraj b酬dy, kt髍e s poza zasi阦iem tej specyfikacji i informacjo dokumentu. Wszystkie z wymaga XML dla raportowania informacji dokumentu zosta硑 zintegrowane w zbi髍 informacyjny XML; numery w nawiasach odnosz si do specyfikacji Rekomendacji XML:
Rozwa nast阷uj眂y przyk潮d dokumentu XML:
<?xml version="1.0"?> <msg:message doc:date="19990421" xmlns:doc="http://doc.example.org/namespaces/doc" xmlns:msg="http://message.example.org/" >Phone home!</msg:message>
Zbi髍 informacji dla tego dokumentu XML zawiera nast阷uj眂e przedmioty informacyjne:
http://message.example.org/
",
cz甓 lokalna "message
",
i prefiks "msg
".
http://doc.example.org/namespaces/doc
",
cz甓ci lokaln "date
",
prefiksem "doc
",
i znormalizowan warto禼i "19990421
".
http://www.w3.org/XML/1998/namespace
,
http://doc.example.org/namespaces/doc
, oraz
http://message.example.org/
przestrzeniami nazw.
Nast阷uj眂e informacje nie s przedstawione w obecnej wersji zbioru informacyjnego XML (ta lista nie ma na celu by kompletn?:
<foo/>
oraz <foo></foo>
.See Schemat RDF dla zbioru informacyjnego XML dla formalnego znakowania zbioru informacji.