Word als XML - Editor

Bereits in den beiden Ausgaben der BGBL-XML-CD (2000 und 2001) wurde dieses sehr interessantes Verfahren zur Umwandlung von Word-Dokumenten in das XML-Format angewendet.

Nun wurde in einem Prototypen-Projekt in einer nachgeordneten Dokumentations-Dienststelle des Deutschen Gesundheitsministeriums dieses Verfahren verfeinert und auf möglichen "Echteinsatz" geprüft.

Das Kernstück dabei ist der HTML-to-XML Konverter der Ever Germany (www.ever-germany.de). Der entscheidente Unterschied zu den vielen am Markt befindlichen XML-Konverter ist die "Datenbankfähigkeit" des XML-Codes, der aus HTML erzeugt wird. 

Die üblichen Konverter konvertieren: <p class="Formatvorlage_xy">Text </p> gar nicht weiter, sondern belassen die class="Formatvorlage_xy" eben als Attribut im TAG stehen. Eine Auswertung mit XSLT ist ja durchaus über Attribute möglich.

Der XML-Konverter von Ever Germany wandelt diesen Ausdruck aber in:
<Formatvorlage_xy>Text</Formatvorlage_xy> um.


Damit kann der XML-Code ohne Nachbehandlung direkt in eine Datenbank eingelagert werden und steht für die diversen Indexierungen zur Verfügung.

Die Datenbanken sind dann anschließend über die üblichen Suchstrategien recherchierbar, ohne langsame und aufwendige XQUERY - Abfragen zu erzwingen.

Wenn Sie Fragen zum Verfahren haben, oder wissen wollen, ob dieses Verfahren auch für Ihre Situation anwendbar ist, wenden Sie sich bitte an:

LIS OEG
Franz Reinisch
7441 Steinbach 49
Tel: 02616 4102
Fax.: 02616 4103
www.lis-oeg.com
office@lis-oeg.com