slides/cactvs/hdt.ppt © ihlenfeldt 1999 c3c3 archivierung von multimedia-daten w. d. ihlenfeldt...

Post on 06-Apr-2016

215 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Archivierung von Multimedia-Daten

W. D. IhlenfeldtComputer-Chemie-Centrum

Universität Erlangen-NürnbergD-91052 Erlangen

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Digitale Dissertationen und Archive

• Gewinn durch Originalaufzeichnungen (Audio, Video) Originaldaten Visualisierungen Dynamic Content Erschließung über Multimedia-Content

• Relevanzspanne u.U. Jahrzehnte und mehr

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Zukünftiger Zugriff auf Multimedia-Daten

Zukunftssicherheit erfordert

• Verwendung von zukunftsfesten Formaten

und/oder

• Nachkonvertierung der Daten

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Standard Multimedia-Typen

• Bilder• Audio• Video

• Interaktive Texte• Dynamic Content• Anbindung von Software

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Wissenschaftliche Multimedia-Typen

• Vektorzeichnungen• Animationen• 3D Szenen

• 2D Tabellen und Zeitreihen• Multidimensionale Messdaten• Chemie-spezifische Sonderformen (Strukturen, Reaktionen, Spektren)

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Anforderungen

• Nutzbar nach Jahrzehnten

• Voll dokumentiert• Verbreitet• Plattformunabhängig• Theoretisch und praktisch konvertierbar• Unlimitierter Vollzugriff• Nutzbar ohne Lizenz- und Patentfragen

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Erstrebtes Eigenschaftsprofil

• Verbreitete Formate• Standardisierung (International mit breiter Unterstützung)• Multiple Source – Unterstützung durch mehrere Hersteller• Format und Varianten automatisch erkennbar• ASCII/Unicode mit Mark-Up bevorzugt• Integration in Datensysteme (XML)

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Konvertierbarkeit

• Voll dokumentiertes Format• Eindeutig erkennbares Format• Verlustlose Datenkompression• Möglichst keine Verschlüsselung, Watermarks• Gutes Zeichen: Open-Source-Format

• JPEG, MPEG, Quicktime, MP3: etc.: Kompression verlustbehaftet!

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Überformate

• Kein einfaches Format, sondern Hülle

• Multiple CODECs

• Nicht nutzbar ohne spezifischen CODEC

• Beispiele: AVI, Quicktime

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Regeln zur Aufnahme von Multimedia-Content

• Einfachste Formate, die noch den Zweck erfüllen und alle notwendigen Informationen enthalten

• Keine undokumentierten, programmspezifischen Dateien

• Keine ausführbare Software

• Lieber mehr Speicherplatz als Lossy Compression

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Die IRIS Showcase Story

• Powerpoint-ähnliches Format auf SGI• Bis vor einigen Jahren in der Chemie recht beliebt• Support von SGI eingestellt• Läuft nicht mehr auf neueren IRIX-Versionen• Proprietäres, undokumentiertes, binäres Format• Kein Support durch Konkurrenzprodukte• Keine Freigabe des Formats wg. Rechtsstreitigkeiten

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: Bilder

• GIF: Patentfragen, Farbtiefe, Maximalgröße• JPEG: Verlustbehaftete Kompression• XBM, BMP, XPM: Schlechter Support, groß• TIFF: Überformat, Gefahr unüblicher CODECS• EPS: Riesige Dateien

• PNG: Derzeit wohl bester Kompromiss

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: Audio

• Samplingraten variabel, evtl. SW-Probleme• Verlustbehaftete Kompression• Multikanal-Problematik

• AIFF, WAV, AU: Nur leicht reversibel komprimiertes Signal• MP3, OV, RAM: Hoch und verlustbehaftet komprimiert• MIDI: Im Prinzip Noten

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: Video

• Datenvolumen erfordert verlustbehaftete Kompression• Evtl. Animation statt Video zu empfehlen• Zahlreiche proprietäre CODECs

• MPEG: Standardformat• QT, AVI: Überformate• Motion-JPEG für Spezialanwendungen

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: Vektorzeichnungen

• CGM: Standard, aber mit Variationen• DXF: Komplex, mit zahlreichen Erweiterungen• WMF: Proprietär, undokumentiert• EPS: Groß, schwierig zurückzulesen

• In Zukunft: SVG, XML-basiert

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: 2D Animationen

• Animated GIF: Groß, begrenzt, Patentfrage• VRML, X3D, Video: Overkill• Macromedia Flash/Shockwave: Jetzt offengelegt, wohl aktueller Standard

• In Zukunft: SVG

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: 3D Szenen

• Standard: VRML 1.0 und VRML 97• Animationen in 3D möglich• Guter Export-Support, Import über Java3D• VRML Weiterentwicklung eingestellt• Nachfolger X3D noch nicht einsatzreif

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: Tabellen

• Proprietäre Spreadsheet-Formate indiskutabel• TSV, CSV: Verlust von Meta-Information• SYLK, DIF: Standardformate• Mangelnde Codierung von Formeln• MathML evtl. Lösung in der Zukunft

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: Multidimensionale Daten

• Tabellenformate ungeeignet für Volumendaten, hierarchische Daten etc.• Proprietäre Formate generell nicht akzeptabel• HDF, netCDF sind Standards

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: Chemiedaten

• Strukturen, Spektren, Reaktionen, Sequenzen• Dutzende von proprietären Formaten• Missbrauch von Standardformaten (PDB)• Komplexe Überformate (CXF, CIF)• Empfehlung: SDF, JCAMP, RXN• In der Entwicklung: CML, XML-basiert

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia:Präsentationen

• Verknüpfung von Text, Audio, Video zu interaktiven Präsentationen• Zahlreiche proprietäre, undokumentierte Formate• SMIL als Standard, aber noch mit Akzeptanzproblemen

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: Anwendungsprogramme

• Hinterlegung von Quellcode unproblematisch• Wartung von compilierter Software i.A. kaum zu realisieren• Denkbare Möglichkeit: Java-Bytecode• Noch keine Langzeiterfahrungen

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: Indexierung

• Erschließung des Textkorpus über nicht-textuelle Suchverfahren auf Multimedia-Content• Daneben klassische Metadaten von MM-Objekten• Etabliert in der Chemie für Strukturen, Spektren, Reaktionen, Sequenzen• Sonstige Anwendungen Forschungsfelder (Bildinhalt, Musikphrasen, Szenenanalyse, Formelanalyse)

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Weitere Informationen

W. D. Ihlenfeldtwdi@ccc.chemie.uni-erlangen.de

http://www2.ccc.uni-erlangen.de/wdi/

top related