Chapitre 1

Introduction

[Table des matières]

1 Introduction

Les percées technologiques récentes en matière de multimédia ont permis d'accroître les possibilités d'interaction entre l'homme et la machine. La manipulation digitale, de graphiques, de son et d'images animées sur des stations de travail ou des ordinateurs personnels a changé la nature d'un grand nombre d'applications.

En particulier, les applications de traitement de documents électroniques, habituellement dédiées à la création et à la présentation de données textuelles et graphiques, trouvent dans le multimédia des possibilités nouvelles. L'information qu'elles manipulent est plus riche, puisqu'elles intègrent dans ces documents du son et des images animées. Ces nouveaux types de documents électroniques sont communément appelés documents multimédia. Le développement des réseaux de communication rapides permet par ailleurs de relier ces documents pour constituer ainsi des réseaux de documents hypermédia à l'intérieur desquels on peut envisager de naviguer à la manière du World Wide Web.

Les documents ont jusqu'ici été abordés principalement sous l'angle de leur structure logique (organisation en chapitres, sections, paragraphes, etc.), de leur structure spatiale (présentation graphique et mise en page) et de leur structure sémantique (hypertexte). Un nouveau type de structure est maintenant considéré, la structure temporelle qui décrit l'enchaînement des éléments dans le temps. L'intégration de cette nouvelle dimension dans la structure globale d'un document, ainsi que l'introduction d'éléments de base qui ont eux-mêmes une dimension temporelle (vidéo, audio, interactions de l'utilisateur...), constitue l'objet de cette thèse. Les documents étudiés ici sont donc multimédia, temporisés et interactifsnote1.

Les standards et les modèles employés pour représenter les documents classiques, comme SGML et ODA, sont devenus inadaptés pour représenter de tels documents. De ce fait, de nouveaux standards comme HyTime, MHEG et HyperODA, émergent pour les compléter. Mais les standards ne suffisent pas et il existe très peu d'outils pour la création, la modification et la présentation de documents multimédia complexes.

Le travail présenté dans cette thèse a pour objectif de contribuer au domaine de l'édition et de la présentation des documents multimédia, en considérant de façon prioritaire les besoins des auteurs.

[Table des matières]

2 Motivations et objectifs

Dans tous les systèmes d'édition de documents multimédia proposés actuellement, la construction d'une présentation se fait au moyen de langages de programmation, selon une approche impérative, pour définir des enchaînements temporels complexes. Cette approche comporte plusieurs inconvénients majeurs, comme la faible portabilité des documents, l'inadaptation de la programmation à la nature incrémentale du processus d'édition, la difficulté de la maintenance des documents ainsi produits, et enfin, les problèmes qu'ont les auteurs non-informaticien pour les maîtriser.

En considérant la façon dont les autres dimensions des documents (spatiale, logique, hypermédia) sont représentées et traitées dans les systèmes actuels, on s'aperçoit qu'une grande partie des inconvénients cités ci-dessus a disparu grâce à la définition de formats de documents déclaratifs. Il parait donc intéressant d'étudier comment une approche déclarative peut s'appliquer à la dimension temporelle.

Un des premiers objectifs de tout système d'édition est de répondre aux besoins de l'auteur. Dans un contexte multimédia celui-ci doit pouvoir exprimer les informations temporelles qu'il désire et uniquement celles-ci. De plus, le système doit lui offrir le moyen de contrôler de façon incrémentale la validité des informations qu'il a introduites.

On ne peut apporter une réponse pertinente au problème de la spécification de la dimension temporelle d'un document multimédia qu'en ayant une connaissance précise de tous les éléments qui constituent un système d'édition / présentation multimédia. C'est pourquoi nous avons fait le choix de prendre une approche verticale du domaine de l'édition / présentation de documents multimédia, en concevant et en mettant en oeuvre un système réel.

En effet, la compréhension de la nature des traitements effectués par le système de présentation sur les objets multimédia est nécessaire pour déterminer quel type d'information temporelle l'auteur peut vouloir formuler dans les documents multimédia. Par exemple, comme il est difficile de contrôler la durée de présentation d'une vidéo, à cause de la charge du réseau et/ou de la machine, il est important de permettre à l'auteur de spécifier des durées indéterministes pour ces types d'éléments. Un autre cas typique de source d'indéterminisme dans les présentations multimédia vient de la possibilité de spécifier des interactions utilisateur dans les documents.

Ainsi, nous pensons qu'un environnement d'édition / présentation de documents multimédia doit prendre en compte à la fois les contraintes temporelles exprimées par l'auteur et celles inhérentes à la présentation de média différents. Une des principales difficultés de cette approche est que les contraintes considérées peuvent être précises, imprécises ou incertaines.

Ces motivations nous ont conduit à aborder cette thèse selon trois axes complémentaires :

Dans tout travail de recherche effectué dans un cadre applicatif (ici l'édition multimédia), il est fondamental de confronter les propositions théoriques avec la réalité de l'application. C'est pourquoi, nous avons tenté de mener tout au long de cette thèse une activité équilibrée entre théorie et application. Deux types de résultats sont donc attendus :
  1. Des résultats théoriques, sous la forme d'un langage de spécification qui prend en compte l'aspect quantitatif du temps, l'indéterminisme de la durée de certains objets de base et le besoin d'opérateurs d'interruption. Ce langage est associé à des mécanismes d'analyse (vérification de la cohérence d'une spécification) et de synthèse (recherche d'une solution de présentation).
  2. Des résultats pratiques, sous la forme du prototype d'édition et de présentation de documents multimédia Madeus qui permet de créer et de présenter des documents d'une complexité significative.
[Table des matières]

3 Cadre de travail

Ce travail de thèse s'est déroulé au sein du projet Opéra de l'Inria Rhône-Alpes. Le projet Opéra s'intéresse aux documents électroniques : documents structurés, hypertextes et multimédia. Il étudie des modèles de documents qui rendent compte à la fois de leur organisation logique ou abstraite, de leur présentation graphique, de leur contenu et de leur aspect temporel. Il met également au point des techniques d'édition qui s'appuient sur ces modèles.

La plupart des actions de recherche du projet Opéra trouvent leur application dans les logiciels expérimentaux développés dans le projet :

Le travail réalisé au cours de ma thèse a permis d'introduire au sein du projet Opéra un nouveau domaine, celui des documents multimédia, et un nouveau logiciel expérimental, Madeus.

[Table des matières]

4 Plan de la thèse

Ce mémoire de thèse est organisé en deux grandes parties : les deux premiers chapitres fixent le contexte de notre travail en faisant l'analyse des besoins et des applications existantes pris en fixant le cadre théorique des modèles temporels ; les trois chapitres suivants constituent notre réponse aux trois problèmes soulevés plus haut : quel langage temporel, comment assurer l'analyse et la synthèse de scénarios et quel système de présentation de documents multimédia offrir aux auteurs/lecteurs. Nous détaillons ci-dessous le contenu de chacun de ces chapitres.
Chapitre II
Le chapitre II introduit les notions de base sur les systèmes multimédia. Cette étude aborde dans une première partie les problèmes liés à la synchronisation des objets multimédia, ainsi que les différents niveaux où elle doit être considérée. La deuxième partie est consacrée à l'édition de documents multimédia. En particulier, nous présentons la décomposition de l'architecture d'un document en structures logique, spatiale, temporelle et hypermédia. Une description et une évaluation des approches existantes concernant l'édition, ainsi que celles des standards HyTime et MHEG sont proposées en fin de ce chapitre.
Chapitre III
Le chapitre III est consacré à l'étude des modèles temporels pour les documents multimédia. L'étude consiste d'abord à identifier quel type de langage on veut offrir aux auteurs pour construire des scénarios temporel. Nous présentons ensuite différentes techniques d'analyse et de synthèse des scénarios temporels. Cette étude est effectuée à partir des travaux d'autres domaines de l'informatique (la planification en intelligence artificielle ou la recherche opérationnelle) qui sont eux aussi confrontés à des problèmes d'ordonnancement temporel.
Chapitre IV
Dans le chapitre IV, nous décrivons le système d'édition et de présentation Madeus développé dans le cadre de cette thèse. Cette description porte sur son principe de conception, son architecture générale et son interface utilisateur. Le format de document utilisé est ensuite présenté. Ce format permet de décrire les documents selon leur quatre dimensions (logique, spatiale, hypermédia et temporelle).
Chapitre V
Dans ce chapitre, nous abordons le problème de la représentation et de la gestion des contraintes au sein de l'éditeur Madeus. Une attention particulière est accordée à l'incrémentalité des mises à jour du document, aux mécanismes de vérification de la cohérence et au formatage temporel car ils constituent l'un des aspects originaux de ce travail. Cette étude nous a permis de réaliser un gestionnaire temporel qui est au coeur de l'architecture de Madeus.
Chapitre VI
Le chapitre VI décrit le système de présentation de Madeus. Son rôle est de fournir le support nécessaire pour l'ordonnancement de la présentation et la restitution de l'information multimédia à travers les dispositifs de sortie comme l'écran graphique et le haut-parleur. Il permet en plus la supervision de la présentation en prenant en compte les interactions de l'utilisateur et l'indéterminisme temporel.
Chapitre VII
La conclusion résume l'apport essentiel de ce travail et propose une vision prospective de ce nouveau domaine des systèmes de documents multimédia à forte composante temporisée. Nous tirons aussi le bilan de la réalisation de Madeus ainsi que les perspectives de recherche suggérées par ce travail.

Notes :

(1)

Dans la suite de ce mémoire, on désignera par l'expression « document multimédia » les documents temporisés, interactifs et contenant des éléments de natures diverses (texte, image, audio, vidéo, etc.).