Chapitre 7
Conclusion
[Table des matières]
1 Rappel des objectifs
Le projet Opéra étudie les problèmes posés
par la conception d'un environnement éditorial coopératif
permettant l'édition, la maintenance et le traitement de documents
structurés et multimédia. Mon travail de thèse concerne
la conception et la réalisation d'un système d'édition
et de présentation multimédia qui intègre des éléments
de type texte, image, audio, vidéo ainsi que les interactions de
l'utilisateur. Le nouveau type de documents visé est donc multimédia
temporisé et interactif.
La construction d'un document multimédia est soumise à
des contraintes multiples provenant de la nature diverse des média,
de leur combinaison, et de leur intégration homogène au sein
des dimensions multiples d'un document. À ces contraintes s'ajoutent
celles de l'organisation d'une application qui est impliquée dans
plusieurs couches d'un système.
La plupart des systèmes actuels d'édition / présentation
multimédia proposent des méthodes d'édition fondées
sur une approche impérative (langages de script) ou sur la
datation explicite (les timelines). Dans ces systèmes, la
construction d'un document est un processus long, source de nombreuses
erreurs et difficile à maîtriser pour un auteur non spécialisé.
Les documents produits sont souvent complexes, difficiles à maintenir
et peu compatibles entre eux. En outre, la représentation des documents
utilisée ne permet pas de traitement automatique du document (comme
le copier/coller) qui fournirait à l'auteur une assistance efficace.
Ces systèmes n'exploitent pas non plus la nature « élastique
» du temps pour adapter le scénario d'un document aux vraies
intentions de l'auteur en fonction du contexte.
L'étude des systèmes disponibles montre la nécessité
de redonner le « contrôle » aux auteurs et de les assister
par la conception d'outils « intelligents » qui facilitent
la création d'un scénario, détectent les incohérences
et permettent d'obtenir une représentation du document plus expressive
et une restitution conforme à celle que l'auteur souhaite.
[Table des matières]
2 Démarche suivie et bilan scientifique
Dans cette perspective, nous avons analysé la nature des documents
multimédia et nous avons proposé une décomposition
de l'organisation globale d'un document en quatre structures : logique,
spatiale, temporelle et hypermédia. Ensuite, nous avons passé
en revue les principales approches de l'édition multimédia
à travers les méthodes de construction de scénario
et les standards proposés. Nous avons étudié les langages
de spécification de scénarios temporels pour le multimédia,
ainsi que les techniques d'analyse et de synthèse, notamment dans
un domaine où ces questions occupent une place prédominante
: la planification, l'ordonnancement et la satisfaction de contraintes
temporelles en intelligence artificielle.
Notre objectif était d'étudier si une approche déclarative
de la spécification d'un scénario temporel pouvait constituer
une alternative intéressante aux solutions actuelles. Nous avons
alors défini une architecture d'application qui permet de raccourcir
le cycle édition et présentation en tirant profit d'une approche
similaire au Wysiwyg dans les documents statiques.
Le premier résultat est une méthode de construction mettant
en oeuvre ce principe ainsi qu'un format de document de haut niveau. Ce
format rend compte des différentes dimensions du document et intègre
la dimension temporelle des éléments de base et leurs relations
de façon homogène. Ce format constitue notre langage temporel
qui permet la spécification d'un scénario. Inspiré
de la logique purement symbolique d'Allen [ALL
83], il a été étendu pour prendre en compte l'aspect
quantitatif du temps, l'indéterminisme des durées de certains
objets de base et les opérateurs permettant d'exprimer la causalité.
Le deuxième résultat est la conception d'un gestionnaire
temporel qui prend en charge les spécifications temporelles de l'auteur.
Ce gestionnaire, au coeur de notre système, met un oeuvre des mécanismes
permettant la construction d'un scénario et la vérification
de sa cohérence qualitative, quantitative, causale et indéterministe.
Ces deux derniers points soulèvent des problèmes théoriques
difficiles, à ce jour non-résolus, et pour lesquels nous
avons apporté une première solution. Le gestionnaire temporel
permet aussi de produire une représentation interne du document
sous forme de graphe adaptée pour la présentation. Il a été
conçu pour permettre une édition incrémentale tout
en gardant de très bonnes performances lors de la présentation
(traitement des documents en une fois).
À partir de cette représentation nous avons conçu
et développé un système de présentation qui
permet la restitution d'un document. Ce système, qui constitue notre
troisième résultat, exploite un automate d'états finis
extrait du graphe d'exécution et permet de restituer une présentation
multimédia à travers les dispositifs de la machine (écran
graphique et haut-parleur). Ce système permet en plus de superviser
dynamiquement le déroulement d'une présentation pour prendre
en compte l'indéterminisme, les interactions utilisateur et la navigation
hypermédia intra- et inter-documents.
[Table des matières]
3 Bilan et évaluation de la réalisation
Cette étude n'offrait un réel intérêt que si
elle était concrétisée par la réalisation d'un
prototype validant les idées qui en émergeaient. La réalisation
de Madeus a comporté une part importante de développement
pour mettre en oeuvre le modèle de document et d'édition
proposé. Elle a contribué au raffinement du modèle
et d'une manière globale à toute la réflexion.
L'originalité de l'outil d'édition et de présentation
développé dans le cadre de cette thèse se situe à
plusieurs niveaux : d'abord les outils d'expérimentation sont encore
très peu nombreux et les traitements considérés font
intervenir une combinaison de schémas d'exécution souvent
opposés : une présentation multimédia est à
la fois conduite par les flots de données (les éléments
multimédia), les flots de contrôle (enchaînements, interactions
utilisateur et navigation hypermédia) et par la supervision dynamique
de son déroulement (prise en compte de l'indéterminisme,
des contraintes dues aux accès distants, des ressources disponibles,
etc.).
Le prototype Madeus est construit selon une architecture en modules
et comporte une grande partie de l'infrastructure nécessaire à
ce type d'application. Cette architecture a été définie
de manière à faciliter l'expérimentation de divers
algorithmes d'analyse, de schémas d'exécution, ainsi que
de la synchronisation système de bas niveau et des accès
distants. Le prototype fonctionne de manière satisfaisante, avec
des performances très acceptables. Il permet déjà
de construire, de vérifier et de présenter des documents
d'une certaine complexité. Cependant, toutes les fonctions ne sont
pas supportées et les opérations de formatage temporel et
de restitution graphique peuvent être améliorées.
[Table des matières]
4 Perspectives
Cette contribution apporte des réponses aux problèmes qui
se posent à chaque niveau de l'édition d'un document multimédia
(spécification, analyse, synthèse et exécution). Elle
constitue une base qu'il faudra encore améliorer et compléter.
En plus de la consolidation des propositions faites dans cette thèse,
le travail qui reste à faire peut s'orienter sur quatre grandes
directions : le langage de spécification, l'interface utilisateur,
les outils formels pour la synchronisation et la synchronisation au niveau
du système et des protocoles réseaux.
-
Langage de spécification
-
Le premier champ d'activité concerne le langage de spécification
de la synchronisation temporelle. L'intérêt de continuer ce
travail est de combler les carences des langages proposés dans les
outils existants :
-
Format de documents : À court terme, mon projet est de participer
activement au groupe de travail du consortium World Wide Webnote1
qui définit les formats et langages pour le multimédia sur
le Web (MML : Multimedia Mark-Up Language). L'objectif est d'étendre
les documents HTML pour prendre en compte la dimension temporelle des présentations
multimédia. Mon action consiste à valoriser, dans ce contexte,
les résultats obtenus dans cette thèse sur la représentation
des documents multimédia.
-
Multi-dimensions : il s'agit de considérer un format qui
intègre les différentes dimensions du document. L'étude
que nous avons menée dans cette thèse est restreinte à
la dimension temporelle et n'aborde pas les problèmes liés
à l'interaction entre le temps et l'espace. Il s'agit d'une part
de pouvoir décrire en terme de langage cette interaction et de résoudre
les éventuels problèmes qui peuvent se poser. Par exemple,
des conflits d'attribution de ressources graphiques (espace d'affichage)
aux différents objets tout au long d'une présentation multimédia.
En effet, deux éléments présentés de façon
concurrente ne doivent pas se chevaucher spatialement. De même, des
ressources limitées de l'environnement de présentation peuvent
conduire à l'impossibilité de présenter de façon
concurrente deux objets multimédia (CPU, cartes de décompression,
périphérique audio, etc. ).
-
Généricité : Seules des instances de documents
indépendants ont été considérées. Les
travaux antérieurs du projet Opéra et ceux développés
dans d'autres laboratoires [KHA 95] pour
les documents multimédia ont montré les avantages qu'on pouvait
tirer d'une approche générique des structures de document.
Il convient d'étudier comment cette approche peut être étendue
à la structure temporelle des documents multimédia.
-
Interface utilisateur
-
Le langage temporel est actuellement très « informatique ».
Le problème central sera d'en trouver une version telle qu'il soit
à la fois facile à apprendre et facile à utiliser
par les concepteurs de documents non informaticiens, tout en conservant
toute sa puissance. Un des problèmes importants à résoudre
sera celui d'un codage spatial de relations temporelles [LAY
95], sachant que les approches à base de représentation
du graphe des relations (firefly) ne répondent pas aux besoins des
auteurs. Un premier travail de visualisation est de permettre d'explorer
l'ensemble des solutions d'une présentation à travers la
manipulation directe des objets et des contraintes temporelles qui leurs
sont attachées. Il faut ensuite passer à la phase d'édition
en offrant à l'auteur des moyens de création et de modification
entièrement graphique. Afin de considérer l'ensemble des
dimensions du document, il faut traduire de façon graphique l'organisation
logique du document et d'établir le lien avec sa dimension spatiale
et hypermédia. Les problèmes posés restent nombreux
dans ce domaine. À titre d'exemple, on peut citer le maintien continu
de la cohérence de la représentation graphique, les problèmes
d'interface homme-machine comme le multi-vues, la multi-modalité,
etc.
-
Outils formels pour la synchronisation
-
À plus long terme, nous pensons aborder la formalisation d'un langage
temporel primitif à base d'instants intégrant les aspects
qualitatif et quantitatif, les interruptions, les rendez-vous et l'indéterminisme
[COU 96]. En particulier, la gestion
de l'indéterminisme peut être traitée de façon
plus complète en intégrant des techniques similaires à
celles employées dans la synthèse de contrôleurs dans
les systèmes temps réels. Ces techniques sont fondées
sur la modélisation des scénarios au moyen d'automates temporisés.
Le principe consiste à représenter de façon exhaustive
(les états de l'automate) l'évolution d'un scénario
suite aux différents événements d'une présentation
(les transitions). Il s'agit alors de définir des stratégies
qui permettent d'assurer dynamiquement le respect des contraintes temporelles
suite aux différents événements indéterministes.
En termes d'automates, il s'agit de choisir (par des prises de décision
successives) des chemins dans l'automate qui permettent d'éviter
que le système n'atteigne un état dit d'échec. Un
tel état correspond à l'impossibilité de remettre
le scénario temporel dans un état cohérent. Cette
condition correspond à la propriété de contrôlabilité
d'un scénario évoquée dans le chapitre V. Le problème
peut ainsi être abordé sous l'angle de la théorie des
jeux où le contrôleur (l'ordonnancer) modifie, à l'exécution,
le scénario pour parer aux valeurs incontrôlables. Ces valeurs
étant choisies par la « l'environnement d'exécution
» qui représente l'adversaire du contrôleur dans la
partie de jeu.
-
Synchronisation système et réseaux
-
Notre démarche s'est principalement focalisée sur le processus
de construction d'un scénario et sur sa présentation en privilégiant
le point de vue de l'auteur. Le travail effectué dans Madeus concernant
l'aspect système et réseaux reste encore rudimentaire étant
donnée qu'il ne couvre que les fonctions de base. Le travail de
recherche qui reste à accomplir dans ce domaine reste très
vaste et encore peu exploré. Nous pouvons néanmoins dresser
trois voies qui nous semblent très prometteuses :
-
Support d'exécution : le support d'exécution actuellement
implanté est principalement adapté à une exécution
locale de documents multimédia de petite taille. Cependant, on s'aperçoit
dès à présent, avec l'utilisation du prototype Madeus,
des variations de la qualité d'une présentation lorsque les
documents multimédia sont volumineux ou visualisés dans un
contexte réparti. Le volume important de données à
traiter, à transférer et à stocker induit une dérive
de la présentation que les outils comme Madeus doivent prendre en
compte. Il faut donc que le schéma général de l'exécution
d'une présentation soit très performant pour être en
accord avec des traitements de type temps-réel. En outre, il doit
être extensible de façon à intégrer de nouvelles
technologies comme la diffusion (server push) ainsi que l'orientation objet
comme dans activeX et MHEG permettant une plus grande intégration
au sein de l'outil.
-
Supervision de la présentation : l'objectif général
au niveau de l'application multimédia est de concevoir et d'optimiser
le traitement des documents hypermédia. Il est clair cependant qu'une
réponse pertinente au problème de la présentation
de documents multimédia ne pourra être correctement apportée
que si l'on prend en compte les trois parties parties qui sont impliquées
:
-
L'environnement de présentation (machine cliente).
-
Les contraintes du réseau comme la bande passante et les latences
des accès.
-
L'environnement de stockage (machine serveur de données pour les
documents, la vidéo, l'audio, les images, le texte, etc.).
Ainsi, les environnements lecteur (les clients) ont à la fois besoin
d'une meilleure supervision de la présentation (adaptation de la
dimension temporelle des documents présentés) ainsi que d'avoir
à leur disposition des moyens d'agir sur les serveurs pour réaliser
de telles adaptations. Du côté du serveur, le mode de représentation
des données, de leur stockage et surtout de leur accès doit
être en conséquence adaptatif. Dans une première étape,
il est nécessaire de définir des critères pour exprimer
les contraintes de ressources à l'échelle des documents multimédia
interactifs, ensuite il faut concevoir un processus de supervision permettant,
à partir de l'évolution de ces paramètres, de décider
dynamiquement quand et comment les adaptations doivent être mises
en oeuvre.
-
Protocoles de communication : TCP est certainement avec IP, l'un
des protocoles qui a contribué le plus au succès et au développement
d'Internet et des systèmes hypermédia en général.
Cependant l'arrivée des applications "temps-réel" sur l'Internet
a montré les limites de ce protocole. En effet, les applications
ont des exigences en terme de latence de transmission et de support multipoint
beaucoup plus importantes que les applications de type ftp ou http. Face
à ces nouveaux besoins, de nouveaux protocoles de transport comme
RTP, RTSP ont été proposés. Cependant, Internet ne
permet pas aujourd'hui de faire de la réservation de ressources
ou même d'instaurer des priorités sur les flux transmis. Dans
ces conditions, le rôle des protocoles de transport est assez limité.
Par conséquent, pour obtenir de bonnes performances, il est indispensable
que les applications s'adaptent en temps réel ou de façon
prédictive au débit du réseau. Ces adaptations peuvent
être de différentes natures. L'application pourra, par exemple,
changer l'algorithme de compression en fonction du débit disponible
ou encore ajouter de la redondance dans son codage de façon à
augmenter sa résistance aux pertes de paquets dans le réseau.
Dans les différentes évolutions du système que nous
venons de citer, l'originalité du travail à réaliser
consiste à tirer profit de l'aspect prédictif du graphe de
contraintes. Il sera alors possible de redéfinir la notion de qualité
de service à l'échelle du document tout entier contrairement
aux travaux actuels [STA 95]. En outre,
les accès aux données à travers le réseau peuvent
être réalisés d'une façon plus prédictive
[KWA 96].
Au terme de cette étude, nous constatons que les objectifs que nous
nous étions fixés étaient réalistes dans la
mesure où nous avons pu concevoir et mettre en oeuvre un système
pour documents multimédia qui intègre à la fois l'édition
et la présentation, tout en sachant que tous les problèmes
liés à l'édition et à la présentation
ne pouvaient pas être couverts de façon complète.
Notes :
(1)
http://www.w3.org