TraLaLa

with the support of CNRS

See also the page project at the CDuce website

Le projet TraLaLa se propose d’étudier les aspects de traitement, d’interrogation et de manipulation de grandes masses de données lorsque celles-ci sont disponibles au format XML. Nous nous intéressons plus précisément aux aspects langages de programmation et langages de requêtes. Notre ambition est de couvrir de manière intégrée un large spectre de problématiques: de celles liées aux aspects langages (expressivité, typage, étude de nouvelles primitives de programmation, logiques sous-jacentes pour l’interrogation, optimisation logique), jusqu’aux aspects traitant l’accessibilité des données (données en streaming, compression, définition de modèles d’accès en mémoire secondaire, utilisation de moteurs de persistance), en passant par les problématiques liées à l’implantation (compilation du filtrage, optimisation physique, vérification du sous-typage, modèles d’exécution pour le streaming).

Nous attaquerons ces problématiques en organisant notre recherche selon trois axes directeurs: langages de requêtes, traitement de données à la volée et typage de documents.

  • langages de requêtes : étude théorique de paradigmes d’interrogation sous l’angle de l’expressivité et de la complexité; définitions de langages de requêtes pour XML ayant les caractéristiques d’expressivité restreinte et de déclarativité typiques des langages du modèle relationnel ; implantation puis conception et validation de techniques d’optimisations adaptées à ces différents paradigmes.

  • traitement des données à la volée (streaming) : identification d’une classe de requêtes qu’il est possible d’évaluer par “streaming”, avec ou sans compression des données, et dans le premier cas de détermination de la granularité optimale de compression.

  • contraintes et typage de documents : vérification (efficace) de contraintes d’intégrités plus fines que celles des langages traditionnels (par exemple, l’ interleaving des éléments XML; utilisation des types statiques pour la compilation efficace et l’optimisation de requêtes).

Outre une unité méthodologique, et une unité dans les objectifs, la coopération au sein du projet est accrue par la décision de choisir une cible logicielle unique à nos efforts d’implantation, le langage CDuce, qui est développé conjointement par le LIENS et le LRI, deux des sites participants à ce projet.

Composition

  • Projet GEMO, INRIA Futurs et LIAFA, équipe Vérification:
    • Luc SEGOUFIN1, Ioana MANOLESCU (CR INRIA), Anca MUSCHOLL (Pr), Andrei ARION (Doc), Mathias SAMUELIDES (Doc)
  • LIENS, Laboratoire d’Informatique de l’ENS, équipe Langages:
    • Giuseppe CASTAGNA1, Alain FRISCH (Ingénieur corps des Télécoms)
  • LIF, Laboratoire d’Informatique Fondamentale de Marseille, équipe Move:
    • Silvano DAL ZILIO1, Denis LUGIEZ (Pr), Charles MEYSONNIER (Doc)
  • Equipe MOSTRARE, INRIA Futurs et LIFL, Laboratoire d’Informatique Fondamentale de Lille, équipe STC:
    • Anne-Cécile CARON1, Sophie TISON (Pr), Joachim NIEHREN (Ing.Exp. INRIA), Jean-Marc TALBOT (MdC), Iovka BONEVA (Doc), Denis DEBARBIEUX (Doc)
  • LRI, Laboratoire de Recherche en Informatique, équipe Bases de Données:
    • Véronique BENZAKEN1, Nicole BIDOIT (Pr), Marwan BURELLE (Doc), Cédric MIACHON (Doc), Matthieu OBJOIS (Doc), Virginie THION (Doc)
  • Partenaires étrangers
    • Haruo Hosoya (Univ. Tokyo – Japon), Benjamin C. Pierce (Univ. Pennsylvania – USA), Thomas Schwentick (Univ. Marburg – Allemagne)
Avatar
Silvano DAL ZILIO
CNRS Researcher

My research interests include formal methods and concurrency semantics.

Publications

A Concurrent Calculus with Atomic Transactions

The Software Transactional Memory (STM) model is an original approach for controlling concurrent accesses to ressources without …

A Typed Calculus for Querying Distributed XML Documents

We study the problems related to querying large, distributed XML documents. Our proposal takes the form of a new process calculus …

A Concurrent Calculus with Atomic Transactions

The Software Transactional Memory (STM) model is an original approach for controlling concurrent accesses to ressources without …

XML schema, tree logic and sheaves automata

XML documents may be roughly described as unranked, ordered trees and it is therefore natural to use tree automata to …

A Typed Calculus for Querying Distributed XML Documents

We study the problems related to querying large, distributed XML documents. Our proposal takes the form of a new process …

A Logic you Can Count On

We prove the decidability of the quantifier-free, static fragment of ambient logic, with composition adjunct and iteration, …

XML Schema, Tree Logic and Sheaves Automata

XML documents, and other forms of semi-structured data, may be roughly described as edge labeled trees; it is therefore natural …

Multitrees Automata, Presburger's Constraints and Tree Logics

We describe multitree automata and a related logic on multitrees. Multitrees are extensions of trees with both associative and …