sept 25

The production of Information in an Online World : Technical Annex

Technical Annex of the paper « The Production of Information in an Online World »
Julia Cagé, Nicolas Hervé, Marie-Luce Viaud

Lien Permanent pour cet article : http://www.otmedia.fr/theproductionofinformationonlinetechnicalannex/

mar 01

Présentation du projet à la soirée *di*/zaïn #5 : code(s) + data(s). 27 février 2013


Claude Mussou et Nicolas Hervé (Ina), soirée… par soireesdizain

Les soirées *di*/zaïn

Lien Permanent pour cet article : http://www.otmedia.fr/presentation-du-projet-a-la-soiree-dizain-5-codes-datas-27-fevrier-2013/

fév 18

5e Forum de l’Alliance des civilisations de l’ONU – Vienne les 27 et 28 février 2013.

Marie-Luce VIAUD et Lucien CASTEX de l’Observatoire Transmédia représentaient l’INA à Vienne les 26, 27 et 28 février 2013 au 5e forum de l’Alliance des civilisations de l’Organisation des Nations Unies (UNAOC).

Vous pouvez lire le rapport de synthèse., la présentation et le podcast du workshop.

Pour en savoir plus, visitez le site officiel du forum.

 

Lien Permanent pour cet article : http://www.otmedia.fr/5e-forum-de-lalliance-des-civilisations-de-lonu-a-vienne-les-27-et-28-fevrier-2013/

jan 18

Présentation du projet OTMedia dans Libération

INA : L’info fouillée au corpus

par Isabelle Hanne

Paru dans Libération du 24 décembre 2012

[Voir cet article sur le site de Libération]

Marie-Luce Viaud fait des fouilles. Pas avec un pinceau, à genoux dans le sable, mais devant son ordinateur, dans un bureau de l’INA Expert, le département recherche de l’Institut national de l’audiovisuel, à Bry-sur-Marne (Val-de-Marne). La chercheuse s’est spécialisée dans la fouille de données. Soit « l’extraction d’un savoir à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques », selon la définition de Wikipédia à laquelle elle nous renvoie.

Depuis octobre 2010, elle coordonne une quinzaine de chercheurs qui collaborent à un discret mais ambitieux projet : l’Observatoire transmédia (OTMedia), une plateforme pour analyser les flux médiatiques à l’aide de moteurs de recherche (1). Ils fonctionnent sur une vaste base de données, capturées de juillet 2011 à décembre 2012. « C’est un corpus très riche, se félicite Marie-Luce Viaud. Primaire socialiste, élections présidentielle et législatives, élections américaines, Jeux olympiques… »

La collecte se fait dans les contenus de nombreux médias français : retranscriptions des journaux et des émissions d’actu de douze chaînes de télé, de TF1 à France 24, et de neuf radios, de RTL à France Culture ; six quotidiens (le Monde, Libé, le Figaro…) ; les dépêches de l’AFP, par ailleurs partenaire du projet ; 1300 sites internet, et Twitter. Le dépôt légal web de l’INA est mis à disposition.

L’observatoire doit permettre de « mieux appréhender les enjeux et les mutations de la sphère médiatique », explique le site du projet. Avec un budget de 2 millions d’euros, financé pour moitié par l’Agence nationale de la recherche (ANR) et labellisé par Cap Digital (le pôle de compétitivité en Ile-de-France), il rassemble une foultitude d’acteurs. Côté sciences humaines, le laboratoire Communication, information, médias de Paris-III-ENS, et le Laboratoire techniques, territoires et sociétés de l’Ecole des Ponts et Chaussées. Côté scientifique, le Laboratoire informatique d’Avignon (LIA), à la pointe sur la transcription audio ; Syllabs, une start-up spécialisée dans la sémantique ; l’INA et l’Institut national de recherche en informatique et en automatique (Inria), pour les moteurs de recherche à grande échelle et la visualisation de données.

Dans le monde des médias, « tout change, il y a beaucoup de nouveaux supports, et une remise en cause des acteurs historiques : c’est une période un peu trouble pour la production de l’information, note Marie-Luce Viaud. On a besoin d’outils d’analyse. Avec une vision transmédia, on peut détecter les événements à la source ». A terme, OTMedia permettra, sur le corpus, de déterminer quel média (Twitter ? AFP ?) est le plus souvent à l’origine de l’info, et qui sont les suiveurs. De retracer la propagation d’un événement, à l’heure d’Internet. Qui a dégainé en premier sur l’affaire Merah ? Avec quels mots ? Quel média a le plus parlé de la guerre en Syrie ? Des élections législatives ? Avec cette question : la multiplication des supports est-elle un gage de pluralité de l’info ou mène-t-elle à son infinie redondance ?

Dans le bureau de la chercheuse, des hiéroglyphes et des flèches encombrent un tableau Velleda. Elle présente les outils fraîchement mis au point sur le grand écran de son Mac : « Là, c’est vraiment un prototype de test, il y a encore des biais, on les corrige au fur et à mesure. » Une première interface permet d’accéder au vertigineux corpus de textes (en février, le prototype contiendra 4 millions de documents). On peut taper un nom (« Merah »), un lieu (« Toulouse »), une date… Marie-Luce Viaud présente une requête sur la période allant de mi-mars à mi-mai 2012, en plein cœur de l’affaire Merah : « On peut analyser le vocabulaire associé à un événement. Dans cette tragédie, « antisémitisme » et « racisme » laissent place à « terrorisme » et « violence » dans les médias. On peut aussi vérifier que les pics de l’AFP, de la télé et de la radio correspondent au temps réel des faits, alors que la presse et le Web prolongent l’événement en le commentant. »

Un des aspects les plus aboutis du projet, c’est son moteur de fouille visuelle (environ 700 000 images). « C’est l’état de l’art en la matière ! Dix ans de recherches. » L’outil reconnaît l’image par des agencements de points et va chercher les schémas similaires dans sa base de données. Par exemple, quand on sélectionne une moulure sur une photo de l’Assemblée nationale, le moteur ressort un agrégat d’images de différents politiques dans l’Hémicycle, avec la même moulure en arrière-plan. « On peut comparer la visibilité d’une marque ou d’un parti politique, par exemple », note la chercheuse, qui montre les résultats des requêtes sur l’affiche de Nicolas Sarkozy (« la France forte ») : la fouille détecte aussi bien les originaux que les détournements satiriques. L’outil permet aussi de faire émerger l’image la plus utilisée par les médias du corpus sur une période donnée – pour octobre 2011, par exemple, c’est le portrait de Steve Jobs. « L’outil n’est pas du tout fini, il y a 15 000 trucs à faire ! » s’enthousiasme Marie-Luce Viaud.

L’INA mettra le prototype à disposition des chercheurs au Centre de consultation Paris-BNF de l’Inathèque de France (site François-Mitterrand) à la fin du projet, en octobre 2013. On pourra ainsi voir, parmi mille autres choses, que de juillet 2011 à avril 2012, sauf lors de la primaire socialiste, la courbe des occurrences de « Nicolas Sarkozy » dans les médias du corpus dépasse toujours, et de beaucoup, la courbe de « François Hollande ».

 

Lien Permanent pour cet article : http://www.otmedia.fr/presentation-du-projet-otmedia-dans-liberation/

déc 21

Exemple de requête visuelle : ‘La France forte’

La recherche visuelle réalisée par l’INRIA et l’INA permet de retrouver toutes les images comprenant des copies complètes ou partielles de l’image requête originale dans le corpus de média du projet.
Cet exemple montre la performance du logiciel puisque les premiers résultats sont de la copie pure, puis du détournement partiel, et montrent,  à la fin,  des images comprenant l’image originale déchirée, déformée, occultée voire camouflée.

 

Voir la page de résultats (la première image a servi de requête)

Lien Permanent pour cet article : http://www.otmedia.fr/exemple-de-requete-visuelle-la-france-forte/

nov 22

Visual-based Transmedia Event Detection

Video presented at the Grand Challenge session of the ACM Multimedia 2012 conference in Nara (Japan).

Authors: Alexis Joly, Pierre Letessier, Julien Champ, Nicolas Hervé, Olivier Buisson, Marie-Luce Viaud.

Lien Permanent pour cet article : http://www.otmedia.fr/visual-based-transmedia-event-detection/

nov 15

The French Transmedia Observatory

 

 Presentation Dedicated Multimodal Search Engine
 Query analysis from multiple viewpoints  Datamining

 

 La vidéo complète sur youtube

 

Lien Permanent pour cet article : http://www.otmedia.fr/the-french-transmedia-observatory/

juin 23

L’observatoire Transmédia en quelques vidéos.

 Découverte d’objets visuels : copies.  Présentation IIPC 2012.
 Découverte d’objets visuels : logos.  Interface : Accès aux sources.

 

 

Lien Permanent pour cet article : http://www.otmedia.fr/lobservatoire-transmedia-en-quelques-videos/