juin 22

A Propos d’OTMedia

A PROPOS D’OTMedia+

L’Observatoire Transmedia est une plateforme de recherche permettant d’analyser d’importants volumes de données transmedia (TV, Radio, Web, AFP, twitter) multimodales, hétérogènes et liées à l’actualité française et francophone.

L’Observatoire a été initié en 2010 dans le cadre du projet OTMedia qui fut financé par l’ANR jusqu’en 2014. Le consortium de ce projet piloté par l’Ina a réuni des partenaires technologiques ainsi qu’en sciences humaines et sociales et a permis d’acquérir un savoir-faire et des outils pour le traitement en masse des médias.

Cette plateforme, rebaptisée OTMedia+, connaît aujourd’hui une nouvelle phase de développement menée au sein du service de la Recherche de l’Ina afin d’être consolidée et devenir opérationnelle à l’horizon 2018 pour permettre de prolonger nos travaux. Elle a notamment servi de base aux travaux présentés dans le livre « L’information à tout prix » publié en 2017.

Lien Permanent pour cet article : http://www.otmedia.fr/a-propos-dotmedia/

juin 22

L’information à tout prix

Parution le 15 mars
« L’information à tout prix », de Julia Cagé, Nicolas Hervé et Marie-Luce Viaud (Ina Editions, 2017).

La production de l’information est-elle menacée à l’ère d’internet ?
En combinant des outils d’’analyse économique et des algorithmes de fouille de données conçus au sein du service de la recherche de l’Ina, l’ouvrage démontre comment l’information diffusée par les médias sur Internet relève très largement du copié-collé. Il propose, pour contrer cette menace de dévalorisation du travail des journalistes, des solutions de nature à la fois économique et juridique.

Le développement de l’information sur internet compromet-il la production d’une information originale ? Peut-on inventer de nouveaux modèles économiques pour les médias afin de tirer le meilleur parti des nouvelles technologies ?

Cet ouvrage, fruit d’un travail de recherche inédit, apporte de nouvelles réponses à ces questions en conjuguant les outils du big data, du machine learning et de l’économie. Il se fonde sur la construction et l’analyse d’une base de données unique : l’intégralité du contenu produit en ligne par les médias d’information en France sur l’année 2013, qu’il s’agisse de la presse écrite, de la télévision, de la radio, des pure internet players ou encore de l’AFP. C’est dans le cadre du projet de l’Observatoire Transmedia (OTMedia) de l’Ina que ces recherches ont été menées.

En appliquant leur algorithme de détection de copie, les auteurs montrent que, dans le cas des actualités « chaudes », 64% de l’information publiée en ligne correspond à du copié-collé pur et simple.

Ce phénomène , combiné à une vitesse de propagation extrêmement élevée de l’information en ligne – un quart des événements se propagent en moins de 4 minutes – risque de tuer à termes les incitations des médias à produire de l’information originale. Comment donc repenser, à l’heure du numérique, la monétisation de l’information, si coûteuse à produire ?
Afin d’ouvrir le débat, les auteurs proposent des solutions économiques et juridiques : une application plus stricte du droit d’auteur sur internet ; la mise en place de murs payants ; la syndication de contenu et la mutualisation des coûts de production de l’information ; le soutien public transmedia à la production d’information ; ou encore de nouvelles formes juridiques pour les médias.

Dès le 22 mars, découvrez sur inaglobal.fr, les bonnes feuilles et l’interview de Julia Cagé, Nicolas Hervé et Marie-Luce Viaud.

À PROPOS DES AUTEURS

Julia Cagé, normalienne, est Professeur d’Economie à Sciences Po Paris et chercheur affiliée au Centre for Economic Policy Research. Titulaire d’un doctorat d’économie de l’université d’Harvard, Julia Cagé est spécialiste d’économie politique, d’économie des organisations et d’histoire économique, elle s’intéresse tout particulièrement aux médias, en particulier à l’impact de la concurrence sur la production d’information et les attitudes politiques, et à la production d’information sur Internet. Elle est l’auteur de « Sauver les médias. Capitalisme, financement participatif et démocratie », Paris, Le Seuil 2015. Elle est membre de la Commission économique de la nation et du Conseil d’Administration de l’Agence France Presse.

Nicolas Hervé est Ingénieur de Recherche à l’Ina, titulaire d’un doctorat d’informatique de l’université Paris-Sud Orsay. Ses travaux portent sur l’analyse automatique et l’indexation de contenus multimédia.

Marie-Luce Viaud est Chercheuse à l’Ina, titulaire d’un doctorat d’informatique de l’université Paris-Sud Orsay. Elle est spécialisée en fouille et visualisation de données.
Elle coordonne avec Nicolas Hervé la plateforme de recherche OTMedia (Observatoire transmedia), qui a servi de support aux travaux de ce livre.
Retrouvez nos dernières publications :

http://www.inatheque.fr/publications-evenements/publications-editions-ina-liste.html

Articles dans la presse
FranceInter: l’instant M
La Croix
AFP
CB News
CB News
Libération
Libération
@SI
@SI
Media+
Stratégie
Les Inrocks
Le Figaro
Konbini
Express.live
Medi1
Radio Campus
L’Humanité
Sciences Humaines
Blog Eurésis

Lien Permanent pour cet article : http://www.otmedia.fr/linformation-a-tout-prix/

sept 25

The production of Information in an Online World : Technical Annex

Technical Annex of the paper « The Production of Information in an Online World »
Julia Cagé, Nicolas Hervé, Marie-Luce Viaud

Lien Permanent pour cet article : http://www.otmedia.fr/theproductionofinformationonlinetechnicalannex/

mar 01

Présentation du projet à la soirée *di*/zaïn #5 : code(s) + data(s). 27 février 2013


Claude Mussou et Nicolas Hervé (Ina), soirée… par soireesdizain

Les soirées *di*/zaïn

Lien Permanent pour cet article : http://www.otmedia.fr/presentation-du-projet-a-la-soiree-dizain-5-codes-datas-27-fevrier-2013/

fév 18

5e Forum de l’Alliance des civilisations de l’ONU – Vienne les 27 et 28 février 2013.

Marie-Luce VIAUD et Lucien CASTEX de l’Observatoire Transmédia représentaient l’INA à Vienne les 26, 27 et 28 février 2013 au 5e forum de l’Alliance des civilisations de l’Organisation des Nations Unies (UNAOC).

Vous pouvez lire le rapport de synthèse., la présentation et le podcast du workshop.

Pour en savoir plus, visitez le site officiel du forum.

 

Lien Permanent pour cet article : http://www.otmedia.fr/5e-forum-de-lalliance-des-civilisations-de-lonu-a-vienne-les-27-et-28-fevrier-2013/

jan 18

Présentation du projet OTMedia dans Libération

INA : L’info fouillée au corpus

par Isabelle Hanne

Paru dans Libération du 24 décembre 2012

[Voir cet article sur le site de Libération]

Marie-Luce Viaud fait des fouilles. Pas avec un pinceau, à genoux dans le sable, mais devant son ordinateur, dans un bureau de l’INA Expert, le département recherche de l’Institut national de l’audiovisuel, à Bry-sur-Marne (Val-de-Marne). La chercheuse s’est spécialisée dans la fouille de données. Soit « l’extraction d’un savoir à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques », selon la définition de Wikipédia à laquelle elle nous renvoie.

Depuis octobre 2010, elle coordonne une quinzaine de chercheurs qui collaborent à un discret mais ambitieux projet : l’Observatoire transmédia (OTMedia), une plateforme pour analyser les flux médiatiques à l’aide de moteurs de recherche (1). Ils fonctionnent sur une vaste base de données, capturées de juillet 2011 à décembre 2012. « C’est un corpus très riche, se félicite Marie-Luce Viaud. Primaire socialiste, élections présidentielle et législatives, élections américaines, Jeux olympiques… »

La collecte se fait dans les contenus de nombreux médias français : retranscriptions des journaux et des émissions d’actu de douze chaînes de télé, de TF1 à France 24, et de neuf radios, de RTL à France Culture ; six quotidiens (le Monde, Libé, le Figaro…) ; les dépêches de l’AFP, par ailleurs partenaire du projet ; 1300 sites internet, et Twitter. Le dépôt légal web de l’INA est mis à disposition.

L’observatoire doit permettre de « mieux appréhender les enjeux et les mutations de la sphère médiatique », explique le site du projet. Avec un budget de 2 millions d’euros, financé pour moitié par l’Agence nationale de la recherche (ANR) et labellisé par Cap Digital (le pôle de compétitivité en Ile-de-France), il rassemble une foultitude d’acteurs. Côté sciences humaines, le laboratoire Communication, information, médias de Paris-III-ENS, et le Laboratoire techniques, territoires et sociétés de l’Ecole des Ponts et Chaussées. Côté scientifique, le Laboratoire informatique d’Avignon (LIA), à la pointe sur la transcription audio ; Syllabs, une start-up spécialisée dans la sémantique ; l’INA et l’Institut national de recherche en informatique et en automatique (Inria), pour les moteurs de recherche à grande échelle et la visualisation de données.

Dans le monde des médias, « tout change, il y a beaucoup de nouveaux supports, et une remise en cause des acteurs historiques : c’est une période un peu trouble pour la production de l’information, note Marie-Luce Viaud. On a besoin d’outils d’analyse. Avec une vision transmédia, on peut détecter les événements à la source ». A terme, OTMedia permettra, sur le corpus, de déterminer quel média (Twitter ? AFP ?) est le plus souvent à l’origine de l’info, et qui sont les suiveurs. De retracer la propagation d’un événement, à l’heure d’Internet. Qui a dégainé en premier sur l’affaire Merah ? Avec quels mots ? Quel média a le plus parlé de la guerre en Syrie ? Des élections législatives ? Avec cette question : la multiplication des supports est-elle un gage de pluralité de l’info ou mène-t-elle à son infinie redondance ?

Dans le bureau de la chercheuse, des hiéroglyphes et des flèches encombrent un tableau Velleda. Elle présente les outils fraîchement mis au point sur le grand écran de son Mac : « Là, c’est vraiment un prototype de test, il y a encore des biais, on les corrige au fur et à mesure. » Une première interface permet d’accéder au vertigineux corpus de textes (en février, le prototype contiendra 4 millions de documents). On peut taper un nom (« Merah »), un lieu (« Toulouse »), une date… Marie-Luce Viaud présente une requête sur la période allant de mi-mars à mi-mai 2012, en plein cœur de l’affaire Merah : « On peut analyser le vocabulaire associé à un événement. Dans cette tragédie, « antisémitisme » et « racisme » laissent place à « terrorisme » et « violence » dans les médias. On peut aussi vérifier que les pics de l’AFP, de la télé et de la radio correspondent au temps réel des faits, alors que la presse et le Web prolongent l’événement en le commentant. »

Un des aspects les plus aboutis du projet, c’est son moteur de fouille visuelle (environ 700 000 images). « C’est l’état de l’art en la matière ! Dix ans de recherches. » L’outil reconnaît l’image par des agencements de points et va chercher les schémas similaires dans sa base de données. Par exemple, quand on sélectionne une moulure sur une photo de l’Assemblée nationale, le moteur ressort un agrégat d’images de différents politiques dans l’Hémicycle, avec la même moulure en arrière-plan. « On peut comparer la visibilité d’une marque ou d’un parti politique, par exemple », note la chercheuse, qui montre les résultats des requêtes sur l’affiche de Nicolas Sarkozy (« la France forte ») : la fouille détecte aussi bien les originaux que les détournements satiriques. L’outil permet aussi de faire émerger l’image la plus utilisée par les médias du corpus sur une période donnée – pour octobre 2011, par exemple, c’est le portrait de Steve Jobs. « L’outil n’est pas du tout fini, il y a 15 000 trucs à faire ! » s’enthousiasme Marie-Luce Viaud.

L’INA mettra le prototype à disposition des chercheurs au Centre de consultation Paris-BNF de l’Inathèque de France (site François-Mitterrand) à la fin du projet, en octobre 2013. On pourra ainsi voir, parmi mille autres choses, que de juillet 2011 à avril 2012, sauf lors de la primaire socialiste, la courbe des occurrences de « Nicolas Sarkozy » dans les médias du corpus dépasse toujours, et de beaucoup, la courbe de « François Hollande ».

 

Lien Permanent pour cet article : http://www.otmedia.fr/presentation-du-projet-otmedia-dans-liberation/

déc 21

Exemple de requête visuelle : ‘La France forte’

La recherche visuelle réalisée par l’INRIA et l’INA permet de retrouver toutes les images comprenant des copies complètes ou partielles de l’image requête originale dans le corpus de média du projet.
Cet exemple montre la performance du logiciel puisque les premiers résultats sont de la copie pure, puis du détournement partiel, et montrent,  à la fin,  des images comprenant l’image originale déchirée, déformée, occultée voire camouflée.

 

Voir la page de résultats (la première image a servi de requête)

Lien Permanent pour cet article : http://www.otmedia.fr/exemple-de-requete-visuelle-la-france-forte/

nov 22

Visual-based Transmedia Event Detection

Video presented at the Grand Challenge session of the ACM Multimedia 2012 conference in Nara (Japan).

Authors: Alexis Joly, Pierre Letessier, Julien Champ, Nicolas Hervé, Olivier Buisson, Marie-Luce Viaud.

Lien Permanent pour cet article : http://www.otmedia.fr/visual-based-transmedia-event-detection/

nov 15

The French Transmedia Observatory

 

 Presentation Dedicated Multimodal Search Engine
 Query analysis from multiple viewpoints  Datamining

 

 La vidéo complète sur youtube

 

Lien Permanent pour cet article : http://www.otmedia.fr/the-french-transmedia-observatory/

juin 23

L’observatoire Transmédia en quelques vidéos.

 Découverte d’objets visuels : copies.  Présentation IIPC 2012.
 Découverte d’objets visuels : logos.  Interface : Accès aux sources.

 

 

Lien Permanent pour cet article : http://www.otmedia.fr/lobservatoire-transmedia-en-quelques-videos/