mercredi, avril 03, 2013

Le big data vous menace-t-il ?


Chaque minute, 204 millions de mails sont échangés, 47000 applications mobiles sont téléchargées, 3000 photos sont mises en ligne - et 20 personnes sont victimes d'usurpation d'identité. Au total, plus d'un demi teraoctet[1] de données sont échangés. Et ces nombres continueront à augmenter avec l'évolution de l'usage d'internet mais surtout celui de ses « usagers » - il y aura en effet bientôt plus d'objets que de personnes reliés à internet. Votre voiture signalera au concessionnaire un besoin de maintenance évitant une panne et aidera votre assureur à vous proposer une couverture plus adaptée à votre conduite. Votre machine à laver pourra mettre à jour un programme de lavage plus économe. Le réseau électrique indiquera à chaque véhicule électrique le moment le plus opportun pour se recharger en évitant les files d'attente aux bornes. Tous les secteurs bénéficieront ainsi du Big Data, c'est à dire de l'analyse de masses considérables de données d'origines (réseaux sociaux, blogs, capteurs...) et de formats (textes, videos, géolocalisation ...) multiples.
Quel impact sur la sécurité ?
Le potentiel de ces technologies est considérable, mais il soulève des craintes en matière de sécurité qui le sont tout autant : si les données, autrefois limitées à l'usage pour lequel elles étaient collectées (comme identifier son client pour un commerçant) voient leur utilisation se multiplier à l'infini, ne va-t-on pas aussi multiplier les risques à l'infini ? Le développement des solutions big data reposant sur de grandes masses de données hébergées par des solutions matérielles et logicielles diverses et déployées sur des réseaux parfois externes, ne va-t-il pas augmenter à la fois les points de vulnérabilité, et l'ampleur des conséquences en cas d'attaque ?
 Notons d'abord qu'il est souvent plus aisé d'accéder à une donnée sensible grâce à des vulnérabilités humaines (obtenir par ruse des informations au téléphone, s'introduire dans un bâtiment sous une fausse identité...) qu'en tirant partie de failles techniques. D'autre part, les bases de données classiques concentrent souvent dans un même lieu des données structurées alors que les données du Big Data se présentent à prime abord sous des supports distribués et peu accessibles. Enfin, un fichier client peut se copier sur la carte mémoire d'un téléphone. Ce n'est pas le cas pour une masse de données de plusieurs pétaoctets, dont le temps de téléchargement est également prohibitif (plusieurs années). Le Big Data rend par ailleurs possible de nouveaux outils [2] qui utilisent sa puissance pour déjouer les attaques des pirates, par exemple en détectant en temps réel les transactions bancaires suspectes.
Plus de moyens de contrôle
Soulignons enfin que, géré de façon professionnelle, un projet de Big Data s'accompagne généralement d'une augmentation des moyens consacrés à la sécurité de données au regard des risques potentiels. Il existe en effet de nombreuses techniques pour protéger l'anonymat, qu'il s'agisse de méthodes de collecte (confier le traitement de données ne devant pas être rapprochées à des entités indépendantes), d'algorithmes de hachage (qui permettent de masquer l'identité des personnes) ou de contraintes portant sur les requêtes pour rendre impossibles l'identification des personnes, même indirecte.
Une régulation compétitive pour pérenniser notre modèle de protection
Le développement du Big Data fait l'objet d'une concurrence mondiale intense entre entreprises et entre Etats. Pour avoir une chance d'en influencer les normes, notamment de protection des données individuelles, nous devrons être à la fois présents et compétitifs. Pour cela, il faudra relever trois défis:
 - Le défi de la vision et des moyens
Alors que le volume des données augmente de 40 % par an, les budgets informatiques progressent dix fois moins vite. Nous manquons de compétences propres au Big Data, qu'il s'agisse de « data scientists » disposant à la fois de compétences statistiques, en programmation et en architecture informatique, de « business analysts » capables de traduire les résultats de ces analyses en opportunités commerciales, ou de spécialistes en « Big Sécurité ». Par ailleurs, hormis les directeurs informatiques, rares sont les membres de comité exécutif maîtrisant ces enjeux. De ce fait, très peu d'entreprises disposent d'une feuille de route operationnelle en matière de Big Data.
 - Le défi de la sécurité des données
Le Big Data manipule des données qui doivent être protégées conformément à une législation à la fois fluctuante dans le temps et selon les Etats. Une fuite de données sensibles peut entacher durablement l'image de marque d'une organisation et causer de coûteux contentieux. Ces risques peuvent tout à fait être maîtrisés par une conception adaptée des projets, et grâce à des audits limitant les dérives ultérieures. Mais cette maîtrise ne s'improvise pas, et sera difficile à réaliser sans l'appui d'un partenaire ayant développé une compétence forte (par exemple, un fournisseur d'équipements) ou d'un conseil spécialisé.
 - Concilier régulation et stratégie d'innovation
 Dans le domaine du téléphone mobile, l'Europe a su faire de sa norme GSM un avantage compétitif permettant un développement du mobile plus rapide qu'aux Etats-Unis. A l'inverse, c'est en grande partie en raison de l'existence de langues multiples en Europe que les initiatives de moteurs de recherche européens ont rapidement été dominées par leurs concurrents américains, capables de s'adresser avec le même produit à des centaines de millions d'utilisateurs parlant la même langue. En matière de Big Data, les entreprises sont en Europe dans le deuxième cas, soumises à un patchwork de lois conçues dans une vision traditionnelle de collecte, de stockage et d'utilisation prévisible et ordonnancée des données, difficilement transposable aux données massives. Elles se battent face à la compétition mondiale avec des handicaps que n'ont pas leurs concurrents. Un travail important est donc encore nécessaire pour définir un cadre qui soit à la fois protecteur des libertés individuelles, et favorable au développement du Big Data, tout en profitant des atouts offerts par la technologie pour maintenir - et même souvent renforcer - ce niveau de protection.
 Au total, l'efficacité et la réactivité avec laquelle nous adopterons, au niveau Européen, une telle approche de la régulation du Big Data déterminera notre capacité à développer des champions en Europe - centres de recherche de groupes mondiaux, ou entreprises européennes. Dans le cas inverse, ces développements se feront ailleurs, et nous serons triplement perdants : nous perdrons des emplois à valeur ajoutée, nous passerons à côté de l'essentiel des bénéfices économiques et nous n'aurons aucune prise sur les standards de protection de données qui nous seront imposés de l'extérieur.
 [1]Un teraoctet = mille gigaoctets = mille milliards de caractères
[2]Voir par exemple le site de la CNIL

lundi, avril 01, 2013

Economiques, sociales et politiques : les révolutions du « big data », et pourquoi s’en réjouir



Quel serait la plus grosse surprise d’une personne vivant dans les année 80, et qui serait projetée dans la France d’aujourd’hui ? Peut-être de savoir que chacun peut, grâce à un équipement qui tient dans sa poche, accéder à la quasi-totalité du savoir de l’humanité de façon quasi-immédiate. Mais sans doute davantage de constater qu’internet sert en grande partie pour échanger ses états d’âmes sur des sites sociaux, regarder des photos de chats ou écouter des chanteurs Coréens à la mode…

Vision excessive ? Critique facile ? Sans doute ! Mais elle a le mérite d’illustrer que nous sommes encore très loin d’avoir ne serait-ce qu’effleuré toutes les possibilités offertes par les réseaux de données. C’est du reste le cas de toutes les grandes innovations : elles se diffusent d’abord lors d’une phase de « substitution ».Dans cette phase, l’innovation se diffuse en remplaçant d’une façon plus efficace des technologies anciennes – c’est ainsi que l’éclairage électrique a remplacé la bougie, la voiture les calèches ou les métiers à tisser mécanique ont remplacé les tisserands. L’innovation permet alors de faire mieux ou plus vite ce qu’on faisait déjà avant, en « cannibalisant » des technologies moins adaptées – la fameuse « destruction créatrice » théorisée par Schumpeter.

Vient ensuite un temps « d’extension des possibles », dans lequel apparaissent de nouvelles possibilités impossibles à réaliser auparavant. C’est ainsi que les révolutions successives des transports ont bouleversé notre façon de produire – rendant possible, par exemple, la conception en Californie, la production en Chine à partir de composants venant d’Asie du Sud Est, et les ventes en France. Le développement des assurances publiques et privées a accompagné l’évolution de notre façon de vivre ensemble –la cellule familiale traditionnelle a évolué au fur et à mesure qu’apparaissaient d’autre moyens de de s’assureur face à la vieillesse, la maladie ou le chômage. La diversification des médias a changé notre relation au pouvoir politique, d’un monde « ORTF » dominé par une information descendante, à la multiplication des chaînes de radio ou de télévisions, comme des think tanks qui constituent autant de contrepouvoirs critiques.

Malgré les apparences, cette phase « d’extension des possibles » est encore balbutiante dans le domaine du numérique. Le « big data » (c’est-à-dire l’existence de bases de données gigantesques) et « l’internet des choses » (c’est-à-dire la possibilité pour les objets et les machines à communiquer entre eux et avec nous) nous annoncent en effet des évolutions sans précédents.

Dans le champ économique, l’internet industriel va permettre une accélération de la productivité : en plaçant sur les machines (moteurs d’avions, turbines électriques, …) des capteurs et de la puissance de calcul, nous les rendront plus rapides et plus efficaces. Une meilleure gestion de la puissance des moteurs permet déjà de réduire leur consommation.

Les centrales électriques pourront ajuster leur production plus finement à la demande et réduire ainsi les pertes : fournir rapidement de l’énergie en cas de besoins (souvent imprévisibles), arrêter la production quand la demande baisse (et économiser ainsi de l’énergie). L’imagerie médicale ira de plus en plus au-delà de la traditionnelle « radio » pour être numérique. Elle permettra de construire des modèles en trois dimensions pour améliorer les diagnostics, guider à distance le geste du chirurgien ou permettre d’imprimer en trois dimensions des prothèses sur mesure – pour remplacer une hanche, une dent, et peut-être un jour un cartilage, voir certains organes. Un mélange de capteurs et de systèmes experts permettra également d’optimiser l’utilisation des infrastructures : dans le domaine ferroviaire, ils permettront à la fois d’améliorer la sécurité et évitant tous les accidents liés à un défaut de coordination et d’augmenter le nombre de trains pouvant utiliser le réseau à un moment donné – tâche que l’ouverture à la concurrence du rail va rendre particulièrement critique. Dans le domaine automobile, nous disposerons d’automobiles– électriques ou au gaz – qui communiqueront avec les autres véhicules qui partagent la route avec nous ainsi qu’avec les panneaux de signalisation pour augmenter le trafic, raccourcir les trajets et éviter les accidents.

Dans le champ politique, nous n’avons probablement qu’effleurés les changements liés au « big data », notamment à cause du manque de données ! Notons d’abord les changements intervenus dernièrement, à commencer par le débat sur le « chiffrage des programmes ». Nés grâce au web. Sans internet, en effet, personne n’aurait eu la force de frappe permettant à la fois de poser des questions - les promesses faites dans les campagnes présidentielles sont-elles réalisables – et d’apporter des éléments de réponse. Débuté en 2007 par l’initiative d’un think tank – l’Institut de l’Entreprise – ce débat a conduit des millions de personnes à venir consulter les informations sur le chiffrage. Au point d’être largement imité cinq ans plus tard par d’autres think tanks, ainsi que les partis eux-mêmes, qui annexent désormais un budget à leur programme présidentiel – cas unique dans le monde ! Avec des conséquences heureuses : d’abord, plus aucun parti ne peut aborder la campagne présidentielle comme un « mirobolathon » consistant à aligner les promesses à chaque catégorie d’électeurs. Une cohérence s’impose sur le coût de la somme des promesses. C’est également l’existence d’une « feuille de route financière » permet, par exemple, au président François Hollande de pouvoir annoncer dès la première année des orientations fiscales pour 5 ans – une visibilité cruciale pour les investisseurs français et étrangers. Mais il reste encore beaucoup à faire. En effet, la rigueur sur les comptes ne servirait à rien si elle n’était pas accompagnée d’une plus grande rigueur sur la valeur ajoutée des politiques publiques. L’Europe dans son ensemble a encore des progrès à faire dans ce domaine : alors qu’elle dispose du service public le plus important du monde, pratiquement aucun des principaux efforts pour fournir des données sur la valeur de ces services ne vient d’Europe – qu’il s’agisse du classement de Shangai, de le mesure de l’efficacité de la réglementation de la Banque Mondiale, ou de la comparaison mondiale des systèmes éducatifs de l’OCDE. Autrement dit, la première étape du « big data » - l’existence de données – fait défaut. Ou plus précisément, nous disposons de données très détaillées sur les coûts, mais d’à-peu-près rien sur la valeur de l’action publique ! Le premier pas serait donc de développer ces mesures de valeur ajoutée des services essentiels : en quoi notre système de formation augmente les chances d’obtenir un emploi et répondent aux besoins des entreprises ? en quoi notre système éducatif atteint-il son objectif d’enseignement des savoirs essentiels et de donner à nos enfants les armes pour s’insérer dans la société – à commencer la confiance en eux-même ? en quoi notre système de santé répond aux besoins de santé ? en quoi notre système d’accompagnement des demandeurs d’emploi accélère-t-il le retour à l’emploi ? Dans aucun de ces domaines il n’existe de « big data » - au mieux des études ponctuelles ou des audits administratifs, et c’est là que se situe l’enjeu le plus important pour les années à venir.

Dans le domaine social, enfin, le « big data » recèle à la fois des opportunités et des menaces. Sans minimiser l’attention qui nécessite le second point, notre pays est probablement l’un des plus avancés en termes de contrôle des menaces – la protection des données individuelles est en Europe plus stricte qu’ailleurs, et en France plus stricte qu’en Europe. Les opportunités ont parfois été questionnées – certains voyant dans les adolescents qui tchattent devant leur ordinateur une négation des relations sociales. Le numérique, un mode mineur de relation ? A voir ! Les chercheurs qui se sont penchés sur le bonheur (par exemple : http://www2.warwick.ac.uk/fac/soc/economics/staff/academic/oswald/ijeclarkos.pdf) constatent que trois choses principales affectent le bonheur : la santé, l’emploi et la présence d’une âme sœur. Les deux premiers relèvent de services publics, ou font à minima l’objet d’interventions publiques significatives. Le troisième relève d’institutions variables selon le lieu et le temps : si les familles jouent un rôle dans de nombreux pays, l’école, l’université ou le travail sont chez nous le premier lieu de rencontre. Un seul pays dans le monde – Singapour – a choisi de confier cette tâche à un service public, véritable « Pôle Emploi des cœurs ». Pour tous les autres, les réseaux sociaux ou les sites de rencontre jouent un rôle croissant. Et si l’on sort des questions de cœur, beaucoup ont pu retrouver un ami perdu de vue ou démarrer une amitié grâce aux recommandations d’un site social. Et cette tendance est probablement appelée à se développer. Car c’est là que réside la promesse du « big data » dans le domaine social : explorer notre préférence ou nos choix, pour élargir nos horizons en nous faisant accéder à des possibilités nouvelles, et inaccessibles auparavant. L’un des plus anciens exemples dans ce domaine est Jester (http://eigentaste.berkeley.edu), l’outil de recommandation de blagues en ligne, qui se base sur les préférences des internautes, ainsi que sur vos appréciations pour vous proposer des blagues qui sont de plus en plus adaptées à votre sens de l’humour. Cette technique de « filtrage collaboratif » a pour le moment surtout été utilisée dans le domaine commercial, et de façon limitée – par exemple pour vous suggérer des livres correspondant à votre style. Elle pourrait nous ouvrir des esp aces beaucoup plus larges – nous faire par exemple découvrir des styles de musiques correspondant à nos lectures, des vacances en ligne avec nos restaurants favoris, ou des personnes qui, ailleurs dans le monde, ont ri aux mêmes films. Les réseaux sociaux n’ont fait qu’effleurer ces possibilités…

Le « big data » est l’expression à la mode pour exprimer une idée finalement simple : jusqu’à présent, nous avons surtout utilisé internet pour faire plus rapidement ce que nous faisions déjà avant. Ca faisant, nous accumulons des quantités considérables de données de toutes natures. A l’avenir, l’analyse automatique de ces données nous permettra d’identifier des aiguilles dans la botte de foin des informations disponibles. Elle ouvrira de nouveaux espaces économiques qui permettront plus de croissance en utilisant mieux les équipements industriels. Elle révolutionnera également la politique en permettant un meilleur contrôle des citoyens sur leur vie et sur ceux auxquels ils la confient. Elle renforcera enfin nos relations, en nous ouvrant des espaces de découverte supplémentaires. Nous pas en noyant les relations humaines dans les « eaux glacées » d’échanges numériques, mais au contraire en nous offrant des passerelles avec les quelques personnes qui, parmi des milliards d’internautes, partageront avec nous passions ou émerveillements.

Vincent Champain,
Economiste et président de l’Observatoire du Long Terme