Intégrer la gestion d'identité dans la gestion du cycle de vie de l'information (ILM)
Voici de nouveau Bill Vass et sa lettre mensuelle... la dernière en tant que rédacteur en chef ! J'ai en effet à la fois le regret et la joie de vous annoncer que je viens d'accepter le poste de Chief Operation Officer de Sun Federal, Inc. C'est avec confiance que je remets mes responsabilités de CIO entre les mains on ne peut plus compétentes de Bob Worall, précédemment Vice President Information Systems Governance de Sun.
Bob Worrall est un dirigeant d'une grande valeur humaine, un stratège éminent et un homme de terrain des plus expérimentés. À une longue suite de distinctions récoltées au fil de sa longue carrière, Bob vient d'ajouter le « Ones to Watch Award » décerné par CIO Magazine. Vous trouverez un échantillon de ses talents de visionnaire dans le Sun Inner Circle de juin, où il nous livrait en tant que rédacteur invité un article intitulé « Apprivoiser la réglementation Sarbanes-Oxley : le nouveau défi informatique ».
Mais comme on dit, les hommes passent et les grands projets demeurent. Je sais que Bob Worrall saura mener à bien le projet que je m'étais fixé dans ces colonnes : rendre compte des toutes dernières tendances du marché informatique et des grandes innovations technologiques développées chez Sun.
Pour cette dernière lettre mensuelle dans Sun Inner Circle, j'ai choisi de vous parler de la gestion du cycle de vie de l'information (ILM) autrement dit : le stockage. Que ce soit en tant que directeur technique au Ministère Américain de la Défense ou responsable du développement ou de la production informatique chez Sun et dans d'autres entreprises, j'ai toujours été frappé par l'importance du stockage. Pour les développeurs d'applications destinées à un très grand nombre d'utilisateurs, il est primordial d'optimiser le stockage afin d'accélérer les accès et les mises à jour des données de même que la configuration de l'environnement de stockage a un impact déterminant sur la disponibilité du service. Le fait est qu'un stockage inefficace se paye toujours très cher en termes de performance. Quant aux responsables de la production, leurs missions de consolidation, de réduction des coûts, de sauvegarde, de réplication et de continuité d'activité les obligent à prendre très sérieusement en considération la question du stockage. Sans oublier qu'avec l'adoption généralisée de la gestion du cycle de vie de l'information (ou ILM, pour Information Lifecycle Management), les priorités de ces deux groupes d'acteurs sont appelées à évoluer et à se recombiner de multiples façons.
Accaparé par la gestion du changement et la stratégie informatique globale, le DSI ne perçoit généralement pas le stockage comme une priorité de chaque instant. Et pourtant... Avec la généralisation des infrastructures informatiques virtualisées et l'importance toujours croissante de la sécurité des données comme de la conformité réglementaire, le DSI n'a désormais plus d'autre choix que de se focaliser sur l'intégralité du cycle de vie de l'information. En un mot, le DSI est devenu le gardien de l'information de l'entreprise, responsable en tant que tel de toutes ses pratiques en matière d'archivage, d'accès, de protection et de sécurisation des données.
Il faut bien reconnaître que, pour la plupart des directeurs de systèmes d'information, le stockage ne devient un sujet d'intérêt qu'en présence de l'un de ces trois scénarios :
- Le système de stockage connaît un dysfonctionnement, dont le DSI doit identifier la cause
- Le DSI est appelé à rationaliser le processus de stockage dans le cadre d'un effort de réduction des coûts
- Suite à des demandes d'information de la part d'autorités judiciaires ou dans le cadre d'un projet de mise en conformité réglementaire, l'organisation est amenée à s'intéresser aux problèmes d'accès aux données stockées et de contrôle des flux de données
En dehors de ces cas de force majeure, le destin des systèmes de gestion de données sera plutôt confié à un spécialiste du stockage.
En faisant provisoirement abstraction du troisième scénario, on constate que les deux premiers relèvent essentiellement de considérations budgétaires : soit l'entreprise n'a pas suffisamment investi de temps et d'argent dans son système de stockage et celui-ci est défaillant, soit l'organisation informatique s'est montrée trop dépensière et cherche à présent un moyen de comprimer ses coûts sans réduire les capacités d'accès. Il s'agit naturellement dans les deux cas de préoccupations parfaitement réelles et légitimes.
En quête du compromis idéal entre coût de stockage et disponibilité des données, de nombreuses entreprises ont opté pour une stratégie de gestion du cycle de vie de l'information (ILM). En d'autres termes, elles ont choisi de faire migrer leurs données les plus anciennes vers des systèmes de stockage moins onéreux (et moins rapides d'accès) à un moment prédéterminé de leur cycle de vie.
Des lacunes criantes dans le domaine de la sécurité des données
Si le bien-fondé et la nécessité pratique de l'ILM ne prêtent pas à discussion, les solutions actuelles restent encore trop rudimentaires, car elles font l'impasse sur deux aspects fondamentaux du stockage : la sécurité des données et la conformité réglementaire. Témoin le ministère américain des anciens combattants (DVA), qui vient de faire les frais d'une contre-publicité et d'un préjudice financier d'une ampleur insoupçonnée pour s'être montré incapable de protéger les données personnelles de quelque 26,5 millions d'anciens combattants et de leurs épouses.
Mais le DVA n'est naturellement pas seul dans ce cas : Hotels.com, Hewlett-Packard et Ohio University, après bien d'autres entreprises, ont récemment été prises dans la tourmente pour avoir négligé leur devoir de protection des données personnelles. Or, tous ces accidents industriels ont un point important en commun : ils résultent d'une déficience du système de stockage de données. Et en dernier ressort, c'est le DSI qui est responsable de l'information de l'entreprise sous tous ses aspects y compris les processus d'accès, de traitement, de téléchargement, de partage et de sauvegarde des données.
De même, la question de la conformité réglementaire est tout sauf négligeable. Supposez que, dans le cadre d'un audit de gestion, l'entreprise doive produire la totalité des e-mails, feuilles de calcul et autres documents relatifs à un contrôle financier réalisé il y a cinq ans. Quelle que soit l'efficacité de la stratégie ILM en place, une telle tâche implique parfois d'accéder à des éléments archivés dans de multiples couches de l'infrastructure de stockage, si bien que l'extraction des données nécessitera l'exploration à grands frais de plusieurs volumes de disques ou bibliothèques de bandes. Ici encore, le coût en temps et en argent peut s'avérer disproportionné.
Pour être plus qu'un simple économiseur de ressources, l'ILM doit également s'attaquer à la protection des données et à la conformité réglementaire. Ce qui suppose d'introduire la gestion d'identité dans les systèmes de données. À terme, l'ILM devra être capable de rapprocher, d'une part, les identités des personnes, organisations et systèmes accédant ou créant des données et, d'autre part, les données stockées proprement dites. De la sorte, il deviendra possible d'attribuer des droits d'accès et d'appliquer des mécanismes de protection des données en se fondant sur le rôle de chaque intervenant, ainsi que de cibler les audits et les extractions de données sur des utilisateurs déterminés.
Mais, comme à mon habitude, j'anticipe sur ma conclusion.
La gestion du cycle de vie de l'information aujourd'hui
Nul n'ignore que l'entreprise actuelle génère beaucoup plus de données qu'elle n'est capable d'en stocker. L'ILM s'appuie sur le constat que la valeur des données évolue dans le temps. Ainsi, une feuille de calcul Excel ou OpenOffice présentera une valeur maximale au moment de sa création, perdant déjà une partie de son intérêt en une semaine ou un mois, pour parfois se révéler totalement périmée au bout d'un an. Par conséquent, la question qui se pose aux organisations est de savoir à quel moment et à quel coût il devient pertinent de transférer des données vers un système moins onéreux mais aussi moins accessible. L'ILM a précisément pour objet de les aider à résoudre ce dilemme.
Il en va de même pour les données ERP, mais les opérations de traitement et la virtualisation des infrastructures engendrent des architectures de stockage plus complexes. Quant aux bases de données relationnelles, leur stockage implique de fréquentes opérations de gestion, d'archivage et d'optimisation (tuning), sans lesquelles le SGBD risque de « se gripper ». Nombre de systèmes exigent en outre une réplication hors site permettant la reprise après sinistre, ainsi qu'une mise en cache des index pour des besoins de performance.
Dans son acception traditionnelle, l'ILM aborde le stockage selon une approche hiérarchisée en fonction de la valeur des données et des besoins d'accès. Ce modèle fait généralement intervenir trois catégories de support de stockage : en ligne, intermédiaire (near-line) et hors ligne. Une infrastructure de stockage hiérarchisée pourra donc se présenter comme suit :
En ligne : Stockage de premier niveau, sur disque, destiné aux applications prioritaires. Les données faisant l'objet d'accès fréquents, les performances et l'accessibilité sont déterminantes. La technologie de disques Fibre Channel est ici prédominante, avec généralement des disques en rotation permanente pour maximiser la vitesse d'accès et la disponibilité des données. Les données sont le plus souvent copiées en mémoire cache de façon à maximiser les performances. Le stockage en ligne s'avère par conséquent complexe et requiert une surveillance constante, ce qui le rend particulièrement onéreux.
Intermédiaire : Stockage secondaire réservé aux données qui, bien que faisant l'objet d'accès peu fréquents, doivent néanmoins demeurer rapidement disponibles. Le stockage intermédiaire repose généralement sur le support disque, la technologie SATA étant ici très répandue en raison de son faible coût au mégaoctet. Les disques ne sont généralement pas en rotation constante et les données sont stockées sont forme compressée. Les systèmes de bandes les plus performants, de même que les systèmes de stockage optique, peuvent parfois offrir des alternatives intéressantes pour le stockage intermédiaire.
Hors ligne : Stockage tertiaire pour la sauvegarde et l'archivage à long terme. Les données sont stockées à moindre coût, mais plus difficiles d'accès. Le stockage hors ligne utilise généralement des bibliothèques de bandes, mais peut aussi bien s'effectuer sur une pile de supports optiques (cédéroms ou DVD).
Outre la résolution des problèmes de hiérarchisation des données, les stratégies ILM classiques gèrent certains aspects de la criticité des données en particulier la périodicité des sauvegardes et le niveau de redondance requis. Par exemple, la stratégie ILM pourra spécifier qu'un fichier de journalisation n'a généralement pas besoin de redondance RAID ni de sauvegarde, mais qu'il doit en revanche être rapide d'accès et stocké en ligne.
La stratégie ILM pourra également prévoir que les données des applications soient mises en miroir sur un disque RAID et copiées en mémoire cache et non simplement sauvegardées, ce qui laisse subsister le risque de perdre une journée de travail sur les données en cas de sinistre. À l'heure actuelle, la gestion du cycle de vie de l'information peut contribuer à structurer les pratiques en matière de sauvegarde, de mise en miroir et de stockage RAID.
Il est cependant un phénomène dont l'ILM, dans sa version actuelle, ne permet pas de rendre compte : le fait que toutes les données ne suivent pas un chemin de dégradation régulier. Si la valeur des données est susceptible d'évoluer à la baisse mais aussi à la hausse au fil du temps, comment faire pour anticiper sur ces changements ? Autrement dit, comment classifier les données sur la base de l'utilisation qui en est réellement faite ? Répondre à ces questions suppose de renoncer à traiter toutes les données comme si elles étaient identiques, et de s'intéresser plutôt aux utilisateurs qui possèdent les données et ceux qui y ont accès.
La voie d'avenir : l'intégration de la gestion d'identité dans l'ILM
Les stratégies ILM actuelles font entièrement reposer la hiérarchisation du stockage sur les politiques de conservation des données. Dès lors qu'une donnée atteint une certaine durée d'existence, elle est transférée vers un sous-système plus économique et moins accessible. Mais l'érosion des données n'emprunte pas toujours un chemin aussi linéaire. À travers sa vision d'une stratégie ILM intégrant la gestion d'identité, Sun propose donc d'examiner les cycles de vie de l'information au niveau de chaque utilisateur de façon à piloter les opérations de stockage et de gestion des données d'une façon réellement pertinente pour tous ceux qui ont besoin de stocker et d'extraire des données. Comme son nom l'indique, l'ILM avec gestion d'identité intégrée recherche une synergie entre les fonctionnalités de gestion d'identité et de gestion du cycle de vie de l'information.
À titre d'illustration, reprenons ici l'exemple du ministère américain des anciens combattants (DVA). Après le vol de plus de 26 millions de fiches personnelles, la Maison Blanche et d'autres acteurs ont appelé à une généralisation de la cryptographie pour renforcer la sécurité des données. Ce vibrant appel aux armes ne tenait cependant pas compte du fait que les données n'auraient de toute façon jamais dû être téléchargées sur un ordinateur portable : en cas de stockage statique sur un portable, il est en effet toujours possible de casser le code de chiffrement dès lors que l'on dispose du temps nécessaire.
Dans l'idéal, une politique ILM intégrant la gestion d'identité aurait autorisé l'employé à accéder aux données, à les visualiser et à interagir avec elles, mais pas à les télécharger sur un support extérieur au système de tenue des dossiers. Les entreprises ont aujourd'hui besoin de pouvoir contrôler les interactions dans le temps entre utilisateurs et données, ce qui suppose de savoir qui est autorisé à accéder à quelles données et, suivant son rôle, à quel moment et de quelle façon il peut interagir avec ces données.
Renforcer la conformité légale et réglementaire
De même, la conformité légale et réglementaire a tout à gagner de l'intégration de la gestion d'identité dans l'ILM. Supposons par exemple que, sur requête d'un tribunal, une entreprise doive produire la totalité des données manipulées par l'un de ses employés au cours des cinq années précédentes . À l'heure actuelle , il faudrait d'abord retrouver le lieu de stockage de ces données, puis identifier les systèmes et supports de stockage appropriés, et enfin restaurer des volumes entiers de stockage sur bande... pour n'en récupérer qu'une infime fraction.
Inutile de préciser qu'un tel processus ne saurait être que manuel, et donc très coûteux. Mais avec un système ILM intégrant la gestion d'identité, il serait possible d'adresser à l'infrastructure de stockage une requête du type : Sortez-moi toutes les données traitées par Bill Vass (e-mails, correspondances et documents) au cours des cinq dernières années. Et le tour serait joué !
Bien que l'ILM avec gestion d'identité intégrée n'en soit qu'à ses balbutiements, et que nombre de détails techniques restent encore à préciser, nous entrevoyons d'ores et déjà clairement la nécessité de déployer une couche d'abstraction au-dessus du champ traditionnel de la gestion du cycle de vie de l'information. Cette couche accueillerait des méta-balises indiquant l'identité du créateur des données, leur date de création, le niveau de chiffrement requis, les aspects réglementaires mis en jeu et tous autres facteurs liés aux impératifs de protection des données et de conformité. Un méta-répertoire permettrait alors aux utilisateurs d'accéder aux données stockées dans les limites définies par leur identité, leur rôle et leurs droits spécifiques.
Il importe également d'insister sur le fait que, dans le contexte de l'ILM avec gestion d'identité intégrée, les utilisateurs et les entreprises deviendront plus que jamais parties prenantes du processus de classification des données et de leurs modalités de stockage. Les exemples précédemment cités de vol de données confidentielles ont d'ores et déjà sensibilisé les entreprises quant à l'importance d'impliquer les utilisateurs finaux et les spécialistes métier dans les questions de classification et de stockage de données. Ces prises de position pèchent toutefois par leur caractère exclusivement réactif, alors que seule une implication proactive des utilisateurs et des dirigeants permettrait d'écarter la possibilité même de tels accidents.
Mais encore une fois, n'anticipons pas.
Comment Sun évolue vers l'ILM avec gestion d'identité intégrée
Sun dispose aujourd'hui d'une offre de stockage complète incluant des solutions logicielles ILM haut de gamme comme Enterprise Storage Manager et Storage Archive Manager, mais aussi des équipements sous-jacents permettant de couvrir toute la gamme des besoins de stockage depuis le système disque d'entreprise jusqu'au serveur de bandes.
Sun dispose par ailleurs d'une suite de gestion d'identité complète comprenant les logiciels Identity Manager, Access Manager et Identity Auditor. Nous travaillons actuellement à extraire l'information capturée dans cette suite de gestion d'identité pour alimenter les systèmes de stockage, et inversement, à puiser l'information contenue dans les systèmes de stockage pour approvisionner la suite de gestion d'identité. À ce jour, ces fonctionnalités sont essentiellement proposées sous la forme de prestations de services mais, de plus en plus, nous cherchons à les incorporer dans nos produits d'ILM et de gestion d'identité.
| |
Découvrez les solutions ILM et de gestion d'identité de Sun.
|
Implémentation concrète de l'intégration ILM-gestion d'identité
Voyons à travers quelques exemples comment l'entreprise pourrait bénéficier d'une intégration plus étroite entre les solutions d'ILM et de gestion d'identité de Sun. Nombre d'entreprises ont déjà opté pour une gestion automatisée des droits d'accès aux systèmes et aux applications, mais sans avoir la possibilité d'en faire autant pour le stockage. Et si les bases de données couvrent parfaitement les besoins relatifs aux données structurées, il n'existe pas d'outil de gestion équivalent pour la gestion des données non structurées (e-mails et autres documents). Autrement dit, rien ne garantit que les données non structurées bénéficieront de procédures de stockage bien établies, dans la mesure où cet aspect repose sur des processus manuels.
Il serait donc souhaitable qu'à chaque intégration d'une nouvelle recrue, la configuration des ressources de stockage soit elle aussi automatisée. Le nouvel utilisateur se verrait ainsi attribuer des droits d'accès aux répertoires partagés précisément adaptés à son rôle, tandis que le système de stockage allouerait automatiquement les ressources requises pour ses fichiers personnels.
Le système de stockage définirait ensuite des mécanismes de protection des données paramétrés suivant le rôle de l'utilisateur. Par exemple, les e-mails d'un simple employé pourraient être archivés au bout de 5 jours puis conservés pendant 30 jours, tandis que ceux d'un directeur seraient conservés 6 mois durant délai qui pourrait être porté à sept ans pour un vice-président.
En d'autres termes, le paramétrage de l'espace de stockage, des droits d'accès et des mécanismes de protection des données devra se fonder sur l'identité de l'utilisateur ce qui signifie également qu'il doit être suffisamment souple pour évoluer avec le rôle de celui-ci. Par exemple, si une responsable est promue au poste de directrice, il deviendra peut-être nécessaire de chiffrer automatiquement ses e-mails.
De même, lorsqu'un employé quitte l'entreprise, le système de stockage devrait automatiquement archiver et protéger ses fichiers, dans l'éventualité où ces pièces seraient requises dans le cadre d'une procédure juridique. Dans ces différents scénarios, c'est le système de gestion d'identité qui est amené à faire passer des informations concernant les utilisateurs aux systèmes de stockage.
À l'inverse, l'intégration de l'ILM avec une suite de gestion d'identité permettra à cette dernière d'extraire des informations du système de stockage. Les dispositifs de stockage recèlent d'immenses quantités d'information sur les utilisateurs et leurs profils d'accès. Par exemple, l'entreprise pourra soumettre ces informations à la solution Identity Auditor afin de s'assurer que tous les accès aux données respectent les conditions spécifiées en termes de rôle utilisateur et de protection des données.
Intégration de l'ILM et de la gestion d'identité : la stratégie de Sun
Afin de migrer vers une pleine intégration de la gestion d'identité dans l'ILM, Sun a opté pour une stratégie de type évolutionniste. Certaines fonctionnalités de gestion d'identité sont dès aujourd'hui incorporées dans nos produits de stockage comme par exemple la connexion unique aux systèmes de stockage, le paramétrage automatique des capacités de stockage et la gestion automatique des droits d'accès en fonction de l'identité utilisateur. Au chapitre des initiatives à court terme, Sun a également plusieurs fers au feu :
- Permettre à Identity Auditor d'analyser les données fournies par des systèmes de stockage intelligents tels que le système d'archivage réglementaire Sun StorageTek 5310, de façon à identifier toute violation de conformité ou faille de sécurité potentielle.
- Intégrer étroitement les produits de gestion d'identité avec la solution Enterprise Storage Manager, de façon à transmettre automatiquement les droits d'accès dans un sens (provisioning) ,et à faciliter la remontée des informations vers Identity Auditor, dans l'autre sens.
- Évoluer vers un modèle de méta-balisage des données permettant la capture d'informations sur l'identité, la protection des données et la conformité, à travers une intégration encore plus étroite avec Storage Access Manager.
À l'avenir, Sun renforcera encore son infrastructure d'ILM avec gestion d'identité intégrée en lui ajoutant des capacités de gestion fédérée des politiques et de stockage orienté services. La gestion fédérée des politiques assurera la cohérence des règles de conformité réglementaire et des politiques d'administration du stockage à l'échelle de tous les systèmes de stockage de l'entreprise. Le stockage orienté services mettra quant à lui une bibliothèque de services logiciels à la disposition des différentes applications de stockage, permettant ainsi le déploiement d'une véritable fonctionnalité de stockage partagé. Mais cela demandera encore un peu de patience...
En conclusion
L'ILM est d'ores et déjà utilisé dans de nombreuses entreprises pour optimiser le rapport entre coût du stockage et accessibilité des données. Mais vu l'importance croissance des impératifs de protection des données et de conformité réglementaire, une solution ILM se contentant d'appliquer les politiques de conservation des données n'est plus suffisante.
Comme la valeur des données ne s'érode pas toujours suivant une courbe prévisible, le système de stockage ne se conçoit plus sans gestion d'identité. L'ILM avec gestion d'identité intégrée propose donc d'examiner les cycles de vie de l'information au niveau de chaque utilisateur, de façon à piloter les opérations de stockage et de gestion des données d'une façon réellement pertinente pour tous ceux qui ont besoin de stocker et d'extraire des données.
Pour résoudre de façon économiquement viable les nouveaux défis posés par la sécurité des données et la conformité réglementaire, l'entreprise de demain ne pourra faire autrement que d'intégrer les fonctionnalités de gestion d'identité et de gestion du cycle de vie de l'information.
Bill Vass
CIO
Sun Microsystems, Inc.
cio@sun.com
|