Cloud Computing : Confusion et polémique

L’intérêt croissant que le terme de Cloud computing suscite sur Google semble révélateur de l’importance de ce phénomène. Que l’on pense qu’il s’agisse d’une mode, ou d’un changement profond des modèles informatique l’intérêt que le Cloud suscite depuis près de deux ans (représenté ci-dessous) indique clairement qu’il est indispensable de s’y ‘intéresser, ne serait-ce que pour en réfuter l’intérêt.

On y voit que les recherches sont corrélées avec la décroissance de celle concernant le grid computing et qu’elles suivent l’augmentation des requêtes concernant la virtualisation.

Bien entendu les intervenants historiques de l’informatique  (Oracle, HP…)  minimisent le côté novateur du Cloud (voire en discute carrément l’existence)  en prétendant ne pas voir de nouveauté dans ces concepts. “Un buzz marketing” sur d’anciennes technologies déjà en oeuvre pour les uns, de multiples définitions sans cohérence pour les autres. Rien d’étonnant me direz-vous, surtout lorsqu’on voit les constructeurs à la peine pour suivre cette nouvelle tendance. En effet, ces derniers tentent toujours de vendre des baies de stockage, des serveurs surpuissant ou des logiciels. dont les  coûts de licences sont calculés par core , a des prix élevés. Parallèlement  de nouveaux entrants se basent sur des paradigmes assez différents des éditeurs et constructeurs actuels, profitant des matériels bon marchés et des logiciels open sources gratuits.

La fin des modèles traditionnels : Pourquoi ?

Cette opposition tant technologique que culturelle semble marquer la fin des modèles traditionnels (ou tout au moins une évolution très notable) qui régissent l’informatique depuis l’avènement des plateforme open (*NIX, windows) alors que les plateformes mainframes régnaient sans partage sur l’informatique. Pour illustrer ce propos, prenons l’exemple du stockage de données, l’un des domaines de prédilection du cloud.

Rappelons l’image courante dans ce domaine : “Chaque année, sont produites autant de données que le cumul des données produites jusqu’à l’année précédente“.  Plus actuellement, en 2008 l’IDC affirme qu’en 2009 40 exabytes de données seront produites. On constate que ces données sont de plus en plus non structurées. Dématérialisation et explosions du multimédia poussent au stockage de vidéo, audio et autre PDF.  Par ailleurs, les exigences des départements commerciaux renforcent également les notions de tracking et de profiling des utilisateurs, afin d’améliorer les performances des différents produits commerciaux. Comment dans ces conditions recueillir, stocker et gérer ces données.

En amont de ce problème de gestion se pose celui des taux transactionnels dans les environnements sécurisés. En effet, dans un contexte mutlicanal, comment garantir le maintien de ces taux transactionnels dans des environnements devant prendre en compte des exigences de hautes disponibilités, de Plan de reprise d’activité… Les réplications standards sont de plus en plus compliquées à mettre en œuvre, exploiter et à garder synchrone (ou tout simplement a en garantir un déphasage minimum). Les problématiques de temps de latences sont par ailleurs elles aussi de plus en plus dures à contenir.

Une fois les données recueillies il faut le gérer. Les gérer oui, parce que les stocker n’est pas suffisant. Vos données doivent être exploitées, retraitées, archivées pour leur donner du sens. Le problème est que ces workflows doivent être de plus en plus rapides (tous les 60 jours sont produits 7 exabytes), alors même que les temps de traitement nécessaires à ces volumétries explosent.

Enfin, parallèlement aux temps de traitement, les coûts de gestion et de stockage de ces données deviennent peu à peu des freins ; certains projet n’étant tout simplement plus rentables du fait des contraintes exposées ci-dessus.

Toutes ces évolutions forcent les entreprises à trouver des solutions quitte à s’éloigner des chemins traditionnels

La fin des modèles traditionnels : Comment ?

Si les offres des constructeurs ne semblent que peu évoluer sur le marché (de grosses baies, avec beaucoup de cache…) de nouveaux entrants sur le marché du stockage font leur apparition, Amazon à leur tête. Amazon vous propose tout simplement de ne pas conserver vos données ou vos traitements dans votre propre SI mais de les lui confier (avec les clauses de confidentialités adaptées) et d’en disposer, dès lors,  via internet.  Le tout a des prix ultra compétitifs !

Cette offre ne fait que repousser la question : comment ces prix peuvent ils être atteints ? C’est qu’Amazon se base sur des technologies fort différentes, tout comme un Google, un Yahoo! ou un Facebook. Le paradigme de départ est totalement différent. On ne parle plus ici de concentrer les données dans des baie hyper protégées et de faire appel à des serveur très haut de gamme pour exécuter les traitements mais bien de répartir données et traitements sur un trés grand nombre de machines d’entrée de gamme (commodity hardware). Cela assure tant la haute disponibilité et que de très bon temps de réponse, le tout à des couts largement en baisse (serveurs très standards, disques SATA, et surtout, économies d’échelles, les commandes auprès des constructeurs étant titanesques), et une scalabilité remarquable. Parce qu’en fin de compte c’est de cela qu’il s’agit : répondre de manière aussi linéaire que possible a la charge, quel que soit le volume de données le tout pour un coût aussi réduit que possible.

En regardant dans le passé de ces géants internet, on se rend compte que tous ont commencé par des offres standard de type LAMP, mais que, la charge augmentant ils ont du développer leurs propres outils pour faire face (en se basant sur des projets, et donc des technologies et protocoles, open source et gratuits). Certains  n’ont publié que des white paper sur leur manière de gérer cette charge (c’est le cas de Google : Big Table et GFS) alors que d’autres ont carrément créé ou contribué très fortement à des initiatives open source et grauite (Facebook : Thrift , Yahoo! : Hadoop …)

Il se développe depuis quelques années des offres de virtualisation (Xen), de cache (memcached développé pour LiveJournal.com) , de File Systems distribués (Caringo, MogileFS, GlusterFS, HDFS) dont la vocation n’est plus de concentrer les données mais bien au contraire de les répartir et de les répliquer sur des matériels a bas prix (commodity hardware), afin d’en exploiter au mieux les ressources.

Une rupture technologique mais surtout culturelle est bien en train d’avoir lieu quoi que puissent en dire certains géants.

Attention, peinture fraîche

Etrangement les offres d’un Amazon semblent elles assez au point. Depuis Janvier 2008, d’ailleurs, la bande passante utilisée pour les web service d’Amazon (AWS, les offres de cloud) est supérieure à la bande passante utilisée par le reste des sites web Amazon. Cela indique le nombre de leur client augmente très rapidement et que les données stockées par eux explosent. On est donc passé de la commercialisation de capacité inutilisée a un véritable business, qui , pour avoir rencontré les personnes d’Amazon semble être organisé avec une rigueur martiale. Et la, au contraire, si les noms des clients sont assez durs à avoir (on le comprend aisément) Amazon affiche néanmoins des références solides (NASDAQ, Wall Street Journal, …), et le recul est certains, ces offres étant la base du business d’Amazon depuis un moment déjà.

Alors certes les constructeurs tendent a se rapprocher de ce modèle, mais leurs offres commerciales sont-elles encore adaptées. Je ne parle pas seulement des technologies qui sortent de leurs laboratoires (pas de soucis pour ces dernières qui sont issues en droite ligne des technologies open source qui font la gloire des géants internet) mais surtout des offres commerciales avancées par leur commerciaux ? Assez étrangement, malgré toutes les annonces faites par les constructeurs majeurs, sur l’importance du Cloud et de ses implications, ces commerciaux tardent toujours à proposer des solutions « modernes », ils se font même un peu prier. On les comprend ces offres paraissent bien récentes et « pas encore sèche ». Pas ou peu de recul, très peu de clients et un supports dont la qualité semble faible, tant l’évangélisation dans ces société même semble en retard.

L’intérêt croissant que le terme de Cloud computing suscite sur Google semble révélateur de l’importance de ce phénomène. Que l’on pense qu’il s’agisse d’une mode, ou d’un changement profond des modèles informatique l’intérêt que le Cloud suscite depuis près de deux ans (représenté ci-dessous) indique clairement qu’il est indispensable de s’y intéresser, ne serait-ce que pour en réfuter l’intérêt.

On y voit que les recherches sont corrélées avec la décroissance de celle concernant le grid computing et qu’elles suivent l’augmentation des requêtes concernant la virtualisation.

Bien entendu les intervenants historiques de l’informatique  (Oracle, HP…)  minimisent le côté novateur du Cloud (voire en discute carrément l’existence)  en prétendant ne pas voir de nouveauté dans ces concepts. “Un buzz marketing” sur d’anciennes technologies déjà en oeuvre pour les uns, de multiples définitions sans cohérence pour les autres. Rien d’étonnant me direz-vous, surtout lorsqu’on voit les constructeurs à la peine pour suivre cette nouvelle tendance. En effet, ces derniers tentent toujours de vendre des baies de stockage, des serveurs surpuissant ou des logiciels. dont les  coûts de licences sont calculés par core , a des prix élevés. Parallèlement  de nouveaux entrants se basent sur des paradigmes assez différents des éditeurs et constructeurs actuels, profitant des matériels bon marchés et des logiciels open sources gratuits.

La fin des modèles traditionnels : Pourquoi

Cette opposition tant technologique que culturelle semble marquer la fin des modèles traditionnels (ou tout au moins une évolution très notable) qui régissent l’informatique depuis l’avènement des plateforme open (*NIX, windows) alors que les plateformes mainframes régnaient sans partage sur l’informatique. Pour illustrer ce propos, prenons l’exemple du stockage de données, l’un des domaines de prédilection du cloud.

Rappelons l’image courante dans ce domaine : “chaque année, on produit autant données que le cumul des données produites jusqu’à l’année précédente“.  Plus actuellement, en 2008 l’IDC affirme qu’en 2009 40 exabytes de données seront produites. On constate que ces données sont de plus en plus non structurées. Dématérialisation et explosions du multimédia poussent au stockage de vidéo, audio et autre PDF.  Par ailleurs, les exigences des départements commerciaux renforcent également les notions de tracking et de profiling des utilisateurs, afin d’améliorer les performances des différents produits commerciaux. Comment dans ces conditions recueillir, stocket et gérer ces données.

En amont de ce problème de gestion se pose celui des taux transactionnels dans les environnements sécurisés. En effet, dans un contexte mutlicanal, comment garantir le maintien de ces taux transactionnels dans des environnements devant prendre en compte des exigences de hautes disponibilités, de Plan de reprise d’activité… Les réplications standards sont de plus en plus compliquées à mettre en oeuvre, exploiter et à garder synchrone (ou tout simplement a en garantir un déphasage minimum). Les problématiques de temps de latences sont par ailleurs elles aussi de plus en plus dures à contenir.

Une fois les données recueillies il faut le gérer. Les gérer oui, parce que les stocker n’est pas suffisant. Vos données doivent être exploitées, retraitées, archivées pour leur donner du sens. Le problème est que ces workflows doivent être de plus en plus rapides (tous les 60 jours sont produits 7 exabytes), alors même que les temps de traitement nécessaires à ces volumétries explosent.

Enfin, parallèlement aux temps de traitement, les coûts de gestion et de stockage de ces données deviennent peu à peu des freins ; certains projet n’étant tout simplement plus rentables du fait des contraintes exposées ci-dessus.

Toutes ces évolutions forcent les entreprises à trouver des solutions quitte à s’éloigner des chemins traditionnels

La fin des modèles traditionnels : Comment

Si les offres des constructeurs ne semblent que peu évoluer sur le marché (de grosses baies, avec beaucoup de cache…) de nouveaux entrants sur le marché du stockage font leur apparition,Amazon S3 à leur tête. Amazon vous propose tout simplement de ne pas conserver vos données dans votre propre SI mais de les lui confier (avec les clauses de confidentialités adaptées) et d’en disposer, dès lors, depuis ses infrastructures. Le tout a des prix très compétitifs.

Cette offre ne fait que repousser la question : comment ces prix peuvent ils être atteint ? C’est qu’Amazon se base sur des technologies fort différentes. Tout comme un Google, un yahoo! Ou un Facebook, le paradigme est totalement différent. Il se développe des offres de File Systems distribués (Caringo, MogileFS, GlusterFS, HDFS) dont la vocation n’est plus dorénavant de concentrer les données dans une baie hyper protégée mais bien au contraire de les répartir et de les répliquer sur des matériels a bas prix (commodity hardware). Cela assure tant la haute disponibilité et que de très bon temps de réponse, le tout sur du matériel bas de gamme (disques SATA 7.2KRPM), et une scalabilité remarquable. Parce qu’en fin de compte c’est de cela qu’il s’agit : répondre de manière aussi linéaire que possible a la charge, quel que soit le volume de données le tout pour un coût aussi réduit que possible.

On constate bien qu’il s’agit de deux visions assez différentes du stockage de données. Une rupture technologique mais surtout culturelle est en train d’avoir lieu.

Attention, peinture fraîche

Alors certes les constructeurs tendent a se rapprocher de ce modèle, mais leurs offres commerciales sont elles encore adaptées. Je ne parle pas seulement des technologies qui sortent de le laboratoires (pas de soucis pour ces dernières qui sont issues en droite ligne des technologies open source qui font la gloire des mastodontes tels que Google, Yahoo! and co) mais surtout des offres commerciales avancées par leur commerciaux ?
Assez étrangement, malgré toutes les annonces faites par les constructeurs majeurs, sur l’importance du Cloud et de ses implications, ces commerciaux de ces géants tardent toujours à proposer des solutions « modernes », ils se font même un peu prier. On les comprend ces offres paraissent bien récentes et « pas encore sèche ».

Etrangement les offres d’un Amazon semblent elles assez au point. Depuis Janvier 2008, d’ailleurs, la bande passante utilisée pour les web service d’Amazon (AWS, les offres de cloud) est supérieure à la bande passante utilisée par le reste des sites web Amazon. Cela indique le nombre de leur client augmente très rapidement et que les données stockées par eux explosent. On est donc passé de la commercialisation de capacité innutilisée a un véritable business, qui , pour avoir rencontré les personnes d’Amazon semble être organisé avec une rigueur martiale.

Ces articles peuvent vous interesser

Post a Comment

Your email is never published nor shared. Required fields are marked *