Pourquoi les entreprises collectent et stockent-elles des données personnelles ? Parce qu’elles peuvent en tirer profit, tout simplement !
Pourquoi les sites Internet collectent et stockent-ils des données?
Auparavant, aux premières heures de l’informatique, les ordinateurs avaient très peu de capacité à identifier les individus, ou toute autre chose dont ils n’avaient pas les données. Si vous vous connectiez et que vous utilisiez votre vrai nom, l’ordinateur connaissait votre nom et c’est tout. Vous pouvez penser par exemple à un néon avec votre nom visible et rien d’autre.
Imaginez maintenant l’apparition d’un vrai progrès technologique. Une évolution où l’Internet des Objet permet à un ordinateur de reconnaître votre voix à travers un microphone, où votre ordinateur peut visualiser votre taille et vos actions grâce à une webcam, où les sites Web connaissent votre biométrie via un périphérique portable et tout votre historique de navigation passé, vos transactions financières et votre historique médical est numérisé et à portée de main. Dans ce monde, un ordinateur peut créer quelque chose de reel à partir d’un élément virtuel qui vous permet de prédire ce que vous pensez, ce que vous aimez et où vous allez dépenser de l’argent. C’est le monde dans lequel nous vivons aujourd’hui et tout cela est lié à la collecte de données.
Cela va sans dire que les sites Web et les entreprises collectent et stockent des données. Pourquoi les entreprises stockent des données, c’est assez simple. Les données représentent la connaissance, la connaissance est le pouvoir et le pouvoir se transforme invariablement en argent. Plus vous avez de données, et plus vous avez de puissance et d’argent, regardez Jeff Bezos. Il a démarré Amazon comme un moyen simple de vendre des livres à prix discount. En chemin, son petit site Web a collecté des données sur vous, moi et tout le monde, a transformé ces données en informations et maintenant Jeff Bezos est le deuxième homme le plus riche du monde. L’une de ses dernières avancées, le dispositif Alexa, n’est qu’un outil de collecte de données avancé que vous pouvez facilement installer dans votre maison, avec un lien direct vers Amazon.
- Chaque fois que vous vous connectez sur Internet, que vous vous connectez à un site Web, que vous ouvrez un nouveau compte, remplissez un sondage, répondez à un questionnaire ou fournissez des informations – elles sont collectées, souvent uniquement à des fins de revente, et souvent avec votre nom ou d’autres informations personnelles facilement identifiables. Même sans votre nom, les adresses IP et autres marqueurs peuvent être utilisés pour lier ce que vous faites aujourd’hui à d’autres informations actuellement disponibles sur le Web.
C’est un fait que la donnée peut faciliter la vie des consommateurs et aider les entreprises. Le problème avec l’exploitation des données, c’est quand cela empiète sur la vie privée et lorsque les données sensibles sont stockées et perdues, mettant les individus en risque. Contrairement à ce qui se peut faire au niveau téléphonique avec la liste rouge, il n’y a aucun moyen d’éviter que vos données ne soient collectées, cela se produit et on ne peut pas faire grand-chose contre cela. Les données collectées de façon légale sont assez risquées : elles sont théoriquement exemptes d’informations d’identification, mais disponibles à la vente à tout service commercial qui le souhaite. Les données recueillies de manière illégale, ou les données volées à une société qui les collecte de manière légale, sont bien pires. Avec seulement quelques morceaux d’informations, les hackeurs peuvent facilement voler vos données d’identité et vider votre compte bancaire.
L’exploration de données et les big data impliquent des bits et octets
Dans le passé, la collecte et le stockage de données analogiques ont été contrés par les dimensions de temps et d’espace. L’avènement du monde numérique a entraîné une explosion de la collecte et du stockage des données. Des données sont générées chaque seconde et chaque jour, lors de chaque utilisation d’Internet. De manière ironique, aujourd’hui, il y a trop de données pour que les méthodes analytiques traditionnelles soient efficaces. Cela a amené à la création d’une toute nouvelle forme d’analyse appelée le Big Data. Le Big Data est un terme qui décrit à peu de choses près les ensembles de données qui sont si grands ou complexes que les méthodes d’analyse traditionnelles ne sont pas adaptées pour les gérer. Les entreprises utilisent une analyse algorithmique avancée, également connue comme l’exploration de données, pour extraire la valeur, y compris l’analyse prédictive et comportementale qui peut être utilisée pour repérer les tendances du marché, contrôler la propagation des maladies ou empêcher des crimes de se produire.
- Durant les 40 dernières années, la capacité mondiale de stockage des données a doublé tous les 3,33 ans.
- Le volume est un problème pour l’analyse du big data, car la quantité de données est juste énorme. Chaque jour, des milliards de données sont produites par tous les périphériques connectés à Internet par rapport à la population ou l’échantillonnage. En d’autres termes, si ces données sont traces, elles sont enregistrées, alors cela est pris en compte.
- La vitesse est un problème pour deux raisons. Le premier est que, au fur et à mesure que l’Internet des Objets se développe, le volume de données généré augmente de façon exponentielle. Deuxièmement, ces données sont générées le plus souvent en temps réel et de façon continue.
- La variété est un problème car le type de données générées varie beaucoup et leur nombre augmente. Il s’agit non seulement des interactions sur le net, mais aussi des images, des données audio et vidéo, comme de biométrie venant de différentes sources comme les PC, les ordinateurs portables, les tablettes, les mobiles, les appareils portables et tous les petits capteurs, lecteurs et émetteurs compatibles avec les objets connectés que nous trouvons dans notre vie quotidienne. On estime qu’il y aura plus de 50 milliards d’objets connectés à l’horizon 2020.
- La variabilité est un problème car les incohérences dans les données, la collecte de données ou le stockage peuvent considérablement affecter le résultat de l’analyse.
- La véracité est un problème car la qualité des données capturées peut aussi considérablement varier, ce qui affecte également la qualité de l’analyse.
- L’exploration de données est la recherche algorithmique de modèles dans des ensembles de données conséquents et complexes. C’est un sous-ensemble informatique qui est à mi-chemin entre différents domaines d’études. Également appelé science des données, elle utilise l’intelligence artificielle, l’apprentissage machine et les statistiques pour produire des informations utiles à partir d’attaques de données.
Quelques risques et avantages liés au big data
Le Big Data offre de nombreux avantages, malgré les risques qu’il implique pour les consommateurs. L’avantage numéro un concerne le marketing, les ventes et la vente au détail. Les données importantes et l’exploration de données aident les entreprises à comprendre qui est plus susceptible de répondre aux nouvelles campagnes de marketing et à la meilleure façon de les cibler. Cela contribue non seulement à contrôler les tarifs de publicité, mais augmente les taux de conversion et évite la perte de revenus et permet de générer des revenus stables. En plus de l’exploitation directe des données publicitaires, les détaillants peuvent gérer l’agencement de l’espace des étagères afin que les articles qui sont le plus souvent achetés ensemble soient placés de manière optimale pour maximiser l’expérience client, développent les ventes croisées et augmente le montant dépensé.
Le data mining ou l’exploitation des données aide l’industrie financière et les services bancaires en utilisant spécifiquement l’historique des données pour identifier les risques potentiels de crédit et pour adapter les prêts pour qu’ils correspondent aux besoins des particuliers. Le Big data peut également aider à identifier les transactions anormales et à prévenir la fraude par carte bancaire. Les gouvernements en bénéficient de la même façon, en utilisant le Big Data pour identifier les crimes qui pourraient se produire.
Le big data peut être utilisé par les fabricants et l’industrie pour optimiser l’entretien en préventif et les réparations. L’historique des réparations peut être comparé à l’enregistrement des performances afin d’identifier les points de problèmes potentiels, même souvent avant que cela ne devient un problème. Les processus de fabrication peuvent bénéficier d’une efficacité opérationnelle optimale pour concevoir des produits de meilleure qualité.
Les risques liés au Big Data sont tout aussi importants. Le problème numéro un concerne la vie privée. La collecte de données peut facilement passer les limites, en identifiant le nombre de personnes qui consultent un site Web pour collecter leurs noms, adresses IP, adresses postales, numéros de téléphone, références de vos documents d’identité, de vos comptes bancaires et bien plus encore. La façon dont nous utilisons Internet aujourd’hui permet, à quasi 100% d’avoir quelqu’un qui connaisse plus de choses que vous sur vous même. Les sociétés d’exploitation de données créent d’énormes dossiers sur les individus et les utilisent ensuite pour créer des listes en fonction des médicaments, des antécédents de voyage, de valeur nette et de tout autre critère que vous pouvez imaginer. Des éléments d’information aléatoires peuvent être rassemblés pour déterminer des choses comme votre religion, les opinions politiques et même l’orientation sexuelle, et toutes ces informations sont même disponibles pour votre employeur s’il veut les acheter.
Une autre limite concerne la sécurité. Quelqu’un qui collecte vos données personnelles et ce qui vous identifie de façon personnelle vous met en risque. Les hackers peuvent cibler l’entreprise en collectant les données de différentes façons et, une fois qu’elles sont hackées, cela vous met en danger d’usurpation d’identité. Le pire est lié au fait que tant de sociétés en ligne aujourd’hui exigent que vous fournissiez des informations pour qu’elles puissant les stocker. Pensez à toutes les banques, cartes de crédit, sociétés d’hypothèque et établissements de soins de santé que vous consultez en un an et à toutes les informations qu’ils recueillissent vous concernant.
Une mauvaise utilisation de l’information représente également un risque. Les informations recueillies en respectant l’éthique pourraient être utilisées à des fins non-éthiques afin de cibler des personnes vulnérables ou discriminer un groupe ou un individu. Une liste de personnes fans de jeux de hasard ou ayant des addictions sexuelles, qui cherchent constamment des sensations rapides peuvent facilement être ciblés pour exploiter des fraudes ou développer des actions criminelles. Ceci est particulièrement important concernant la collecte de données par le gouvernement. Ils ont un accès pratiquement illimité au flux d’informations circulant sur Internet et peuvent, et souvent collecter tout ce qu’ils veulent.
La mauvaise utilisation des données reste aussi une possibilité. Des informations incorrectes, inexactes ou vagues peuvent facilement fausser les résultats et conduire à une mauvaise prise de décision. La véracité des données collectées est toujours un gros problème et le Big Data a connu une croissance exponentielle. Un domaine où les entreprises et le Big Data n’ont pas réussi à produire de résultats précis est le nombre de vrais clics sur les sites Web. Le nombre de clics est faussé par un clic de robot automatisé (fraude au nombre de clics) et le nombre de fois où nous avons clique par erreur sur des annonces. Rien qu’aujourd’hui, en effectuant des recherches pour cet article, j’ai fait des clics par erreur au moins une dizaine de fois. Non pas parce que je suis maladroit, mais parce que la manière dont les pages Web se chargent est en constante évolution, il est très facile de cliquer sur l’espace publicitaire lorsque vous voulez vraiment cliquer sur un lien d’information, un titre sur un menu ou une autre icône de navigation.
Qui collectent vos données ? Tout le monde !
Le big data et le data mining sont en fait si importants dans le monde technologique actuel que les meilleures entreprises de logiciels ont dépensé plus de 15 milliards de dollars dans des entreprises spécialisées dans la collecte, le stockage et l’analyse de données. Des estimations récentes indiquent que l’industrie représente plus de 300 milliards de dollars dans le monde, avec plus de 3 millions d’employés rien qu’aux États-Unis.
Parfois appelés courtiers en données, ces entreprises dont le seul but est de collecter, analyser et vendre des données. Ils se revendent les données l’un à l’autre, ainsi qu‘à d’autres entreprises, comme au gouvernement ou à qui que ce soit d’intéressé. La firme Axcion, cotée en bourse au NASDAQ, réalise un chiffre d’affaires de plus d’1,1 milliard de dollars par an en offrant ses services analytiques et cela ne représente que le sommet de l’iceberg.
Les clients d’Acxiom vont des petites entreprises aux plus grandes entreprises, fournissant des solutions dans plusieurs domaines. La principale fonction est d’aider les entreprises à offrir la publicité la plus pertinente, et même la possibilité de vous suggérer des produits ou services avant même de savoir si vous les souhaitez. Ce qui suit est un extrait de la publication de résultats les plus récents des entreprises.
« Acxiom offre les conditions idéales pour l’exploitation de données aux meilleurs spécialistes du marketing mondial. Nous développons le marketing basé sur les personnes partout dans le monde, grâce à une approche simple et ouverte pour connecter des systèmes et des données qui dynamisent l’expérience client et permet de développer un ROI plus élevé. Leader en exploitation de données d’identité et en utilisation éthique des données depuis plus de 45 ans, Acxiom aide des milliers de clients et partenaires à travers le monde à collaborer pour créer un monde où tout le marketing est pertinent »
Ethique ou non, l’entreprise se vantait du volume d’informations qu’elle avait pu collecter sur environ 200 Américains. Si vous doutez de la taille et de la portée de l’industrie de la collecte et de la distribution de données, faîtes quelques recherches sur Google pour trouver des sociétés vendant des listes de toutes sortes. Les entreprises dont le but est de suivre nos mouvements et nos habitudes de navigation sont devenues très créatives.
Les applications gratuites comme Angry Birds, Candy Crush et Words With Friends ne sont que des façades pour les entreprises de collecte de données. Elles peuvent utiliser vos données GPS et vos journaux de connexion pour suivre vos mouvements, où vous allez, ce que vous consultez, dans quels magasins vous allez et bien plus encore.
Même les entreprises légitimes se sont rendu compte qu’elles ont une source de revenus complémentaires avec vos données. Elles collectent, compilent et vendent des listes de leurs clients comme un courtier de données. Une grande partie de ces données est encore plus importante que la moyenne, car dans de nombreux cas, elle peut être filtrée pour le consommateur et pour garantir l’achat. Pour faciliter encore les choses, il existe des sites Web tiers qui comptent sur un autre site Web pour suivre, rassembler et analyser des données moyennant des frais.
Que pouvez-vous faire concernant la collecte de données en ligne
Il est impossible de vous connecter sans que l’on recueille des informations sur vous. Ce que vous pouvez faire, c’est de prendre des mesures pour limiter les informations recueillies et par qui elles peuvent l’être. Pour ce faire, vous devez vous concentrer sur deux choses. La première est l’information que vous donnez sur Internet, la seconde est de limiter qui peut savoir que vous êtes sur Internet. Heureusement, le fait d’aborder le premier problème vous aidera à résoudre le second, en vous fournissant un VPN.
Les meilleures pratiques d’Internet représentent une liste non officielle de règles ou de suggestions d’utilisation d’Internet. Ils incluent l’utilisation de la protection anti-virus, anti-malware et pare-feu, ainsi que des recommandations sur la façon dont vous surfez, et ce que vous faites pendant que vous êtes en ligne. Les anti-virus, anti-malware et pare-feu représentent toujours la première ligne de défense car ils contribuent à empêcher le déploiement de logiciels de collecte d’informations sur votre réseau et vos périphériques. Ce que beaucoup d‘internautes ne savent pas, c’est qu’un VPN devrait y être ajoutés-ci pour assurer le plus haut niveau de sécurité possible.
Un VPN ou réseau privé virtuel, est la technologie que les grandes entreprises, les gouvernements et les gens qui travaillent avec les technologies utilisent pour sécuriser les connexions Internet. Il combine cryptage, protocoles « tunneling » et d’authentification pour créer des connexions sur des réseaux publics anonymes et rendre presque impossibles pour quiconque d’être lu par un autre destinataire que celui prévu. Avec de nombreux autres avantages non prévus, un VPN peut également contribuer à réduire le montant et la nature des données collectées à votre sujet.
Voici comment un VPN fonctionne : une fois que vous vous connectez à un service tel que Le VPN, vous téléchargez le logiciel sur votre ordinateur, puis vous connectez sur le net en utilisant l’un de leurs serveurs VPN dédiés. Toutes les données que vous transmettez, à savoir vos paquets de données, sont anonymisés en étant re-packagés. Les nouveau groupes de données ainsi créés ont des identifiants marqueurs rendus anonymes (pas votre ordinateur, pas votre adresse IP) qui doivent être authentifiés à la destination avant d’être ouverts. En plus, vos données seront chiffrées dans le groupe de données et / ou tout le nouveau paquet sera chiffré pour éviter les yeux et oreilles malveillants. Une fois envoyé, la connexion contourne votre FAI et va directement au serveur VPN où il est redirigé vers la destination finale, le site sur lequel vous naviguez.
En ce qui concerne votre vie privée, tout le monde sur Internet pourra toujours voir un autre utilisateur rendu anonyme. Les seules données qu’ils pourront collecter seront celles que vous pourrez laisser lorsque vous vous rendez sur un site Web, cela n’inclut pas votre identité ni aucun marqueur identifiable et ne sera jamais associé à votre véritable identité. Après cela, vous devez éviter d’entrer des informations que vous ne voulez pas voir sur Internet. Si cela ressemble à ce dont vous avez besoin, alors permettez-moi de vous rassurer, il n’y a aucune raison de ne pas vous abonner à Le VPN dès maintenant.
*Article mis à jour le 8 juin 2019.*
NOUVELLE SAISON, NOUVELLE PROMO !
-70% SUR UNE OFFRE DE 2 ANS !
PAS DE JOURNAL
100+ LOCALISATIONS
P2P autorisé
Facile à utiliser
Garantie de 30 Jours
Assistance amicale
Bitcoin accepté
Vitesse de l'éclair
Article rédigé par Vuk Mujović (traduit de l'anglais) @vukmujovic
Vuk Mujović est le fondateur de MacTíre Consulting, un analyste, expert en gestion de données, et un écrivain de longue date sur tout ce qui concerne les affaires et la technologie. Il est l'auteur de blogs, d'articles et d'articles d'opinion visant à aider les entreprises et les particuliers à se développer sans compromettre leur sécurité. Vuk est un auteur invité régulier du blog Le VPN depuis janvier 2018, où il donne son avis d'expert sur les sujets liés à la cybersécurité, la vie privée, la liberté en ligne et la protection des données personnelles. Il partage également souvent ses conseils et ses meilleures pratiques en matière de sécurité sur Internet et de sécurité numérique des particuliers et des petites entreprises, y compris certaines manières différentes d'utiliser un VPN.