Les moteurs de recherche peuvent fournir des résultats étranges qui sont toutefois personnalisés pour vous. La façon dont cela est fait peut créer des risques pour vous, alors découvrez dans cet article comment empêcher la collecte de données.
Recherche du meilleur moteur de recherche
Les moteurs de recherche sont extra. Ils sont un peu la feuille de route de l’Internet et après votre routeur et votre FAI, ce sont les caractéristiques les plus importantes de la navigation sur le Web. Ils nous aident à trouver ce que nous voulons sur Internet, où aller, quels sites Web consulter et ce qui est encore mieux, vous n’avez même pas à savoir exactement ce que vous voulez ou exactement où vous voulez aller. Tout ce qu’il vous faut, c’est une sorte de connaissance générale, un simple mot ou une phrase. Internet pourrait certainement fonctionner sans les moteurs de recherche que nous les connaissons aujourd’hui, mais ce serait très différent.
Au-delà de leur capacité à trouver l’information que vous cherchez et à vous diriger vers les sites Web que vous souhaitez, les moteurs de recherche offrent de nombreux autres services. L’un d’entre eux étant la publicité et plus spécifiquement un type de ciblé publicité qui poste le contenu directement à la cible la plus susceptible d’être intéressée. C’est assez incroyable si vous y pensez mais aussi assez effrayant quand vous considérez comment cela se fait : en gardant des informations sur vous, en suivant qui vous êtes, quel type de personne vous êtes, ce que vous aimez, les sites Web que vous avez visités dans le passé et à peu près tous les autres éléments d’information qui existent sur vous sur le web.
- Qu’est-ce qu’un moteur de recherche ? Même si les spécificités varient d’un moteur de recherche à l’autre, un moteur de recherche est un algorithme complexe ou une suite d’algorithmes, de logiciels informatiques, qui balaie Internet à la recherche d’informations et de sites Web basés sur un critère prédéfini, spécifiquement le mot clé ou une expression. D’autres informations qui peuvent être incluses dans les critères de recherche sont des données démographiques sur la personne effectuant la recherche qui sont utilisées pour filtrer les résultats. Les meilleures données de collecte des moteurs de recherche peuvent être affinées au point de livrer des bannières publicitaires ciblées en fonction de l’âge, du sexe et des centres d’intérêt directement sur votre écran d’ordinateur.
Parce que le web est si vaste, avec plus de 6 milliards de sites Web, mais qui peut réellement suivre ce chiffre, les moteurs prennent des mesures pour raccourcir le temps qu’il faut pour livrer les Pages de Résultats du Moteur de Recherche ou en anglais SERP (Search Engine Result Page), c’est-à-dire la page que vous obtenez avec la liste de tous les grands sites web proposant le contenu que vous recherchez. L’une de ces étapes est l’indexation. L’indexation, c’est lorsque les moteurs utilisent ce qu’on appelle les araignées, les programmes dont la fonction est d’explorer le Web et de déterminer quel contenu est situé où, d’élaborer une liste de tous les sites classés par contenu. Dans les catégories, les sites Web sont classés; on a : les sites Web avec le contenu de top qualité, le contenu qui est le plus pertinent pour les requêtes de recherche avec la plus longue valeur dans la durée qui obtient les rangs supérieurs. Lorsque vous effectuez une recherche, le moteur va à l’index et trouve les sites Web qui correspondent le mieux à votre requête.
Le classement est important car il détermine quels sites Web sont répertoriés sur le Résultat de Recherche des Moteurs de Recherche, une fois que vous avez effectué votre recherche. Seul le contenu le mieux classé sera affiché sur la première page ou en 1er choix, ce qui signifie sur l’écran en haut de la page et sera donc vu sans devoir scroller, c’est-à-dire descendre sur la page, et c’est l’endroit qui obtient le plus de clics. Selon les données provenant de plusieurs sources, la zone n°1 sur Google obtient plus de 33% de tous les clics, tandis que la 2ème place obtient à peine la moitié et plus vous allez vers le plus bas et plus les chiffres tombent.
- Les moteurs de recherche, la publicité et la volonté d’être en position n° 1 a créé une industrie entière qui est en plein boom et qui concerne le marketing de contenu et le référencement (en anglais SEO). Cette industrie s’appuie sur le classement de la recherche pour générer des clics et du trafic du site Web dans le but de promouvoir ou de vendre des produits ou de l’espace publicitaire. Cet article même, bien qu’informatif et amusant à lire, est un exemple de contenu SEO et de contenu orienté par rapport aux mots-clés.
Une autre méthode de filtrage des résultats de recherche, et celle qui nous préoccupe le plus en tant qu’utilisateurs d’Internet, est l’exploration de données. Si vous vous êtes déjà demandé comment un site Web comme Google ou Bing, ou même Facebook par rapport à cela, est capable de pousser des annonces pour un VTT à des hommes de 43 ans qui deviennent père pour la première fois, c’est parce qu’ils savent cela vous concernant et ils le savent parce qu’ils sont allés chercher les informations que vous ne leur avez pas données vous-même.
- L’exploration de données (data mining) est une spécialisation informatique qui consiste à obtenir des informations à partir de grands ensembles de données. Le domaine est interdisciplinaire et regroupe l’intelligence artificielle, l’apprentissage automatique, les statistiques et les systèmes de base de données… qui font partie intégrante du fonctionnement des moteurs de recherche, de l’indexation et des résultats de recherche ciblés. Le terme lui-même est un peu trompeur, car il suggère la collecte de données quand en fait, c’est la déclinaison de l’information à partir de données auxquelles il se réfère. Alors que la collecte de données et l’utilisation de ces données par les moteurs de recherche tombe sous le champ de l’exploration de données : dire que l’exploration de données est simplement la collecte et le traitement de grandes quantités de données, c’est comme si l’on disait qu’un vieux Scotch de 18 ans d’âge n’est juste que du whisky. Les trois sous-domaines ou types d’exploration de données sont : l’analyse de clusters (grappes), la détection d’anomalies et les associations. L’exploration de données de moteur de recherche peut utiliser l’analyse de cluster pour déterminer les groupes d’intérêt, la détection d’anomalies pour affiner les résultats personnels et les associations pour obtenir des suggestions adaptées aux intérêts personnels.
Comme tout le reste, au premier abord, l’exploitation de données est quelque chose qui peut convenir. Vous ne voulez pas d’une salle de gym exclusivement pour femmes pour une séance d’entraînement apparaissent comme 1er choix dans vos résultats de recherche alors que vous êtes un homme à la recherche d’une salle de gym ouverte toute la nuit, tout comme une personne sans enfant ne souhaite pas voir des annonces de lait pour bébé. Quand on y regarde de plus près, les choses deviennent désagréables parce que 1) vous ne savez jamais vraiment ce qui est recueilli et 2) même en supposant que le collecteur de vos données soit « sûr », on ne sait jamais qui pourrait pirater leurs serveurs ou intercepter un flux de données, vous exposant alors à de graves difficultés.
Quels moteurs de recherche recueillent des données
Lorsqu’il s’agit de collecte de données sur les moteurs de recherche et d’exploration de données, ils le font effectivement tous dans une certaine mesure. Les différences se trouvent dans leurs politiques de confidentialité, dans la façon dont ils traitent les annonces publicitaires et dans toutes les fonctionnalités liées à la vie privée qu’ils peuvent offrir. Ce que beaucoup d’internautes ne réalisent pas, c’est qu’il existe des alternatives à Google et qu’il existe d’autres moteurs top niveau qui fonctionnent aussi bien sans avoir à s’immiscer dans votre vie privée. Voici un extrait des principaux moteurs de recherche aujourd’hui et comment ils gèrent les aspects de votre vie privée et la sécurité sur Internet.
1) Google – Google, le nom est presque devenu synonyme d’Internet et de navigation sur le Web. Qui n’a pas, un jour, utilisé la petite barre de recherche pratique pour taper un mot simple et obtenu pléthore de résultats payés et non payants qui apparaissent alors au bout des doigts. Quand il s’agit de résultats et de services, Google est de loin et incontestablement le 1er choix. Ils ont réussi à accaparer le marché dans ce qui concerne la recherche, le contenu, la conception de sites Web et le SEO : il dicte en fait ce qui est et n’est pas un bon site Web. Quand il s’agit de l’exploration de données, ils sont là aussi au top. En lisant leurs conditions d’utilisation et leur politique de confidentialité, ils révéleront qu’ils recueillent … n’importe quelle information possible sur vous, ce qui va de l’adresse IP de vos appareils, à vos numéros de téléphone, votre adresse physique, vos habitudes de connexion (où vous vous connectez : ville, maison, bureau, etc…) les sites Web que vous consultez, les choses que vous achetez et tout autre donnée qui existe sur le web et est disponible pour être collectée. Bien sûr, c’est pour le bénéfice des utilisateurs et cela n’est jamais utilisé pour le bénéfice de Google. «Nous recueillons des informations pour fournir de meilleurs services à tous nos utilisateurs – pour comprendre les choses de base comme la langue que vous parlez, jusqu’à des choses plus complexes comme les annonces que vous trouverez les plus utiles, les personnes qui comptent pour vous en ligne, ou quelles vidéos YouTube vous pourriez aimer. « La bonne nouvelle c’est qu’il y a un moyen de vous faire oublier Google en permanence, ou au moins jusqu’à la prochaine fois où vous ouvrirez une session et choisirez de donner vous-même vos données.
2) Yahoo! – Aucun moteur de recherche ne se rapproche vraiment de Google en termes de portée, de nombre d’utilisateurs ou d’impact sur Internet, mais il y a encore quelques autres grandes marques qui sont couramment utilisées. Yahoo! est historiquement un bon moteur, et c’est historiquement aussi un important collecteur de données. Yahoo! est aussi bien connu pour avoir subi non pas un, mais deux hackings majeurs de données qui ont fait que ses utilisateurs risquent l’usurpation d’identité et tous les problèmes qui y sont liés. Ce qui est également important de noter que Yahoo !, qui était une fois alimenté par un logiciel exclusif et propriétaire, est « alimenté par Bing » depuis quelques années maintenant. Les seules différences dans les résultats sont vraiment liées au gestionnaire de publicités qui vous aide à contrôler ce qui est affiché, à défaut de ce qui est recueilli.
3) Bing – Bing est comme ce parent avec qui vous n’avez pas vraiment envie de vous afficher. C’est un moteur de recherche, il donne des résultats, mais par rapport à Google, les Pages de Résultats du Moteur de Recherche et les autres services ne sont pas optimisés. La mauvaise nouvelle c’est que malgré une expérience utilisateur moindre, vous avez aussi un niveau élevé de collecte de données qui rivalise même avec ce que peut faire Google. Sinon comment seraient-ils capables de fournir un éventail si diversifié de résultats, et d’annonces publicitaires affichant des produits que vous avez récemment recherchés. Un coup d’œil sur la politique de confidentialité révèle que l’entreprise qui pourrait facilement vous pister jusqu’à l’endroit même où vous naviguez. « Lorsque vous effectuez une recherche ou utilisez une fonctionnalité d’une expérience Bing qui implique de mener une recherche ou d’entrer une commande en votre nom, Microsoft recueille les termes de recherche ou de commande que vous fournissez, ainsi que votre adresse IP, les identifiants uniques contenus dans vos cookies,
l’heure et la date de votre recherche, ainsi que la configuration de votre navigateur. »
4) AOL – AOL est une autre de ces entreprises Internet omniprésentes qui est retombée quand d’autres modèles commerciaux plus pertinents ont émergé. Néanmoins, la société continue à évoluer et gère un moteur de recherche ainsi qu’un portail média semblable à celui de MSN et Yahoo!. Lorsqu’il s’agit de recherche et de collecte de données, ce puissant bastion d’Internet présente son côté ténébreux. Dans ses termes d’utilisation et sa politique de confidentialité, il est dit : «Nous recueillons et recevons des informations sur vous et votre appareil lorsque vous nous les donnez directement, lorsque vous utilisez nos services et auprès de certaines sources tierces». Donc pour être explicite : en accédant à Internet via leurs connexions, en utilisant leurs services ou à travers leur moteur de recherche, ils collectent des données. Oh oui, et c‘est alimenté par Bing pour qu’ils recueillent aussi vos données, c’est génial, non ?
5) Ask.com – Ask.com est une alternative aux principales marques qui est discret la plupart du temps. Habituellement, lorsque vous le rencontrez, c’est parce que la barre d’outils est installée sur votre ordinateur sans même que vous le sachiez, et c’est compliqué de s’en débarrasser. Si vous n’en avez pas entendu parler, il s’appelait avant Jeeves et a fonctionné pendant plusieurs dizaines d’année comme site de Question/Réponse, comme moteur de recherche, et comme un mix des deux. Ces derniers temps, le site perd de son essor, recevant de moins en moins de visites chaque année, mais reste néanmoins un collecteur de données de premier ordre, et c’est peut-être la dernière chose de valeur qu’il ait à offrir, alors méfiez-vous lorsque vous l’utilisez. Parmi les données recueillies, il y a votre situation géographique, un véritable problème pour toute personne qui a vraiment besoin de rester anonyme en tous points. Habituellement, ceci n’est pas un problème parce que vous n’y accédez pas régulièrement, jusqu’à ce que vous ayez à le faire.
6) Lycos – Eh oui, Lycos fonctionne toujours et pour une raison que l’on ignore, les gens l’utilisent toujours, comme si vous ne pouviez pas obtenir tout ce qu’il propose et bien plus, à peu près partout ailleurs. Avec une mise à jour et plate-forme qui n’est vraiment plus à niveau, vous subissez également une forte collecte de données, bien que cela soit un peu moins intrusif que Google et Bing. Bien sûr, le fait que cela soit moins intrusif reste à débattre quand il s’agit de votre adresse IP, de votre équipement, de vos habitudes de navigation et d’autres données qui pourraient être utilisées pour vous suivre de manière individuelle.
Quels moteurs de recherche ne collectent pas de données
La bonne nouvelle, c’est que tous les moteurs de recherche ne dépendent pas de vos données pour fonctionner, ou pour gagner de l’argent. Il existe un certain nombre d’entre eux qui fournissent des résultats de haute qualité sans vous faire subir les publicités et le contenu ciblé qui peuvent faire de votre surf sur Internet un calvaire. On peut comprendre que les entreprises veuillent faire de la publicité et que les moteurs de recherche veuillent capitaliser sur leur trafic, mais vraiment, cela suffit.
1) Ixquick – Ixquick est un moteur de recherche qui fonctionne depuis 1998 et a évolué en grande partie en sous-marin. Lorsque vous allez sur la page d’accueil, vous remarquez deux choses. Le premier, c’est qu’il ressemble à Google, si Google avait un frère plus décontracté qui était plus sympa. La seconde, c’est que très clairement là-bas, au milieu de la page, il est dit «le moteur de recherche le plus privé du monde». Au début, il était 100% sans publicité, mais il est désormais « amélioré par Google », ce qui signifie que oui, vous allez voir des annonces. La différence, c’est que les annonces sont beaucoup moins gênantes et que vous ne subissez pas les pratiques de collecte de données de Google. La meilleure caractéristique que le site a à offrir est la possibilité d’ouvrir les résultats de recherche de manière anonyme dans une fenêtre proxy.
2) DuckDuckGo – DuckDuckGo est plus connu pour sa protection de la vie privée et sa sécurité dont les performances vont être bien appréciées par les internautes. Le site Web ne recueille pas vos données personnelles, ne recherche que les requêtes d’une manière générale et globale et ne diffuse pas d’annonces. Un autre avantage majeur de ce moteur est le service TOR, un service de partage de fichiers basé sur bittorrent qui contribue à préserver l’anonymat, mais cela a un prix. L’algorithme est axé sur le contenu multi-source et généré par l’utilisateur et du coup, vous pourrez ne pas avoir les résultats les plus récents lors de la recherche d’actualités. Tant pis.
Comment éviter la collecte de données
Il existe un certain nombre de moyens pour empêcher la collecte de données et la collecte de vos données. Le premier est de ne pas mettre vos informations sur Internet. Essayez d’éviter de laisser vos informations n’importe où cela n’est pas absolument nécessaire et elles auront moins de chances d’être recueillies, perdues ou volées. La prochaine chose à faire est d’éviter d’utiliser les principaux moteurs de recherche, car ce sont ceux qui, après tout, exercent cette collecte, mais c’est un peu perdu d’avance. Quand vous effectuez des recherches en ligne, si vous voulez obtenir les meilleurs résultats, le plus souvent ceux-ci viendront de Google. Vous pouvez utiliser l’un des moteurs « amélioré » par Google, mais ce n’est tout simplement pas la même chose, une fois de plus. La seule façon d’obtenir la puissance de Google sans les soucis qui y sont liés est de l’utiliser d’une manière qui vous permet de rester anonyme, et pour ce faire, vous avez besoin d’un VPN. Un VPN ou réseau privé virtuel, a longtemps été la meilleure méthode de sécurisation des connexions Internet et offre de nombreux avantages. L’un d’entre eux est l’anonymat sur le Web, et c’est ce dont vous avez besoin pour éviter que vos données ne soient collectées. Le VPN est le principal fournisseur de services VPN et peut même être utilisé avec un routeur pour fournir une protection totale dans le monde de l’Internet des Objets actuels. Si vous voulez faire des recherches sur le Web, et je sais que vous le faites, et que vous voulez rester en sécurité, il n’y a qu’une seule solution, il s’agit du service VPN de Le VPN. Abonnez-vous à Le VPN dès maintenant avant qu’il ne soit trop tard.
*Article Mis à Jour le 17 Mai 2019.*
NOUVELLE SAISON, NOUVELLE PROMO !
-70% SUR UNE OFFRE DE 2 ANS !
PAS DE JOURNAL
100+ LOCALISATIONS
P2P autorisé
Facile à utiliser
Garantie de 30 Jours
Assistance amicale
Bitcoin accepté
Vitesse de l'éclair
Article rédigé par Vuk Mujović (traduit de l'anglais) @vukmujovic
Vuk Mujović est le fondateur de MacTíre Consulting, un analyste, expert en gestion de données, et un écrivain de longue date sur tout ce qui concerne les affaires et la technologie. Il est l'auteur de blogs, d'articles et d'articles d'opinion visant à aider les entreprises et les particuliers à se développer sans compromettre leur sécurité. Vuk est un auteur invité régulier du blog Le VPN depuis janvier 2018, où il donne son avis d'expert sur les sujets liés à la cybersécurité, la vie privée, la liberté en ligne et la protection des données personnelles. Il partage également souvent ses conseils et ses meilleures pratiques en matière de sécurité sur Internet et de sécurité numérique des particuliers et des petites entreprises, y compris certaines manières différentes d'utiliser un VPN.