Article

13 mars 2013
Christian Méline

Mesurer le contenu dupliqué. Quelles méthodes ? Quelle fiabilité ?

Le deuxième billet de la série sur le duplicate content est sorti.

Dans ce deuxième opus, vous découvrirez les méthodes les plus courantes d’évaluation du contenu dupliqué.

En effet, selon les sites ou logiciels, différents algorithmes sont utilisés pour déterminer si votre texte contient du contenu existant ailleurs. Mais comment font-ils ?

Comment procèdent les diverses méthodes pour faire cette mesure ?
Ces algorithmes permettent-ils d’obtenir des comparaisons fiables ?
En dessous de quel pourcentage de duplicate content les critères de Google sont-ils satisfaits ?

Avec ce billet, explorons trois méthodes classiques : la méthode des distances, celle des blocs similaires et celles des empreintes.

Alors, quelle fiabilité pour la mesure du contenu dupliqué ?