Génération Digitale

Récupérer du contenu sur Web.archive.org et le réindexer

Classé dans :

Aujourd’hui, je vous propose un nouveau test suite à un besoin que j’ai eu récemment. Il y a deux ans, j’ai laissé tomber un nom de domaine qui a depuis été racheté.

Je n’ai même pas pris le temps de sauvegarder la base de donnée. J’ai donc perdu l’ensemble de mon contenu enfin peut-être pas tout compte fait et c’est tout l’objet de ce test…

Pour le lancement d’un nouveau site, dans la même thématique que celui que j’ai abandonné, j’ai besoin de contenus et je me suis dit que j’allais utiliser le site Web.archive.org pour faire tout bêtement un « copier-coller » des pages de mon ancien site pour les mettre sur le nouveau. Je précise que les anciennes pages ne sont plus indexées. Où ça parait utile de savoir ce que ça donne d’aller se servir sur Web Archive, c’est de savoir si Google, malgré le fait que vous ne figurez pu dans l’index avec l’ancien site, considère que les contenus sont dupliqués.

Le résultat du test

J’ai enfin une réponse à apporter à cette question et je suis sur qu’elle va intéresser pas mal de webmasters. Au bout d’une semaine, j’ai commencé à voir les pages apparaître avec une petite frayeur puisqu’elles n’apparaissaient pas sur leurs titles. Deux semaines plus tard, les pages se sont indexées dans le premier index sans le moindre problème. Vous pouvez donc aller chercher du contenu gratuitement sur Web Archive pour les besoins d’un site, sans avoir la peur de subir une pénalisation de la part du maître Google.

Le plagiat et la loi

Petite précision : Si vous êtes dans mon cas de figure donc que les textes vous appartiennent, il n’y a pas de problème néanmoins si vous faites ça avec le contenu d’un autre, il est soumis à des droits d’auteurs même si le site de la personne n’est plus disponible. Selon la loi en vigueur en France, la copie partielle ou intégrale est interdite. Au delà du fait que c’est illégal de copier, c’est quand même beaucoup plus correct de contacter la personne et lui demander l’autorisation de se servir de son contenu même si il est obsolète ce qui est souvent le cas sur les sites abandonnés…

Encore plus d'articles