Archive.today
| Adresse | Site officiel | |
|---|---|---|
| Publicité | non | |
| Type de site | Archivage web | |
| Langue | français | |
| Inscription | non | |
| Lancement | 2012 | |
| État actuel | actif | |
Archive.today (anciennement archive.is) est un site web dont le but est d'archiver des pages web et dont le centre de données aurait été situé en France, dans le Nord-Pas-de-Calais[1]. Il fonctionne en utilisant Apache Hadoop et Apache Accumulo.
Créateur
Bien que le site ne donne aucune indication sur son créateur ni sur son moyen de financement[2], certaines personnes se sont mises à la recherche de son créateur et il se pourrait que ce soit un certain Denis Petrov[3] de New-York qui soit le créateur de ce site.
Particularité
Sa particularité est de capturer à la demande les pages web page par page afin de ne pas être affecté par l'éventuelle présence d'un fichier robots.txt[4]. Il est donc impossible d'interdire l'archivage de son site web, ce qui explique pourquoi ce site est fréquemment critiqué.
Il a aussi de nombreuses adresses différentes qui se redirigent les unes entre les autres et changent souvent. Il semblerait que ce soit à cause de la réputation des "TLD" et qu'il change souvent les adresses pour cela[5].
Références
- ↑ (fr + en) Archive.Today, « Archive.is Blog - Parlez-vous français ? Parce que j'ai remarqué que vous site Internet vient de France, au moins les serveurs de celui-ci. Si oui, le Nord-Pas-de-Calais est-il un bon endroit ? » , sur Archive.Today (consulté le )
- ↑ (en) Archive.Today, « FAQ » , sur Archive.Today (consulté le )
- ↑ (en) TrueDetective, « On which country are the creators and servers of archive.today / archive.is based? » , sur Stack Exchange (consulté le )
- ↑ (en) « Comparison of web archiving services », sur dandascalescu.com, (consulté le ).
- ↑ (en) Archive.Today, « Archive.is Blog - Why has 'is' been redirecting to 'vn' and 'md' today? Should we start switching over, or is this a temporary thing? » , sur Archive.Today (consulté le )
Voir aussi
Articles connexes
Liens externes
- (en) « Create publicly available web page archives with Archive.is », sur ghacks.net.
- Portail d’Internet
- Sciences de l’information et bibliothèques