Crawler (Indexation du Web par les moteurs de recherche)

Alertes failles
de sécurité et
de mises à jour

Contribuer - Questionner
Faire un lien

Assiste.com

Crawler : outil utilisé par les moteurs de recherche pour découvrit les pages Web, puis les spiders construisent la toile (les liens/relations/indexes).

cr 01.04.2012 r+ 17.01.2025 r- 17.01.2025 Pierre Pinard. (Alertes et avis de sécurité au jour le jour)

Dossier : Encyclopédie
Introduction Liste Malwarebytes et Kaspersky ou Emsisoft (incluant Bitdefender)

Sommaire (montrer / masquer)
01 Crawler (Indexation du Web par les moteurs de recherche) Autour de ce sujet FAQ

Crawler (Indexation du Web par les moteurs de recherche)

L'indexation du Web, par les moteurs de recherche, se fait avec deux outils :

Les " Crawlers ", qui balayent sans cesse le Web, suivent tous les liens (ou sont aidés par des fichiers « SiteMap » ou des « Flux RSS » maintenus par les Webmasters), et font remonter tout sur les serveurs du moteur de recherche.
Les " Spiders ", qui tissent les liens de la toile à partir du " vrac " remonté par les Crawlers. Lorsqu'une page est remontée par le " crawler " , le " Spider " l'analyse, extrait tous les liens, regarde quels sont ceux déjà dans la base de connaissances du moteur et l'âge de ces pages, et injecte dans la file d'attente des liens à suivre par le " crawler ", ceux " intéressants " (ceux à suivre).

Les technologies de chaque grand moteur de recherche (Google, Bing, Yandex, Baidu, Qwant, etc. ...) sont des secrets totalement protégés, même au sein des entreprises où ils sont développés (le travail est fractionné, etc. ...).

Ainsi, on utilise indifféremment les termes de Crawlers et de Spiders, ne sachant pas très bien qui fait quoi.

Terminologies rencontrées :

Crawler le Web
Web crawling
Pratiquer le Crawling
Spider le Web
Faire du spidering
Web spidering
Robots d'indéxation
Web Bot
Internet Bot
Web Indexing

Aidez et soutenez Assiste – autorisez quelques publicités et cliquez dessus.

Références internes

Crawler (Indexation du Web par les moteurs de recherche)

Autour de ce sujet

Les encyclopédies
Encyclopédie des termes et concepts informatique et Internet Liste Encyclopédie des acronymes, sigles et abréviations Liste Encyclopédie de la terminologie officielle française Liste Encyclopédie de la terminologie Warez, DDL et P2P Liste

Crawler - Crawler (Indexation du Web par les moteurs de recherche)

[/WM-If]

Droits d'auteur attachés à cet article

Ce document est mis à votre disposition selon les termes de la licence « ? » qui s'imposent à vous. Vous avez le droit de copier et modifier la copie de cette page (ou un extrait), dans les conditions fixées par cette licence et tant que cette note d'information y reste attachée, reproduite intégralement (y compris les liens, sans clause nofollow ni noreferrer dans vos liens) et apparaît clairement (« Attribution de paternité » et « Partage des conditions initiales à l’identique »), sans laisser croire que j'endosse votre utilisation de son contenu.

Pourquoi Assiste - Juridique - Asap - Big Brother - Contact - Plan du site - Cookie Google - Vie privée Google

Crawler : outil utilisé par les moteurs de recherche pour découvrit les pages Web, puis les spiders construisent la toile (les liens/relations/indexes).

Crawler (Indexation du Web par les moteurs de recherche)

Références internes

Autour de ce sujet

Droits d'auteur attachés à cet article

Lien (copier le lien vers cette page dans votre presse-papier)