Common Crawl - Open Repository of Web Crawl Data
Les acteurs de l'IA utilisent des données récupérées sur le web. Mais ils ne vont pas chacun parcourir le web à leurs frais. Ils utilisent des bases déjà toutes faites, comme Common Crawl, qui compile les données du web.