Web scraping21 mai 2014

Par SEO Campagne Suggestions des internautes


  • De quoi s’agit-il ?

Le Web scraping est une action qui se réalise sur le web et qu’on appelle aussi Harvesting.
Le mot est peu courant pour le grand public mais il est utilisé très souvent dans certains milieux informatiques comme le référencement naturel.
L’action consiste a récupérer automatiquement un grand nombre de données sur le web afin de pouvoir construire une base de données.

Les raisons du « scraping » peuvent être multiples et contrairement à ce qu’indique wikipédia (qui donne une définition correcte) son interprétation est fausse lorsqu’il ne laisse entrevoir que la partie répréhensible ( droits d’auteur)
En effet le « scraping » peut être effectuer dans un but de libération de données utiles au grand public (lien scrapathon) ou dans un but professionnel afin de récupérer rapidement des données offerte aux utilisateurs (pour les compiler et gagner du temps (lien referencement-convertic.fr).

     
     
  • Des pistes pour se renseigner

- http://fr.wikipedia.org/wiki/Web_scraping

- http://scrapathon.wordpress.com/

- http://www.referencement-convertic.fr/blog/imacros-trouver-des-nom-de-domaines-expires/

     
     
  • Propositions

scalpe internet

     
     
VN:F [1.9.7_1111]
Évaluation : 10.0/10


Les termes les plus utilisés

Geek (44,32.727272727273)
réseaux sociaux (37,27.954545454545)
grande distribution (34,25.909090909091)
communication (32,24.545454545455)
couchsurfing (31,23.863636363636)
thriller (27,21.136363636364)
noob (26,20.454545454545)
Happy Hour (25,19.772727272727)
page turner (25,19.772727272727)
binge drinking (23,18.409090909091)
Feedback (22,17.727272727273)
garden party (22,17.727272727273)
réseaux sociaux (21,17.045454545455)
gay-friendly (20,16.363636363636)
peanuts (20,16.363636363636)
skeleton (20,16.363636363636)
liker (18,15)
bibliothèques (18,15)
sibling (18,15)
cent (17,14.318181818182)
Slash (\backward slash /forward slash) (17,14.318181818182)
veganism (17,14.318181818182)
as soon as possible (ASAP) (16,13.636363636364)
blogueur (16,13.636363636364)
buzz (16,13.636363636364)
Drive (16,13.636363636364)
internet (16,13.636363636364)
eReader (15,12.954545454545)
root (15,12.954545454545)
crowdsourcing (14,12.272727272727)
greenwashing (14,12.272727272727)
Mug (14,12.272727272727)
netlinking (14,12.272727272727)
internet (14,12.272727272727)
Unmanned Aerial Vehicle (14,12.272727272727)
challenging (13,11.590909090909)
FLASHCODE (13,11.590909090909)
User centric (13,11.590909090909)
back office (12,10.909090909091)
mansplain - mansplaining (12,10.909090909091)
User generated content (12,10.909090909091)
baby-clash (11,10.227272727273)
informatique (11,10.227272727273)
Community Manager (11,10.227272727273)
COWORKING (11,10.227272727273)

WP-Cumulus nécessite Flash Player 9 ou supérieur.

Suggérez vos termes

Saisissez dans le champ ci-dessous le terme étranger que vous souhaitez proposer à la communauté

Commentaires récents

1 octobre 2017 mansplain – mansplaining
"Explication de mec" ou "ex...
1 octobre 2017 troll
"provocateur"
1 octobre 2017 data exhaust
"données résultantes"
1 octobre 2017 greenwashing
Eco-mensonge Eco-propagande
1 octobre 2017 Proposez un équivalent français à quantified self
"Auto" me semble abstrait e...

Dernières suggestions

20 octobre 2015
Mtfr


Kebabier

Commerçant(e) préparant et vendant des kebabs ...

20 octobre 2015
vaissellejetable


street food

La cuisine de rue est la mise en vente de plats, boissons ou aliments dans ...

14 octobre 2015
animateur


Trouvez un équivalent français à freakonomics

Vous aurez beau interroger internet sur le sens de freakonomics, aucune définition formelle ne s’y ...

24 septembre 2015
thomas


biohacking

Activité, souvent informelle ou d'amateur, qui exploite ou modifie la biologie d'un être vivant (y ...

17 septembre 2015
thomas


dislike

Fonction de réseaux sociaux qui permet à l'utilisateur d'afficher son déplaisir à l'égard d'une publication. ...

25 août 2015
thomas


smart data

Les smart data (par opposition aux big data) sont le résultat du raffinement de grosses ...

27 juillet 2015
Ray


data exhaust

les données générées par les internautes, un sous-produit de leur navigation et de leur comportement ...