Outils de web analyses et finalités

J’ai déjà publié ce billet il y a quelques temps sur mon ancien blog, mais comme je pense que je vais le fermer et qu’il interessera sans doute une partie d’entre vous, je le remets ici. J’espère qu’il vous intéressera et que vous n’hésiterez pas à critiquer…

C’est une rapide synthèse sur les différents outils de mesure d’audience sur le web / je me lance sur ce sujet, toujours en ayant une approche ‘grand public’.
Si vous êtes experts en web analyse, je ne vous apprendrais surement pas grand chose…

Pour les autres, ça commence ici:

L’explosion du marketing sur Internet est dû à la technologie intrinsèque du web qui permet de tout enregistrer. Lorsque les internautes surfent, la totalité de leurs actions, de leur comportement est enregistré dans un système et est donc exploitable à des fins techniques et marketing.

Beaucoup peuvent voir cela d’un très mauvais œil, mais il est important de comprendre que le web n’est pas non plus l’ultime outil de fliccage permanent des comportements.
En effet, pour fonctionner, le web a besoin de mémoriser vos actions. ce sont les fameux cookies: si je vais sur la page d’accueil de hotmail par exemple, et que je m’identifie en tapant mon log-in et mot de passe, il faut bien que le système ‘enregistre’ mes informations pour que je sois identifié et que je puisse consulter mes emails.

Il faut donc comprendre et accepter que le web en tant que service technique a besoin d’enregistrer vos actions sur le réseau…

Dès lors, les marketeurs ont commencé à exploiter ce type d’informations.
On peut décrire les différentes manières d’étudier cela comme il suit:

  • Les analyses de Logs
    Historiquement, la web analyse à commencer par cela: on analyse les logs des serveurs des pages web, c’est à dire le nombre de fois que le serveur à envoyer une page vers le navigateur d’un internaute qu’on reconnait grâce à son adresse IP.
    Cette technologie est efficace, mais très contestable car on ne compte pas ici vraiment la visite d’une personnes, mais le nombre de ‘hits’ qu’a recu une page donc tout est assimilé (robots de google, mêmes utilisateurs d’une société ayant la même ip,etc…)

Communément, on estime que l’analyse de log apporte des écarts de l’ordre de 30% par rapport à la réalité…

  • Les outils de webanalyse de tiers
    Il s’agit des outils les plus utilisés actuellement. Les plus connus sont google analytics, xiti, web trends…
    Il ne s’agit pas du tout ici d’analyser des logs: la technique repose sur un script que le webmaster pose sur chaque page de son site. A chaque fois qu’un internaute affiche la page, le script est appelé, et les informations sont donc immédiatement enregsitrées sur les machines du tiers (xiti/google/etc…).
    La richesses des informations enregistrées est fabuleuse: ip de la personnes / temps passé sur chaque page / ordinateur utilisé / zone géographique / vitesse de connexion / navigateur / résolution de l’écran / etc…

A titre d’exemple, certaines versions très avancées de xiti donne même accès à un profiling complet de chaque internaute, comme on peut le voir ici:

le module de suivi du visiteur chez xiti

  • Les panels
    Une autre approche particulièrement pertinente est, à l’opposée, celle de comscore / nielsen netratings (et bientot mozilla et google). Il s’agit non pas de mesure le comportement de tous les visiteurs, mais de se baser sur les comportements de quelques milliers d’internautes pour établir des profils de comportement.
    L’intéret de l’utilisation d’un panel d’utilisateurs est d’obtenir des analyse comportementales plus précise et plus fine que par les outils de web analyses classiques. En effet, un outil comme google analytics aura pour travers de ‘perdre’ les visiteurs à plusieurs moments: vidage des cookies / utilisation de plusieurs pc (au bureau-à domicile-en déplacement) / plusieurs utilisateurs sur un même pc…
    Le paneliste lui, saura mesuré le comportement d’un même internaute quand il est à son bureau, quand il est chez lui, quand il est en vacances, etc…
    Ces analyses sont donc très pertinentes, mais malheureusement pénalisé par la taille, la qualité et la variété du panel d’internautes utilisés.
  • Ce qu’il faut comprendre

Les outils de web analyse sont très puissants et ne cessent d’évoluer pour apporter plus d’informations. Néanmoins, on peut facilement se retrouver noyer dans la masse d’information et ne plus savoir comment utiliser ses données.
De plus, les outils les plus utilisés aujourd’hui sont des outils qui ont été créés alors que les modèles économiques qui régissaient le web était basé essentiellement sur la diffusion de bannière de publicité (ce qui est quand meme encore beaucoup le cas).
Le but était de pouvoir fournir de manière fiable aux diffuseurs et aux annonceurs le nombre précis d’internautes qui étaient soumis aux publicités et ainsi établir une facture ‘juste ‘ (on parle de CPM - cout pour mille - exemple: 2 € pour 1000 affichages d’un carré publicitaire).
les outils comme xiti sont donc particulièrement fort pour mesure le nombre de visiteurs, visiteurs uniques, pages vues d’un site web.

En revanche, ces modèles économiques sont en train d’évolués et on cherche actuellement à trouver d’autres repères que les visites / pages vues. En effet, les modèles se doivent d’évoluer car les comportements des internautes, surtout vis à vis de la publicité est en train d’évoluer (compréhension des liens sponsorisés, ad-blocking, phénomènes de banner blindness/essort de la video avec youtube…).
Ainsi, un axe de réflexion est de mesure la qualité d’une audience plutot que sa quantité: on mesure le temps passé sur une page (facebook et ces jeux / youtube et ses vidéos) et on s’intéresse au nombre d’actions qu’un internaute va effectuer sur une page (car avec Ajax, on fait tout sur meme page fixe sans aucun changement d’url)

Les outils de web analyse doivent donc évoluer pour permettre d’assurer les mesures de qualité qu’impose le marché, et les spécialistes en web analyse ont donc de sacrés challenge à relever afin d’arriver à comprendre correctement les comportements des masses (noeuds au cerveau garanti…)

Si ce sujet vous intéresse, je vous recommande faire un tour sur les forum des experts US de la web analytics association

Tags: ,

13 commentaires pour “Outils de web analyses et finalités”

  1. BernardoGuy dit :

    Merci pour ton article.
    Petite question, comment afficher l’ip des visiteurs avec analytics, je n’ai jamais trouvé cette fonction.

  2. zejulio dit :

    Les adresses IP sont en fait un sujet ‘touchy’

    tu peux essayer l’analyse suivate:
    Visiteurs > propriétés réseaux > Noms d’hôtes
    cela te donneras déjà quelques infos sur les FAI et parfois la région dans le nom de celui-ci
    il existe aussi une représentation géographique (geoloc faite a partir des IP) de l’origine des visiteurs

    En revanche, comme stipulé ici chez GA : http://www.google.com/analytics/fr-FR/tos.html
    >>> Pas d’autorisations de collecte d’informations personnelles
    Donc pas d enregistrement des IP chez google

    Déjà, il faut bien considérer les raisons qui te pousserait à vouloir étudier un rapport sur les adresses IP.
    Ces adresses IP peuvent induire en erreur car certaines sont utilisées par plusieurs personnes et certains visiteurs vont utiliser plusieurs IP pendant leurs visites,selon qu’ils utilisent des proxys ou à cause de leur firewall.

    GA a une approche centrées sur les cookies afin d’identifier des utilisateurs uniques : cela permet une analyse ‘fine’ et a priori ‘fiable’ sans pour autant avoir à récolter des informations personnelles type IP

  3. LeGreg dit :

    Les adresses IP sont dans les logs Apache, faut arreter de dire que c’est “touchy”, c’est n’importe quoi.
    Si tu as un site web, tu peux consulter tes logs directement, certains outils comme wordpress loguent les IPs pour les commentaires (comme là tu dois avoir mon IP je crois) et je suis sur qu’il est possible d’ajouter une regle dans analytics pour loguer les IPs depuis analytics également (par contre je ne sais pas si c’est facile depuis la plateforme wefrag, mais sur ton serveur perso ça doit être faisable).

  4. zejulio dit :

    pas d’agression stp:
    ces informations sont jugés comme ‘touchy’ par google = il considère que ce sont des informations relatives à la vie privé des internautes et ne souhaitent pas en donner l’accès via leurs outils, c’est leur choix (cf leur cgv)
    maintenant, d’autres outils, et notamment l’analyse de log dont je parle dans mon article se sert de cela sans probleme…
    c’est juste une histoire de méthodologie.

  5. Netsabes dit :

    “GA a une approche centrées sur les cookies afin d’identifier des utilisateurs uniques : cela permet une analyse ‘fine’ et a priori ‘fiable’ sans pour autant avoir à récolter des informations personnelles type IP”

    Faut pas me faire rire comme ça quand je bois, c’est mauvais pour mon clavier.

    Donc juste pour mémoire :
    - l’IP n’est pas une information personnelle. En tirant un raisonnement long et tordu, tu pourrais arguer qu’il s’agit d’une donnée personnelle, mais sûrement pas une information. L’IP est transmise lors de toute transmission réseau. C’est techniquement indispensable.
    - par ailleurs, d’un point de vue juridique, la conservation des logs IP est obligatoire sur deux ans en France.
    - un cookie, en revanche, *c’est* invasif. Et par ailleurs, Google Analytics ne se base pas que là dessus : leur javascript tracke les actions des utilisateurs.

  6. zejulio dit :

    je suis tout à fait d’accord avec ce que tu dis netsabes, mais je te renvois néanmoins à CGU d’analytics…

    - la conservation des ips se fait chez google (conformité avec la loi française), mais google ne les communique pas
    - le système de cookies permet d’obtenir plus d’information que l’ip (sur le comportement général de l internaute/tracking des actions and so on…)

    ***
    extrait des cgu d’analytics=
    8. VIE PRIVEE

    8.1 Vous ne recouperez pas (et n’autoriserez pas de tiers à recouper) les données rassemblées depuis votre ou vos Site(s) Internet (ou le(s) site(s) de ces tiers) avec toute donnée nominative, quelle qu’en soit la source, dans le cadre de votre utilisation du Logiciel (ou de son utilisation par des tiers). Vous respecterez toutes les lois applicables relatives à la protection des données personnelles et au respect de la vie privée lors votre utilisation du Service et dans le cadre de la collecte d’informations sur les visiteurs de votre Site Internet. Vous vous engagez à placer de manière visible sur votre Site Internet une charte relative au respect de la vie privée que Vous vous engagez à respecter. En outre, vous vous engagez à inclure sur votre Site Internet la déclaration suivante et à attirer l’attention des utilisateurs de votre Site Internet sur celle-ci:

    « Ce site utilise Google Analytics, un service d’analyse de site internet fourni par Google Inc. (« Google »). Google Analytics utilise des cookies , qui sont des fichiers texte placés sur votre ordinateur, pour aider le site internet à analyser l’utilisation du site par ses utilisateurs. Les données générées par les cookies concernant votre utilisation du site (y compris votre adresse IP) seront transmises et stockées par Google sur des serveurs situés aux Etats-Unis. Google utilisera cette information dans le but d’évaluer votre utilisation du site, de compiler des rapports sur l’activité du site à destination de son éditeur et de fournir d’autres services relatifs à l’activité du site et à l’utilisation d’Internet. Google est susceptible de communiquer ces données à des tiers en cas d’obligation légale ou lorsque ces tiers traitent ces données pour le compte de Google, y compris notamment l’éditeur de ce site. Google ne recoupera pas votre adresse IP avec toute autre donnée détenue par Google. Vous pouvez désactiver l’utilisation de cookies en sélectionnant les paramètres appropriés de votre navigateur. Cependant, une telle désactivation pourrait empêcher l’utilisation de certaines fonctionnalités de ce site. En utilisant ce site internet, vous consentez expressément au traitement de vos données nominatives par Google dans les conditions et pour les finalités décrites ci-dessus. »

  7. Helmut dit :

    C’est fou comme t’y connais rien.

    “En effet, pour fonctionner, le web a besoin de mémoriser vos actions. ce sont les fameux cookies” > LOL

    Mettre GA et Xiti sur un même plan…

    Enfin bref, la liste est longue. Tu as écris ça pour quoi faire en fait ? C’était un devoir en cours ? Parce qu’apparemment tu bosses pas vraiment dans le milieu, ou alors sur de très petits volumes, non ?

  8. zejulio dit :

    Helmut a dit :
    C’est fou comme t’y connais rien.
    “En effet, pour fonctionner, le web a besoin de mémoriser vos actions. ce sont les fameux cookies” > LOL
    Mettre GA et Xiti sur un même plan…
    Enfin bref, la liste est longue. Tu as écris ça pour quoi faire en fait ? C’était un devoir en cours ? Parce qu’apparemment tu bosses pas vraiment dans le milieu, ou alors sur de très petits volumes, non ?

    c’est vraiment charmant les réactions sur cet article.
    Moi qui m’attendait à peu de critiques, je suis servi …

    rappel des faits, bernardo guy me demande “comment afficher l’ip des visiteurs avec analytics, je n’ai jamais trouvé cette fonction.”
    Ma réponse est simple: cette option n est pas disponible sur GA > décision de google (et pas une limitation technique, evidemment)

    De là, ca dérive sur le fait que je n’y connais rien ou que je dis n’importe quoi.

    je précise en début du billet que j’écris plutot pour un ‘non expert’, je mets donc effectivement ga/xiti/and co dans le meme panier, meme si ces 2 solutions (et il y en a bien d’autres) ont en effet leur spécificité
    Perso: je déteste GA qui comporte une nombre de limitation concernant les mesures du ROI et tracking fin qui n existe pas chez xiti ou mieux, chez omniture - maintenant, GA possède quelques atouts indéniables, outre sa gratuité (simplicité / quelques options de segmentations) - reste la problématique de vouloir partager ses infos sensibles avec google…

    maintenant, quant à mes motivations, elles sont justement parce que je bosse dans ce milieu (depuis plusieurs années, sur de très gros volumes et sur plusieurs pays) que je me permets d’écrire: ça m’intéresse de partager et surtout d’apprendre des choses de remarques que l’on pourrait me faire.
    ok?

  9. Grendel dit :

    Salut,

    J’essaie de bosser dans ce domaine et j’ai plusieurs entretiens dans des grosses boîtes du secteur qui s’approchent. Tu accepterais de passer quelques minutes au tel avec moi pour éclairer les zones d’ombre de ma culture webmarketing ?

    Si ça te dit, mail moi à serenithe chez gmoule point con

    Merci par avance

  10. LeGreg dit :

    Non non l’article est bien,
    je voulais juste réagir sur l’idée que l’adresse IP soit une donnée sensible.

    Rien n’est plus facilement accessible que cette info, le fait que Google analytics ne la partage pas est lié à un choix qu’ils ont fait mais ne mets pas cette info dans la “catégorie sensible”.

  11. zejulio dit :

    @Grendel: aucun souci et avec grand plaisir, je tache de t envoyer un email rapidement- aujourd’hui, pas mal de truc de prévu au taf, mais on va aviser…

    @Legreg: merci.
    je comprends ta réaction - il faut bien comprendre que pour google (et d’autres…) l’analyse des ip des visiteurs est considéré comme ’senseible’ également car elle induit des risque de mauvaises analyses.
    exemple:
    1- tu veux mettre un filtre sur ton adresse IP pour que tes visites ne soit pas comptabilisé dans l’audience de ton site et ne biaise pas tes stats = ca marche, aucun probleme
    2- tu cherches à analyser le comportement spécifique d’un visiteur à partir de son IP - manque de bol, l’IP correspond à celle d’une société où 4 collaborateurs paratage l’IP et sont tous les 4 venus sur ton site = les conclusions que tu vas tirer de l’analyse seront nécessairement erronées…

  12. LeGreg dit :

    2 -> En autres mots, si tu es intelligent, tu branches ton cerveau et tu évites de mal exploiter les données.

    De toute façon Google a l’info, ils l’utilisent pour te bannir en cas de violation de leur terms of service (ce qui est potentiellement plus dangereux que de simplement mal interpréter une info vague dans un outil de stats mais ils acceptent de casser des oeufs pour faire leur omelette).

    S’ils ne la mettent pas à disposition pour Google analytics (ou même les infos contenus dans les cookies), c’est qu’ils ne veulent pas faire de Google analytics un outil de tracking par individu. Mais c’est un choix politique ou commercial, certainement pas une limitation technique et un autre outil peut faire cette analyse et un outil couplé aux logs apache est potentiellement beaucoup plus puissant que analytics. Le seul avantage de Analytics c’est que c’est simple et gratuit (et Google récupère des données de trafic beaucoup plus précises par ce biais).

    Création de segment visiteurs “custom” :
    http://code.google.com/apis/analytics/docs/gaTrackingVisitors.html

  13. zejulio dit :

    exact
    c est egalement devenu beaucoup + simple de faire des segment via analytics depuis la derniere mise à jour de l’appli (+update de l’api)

    en revanche, je pense que le principal interet de googla avec analytics est en fait ailleurs:
    c est un argument pour les clients d adwords: coupler les 2 plateformes pour mesurer vos roi - c est hyper simple et vous permet, si vous etes une petite boite, de gérer vos campagnes d’une manière ‘optimale’

    > c’est un argu de vente fort et de fidélisation des clients adwords, et ca permet à google de garder des clients ‘captifs’

    sinon, ton lien est interessant - je pense faire un autre billet avec quelques conseils de segmentations

Laisser un commentaire

Si vous avez un compte sur WeFrag, connectez-vous pour publier un commentaire.

Vous pouvez, entre autres, utiliser les tags XHTML suivant :
<a href="" title="">...</a>,<b>...</b>,<blockquote cite="">...</blockquote>,<code>...</code>,<i>...</i>