synodiance > seo & technique - conférence e-commerce live 19/11/13
Post on 21-Jun-2015
5.772 Views
Preview:
DESCRIPTION
TRANSCRIPT
Synodiance SEO et Technique – 19/11/2013
Présentation
Synodiance
Spécialiste du référencement naturel › Agence indépendante créée en 1999
› Search, Link et Performance › 35 collaborateurs › + de 100 clients › Grands comptes et PME
› Cœur de métier SEO
› 14 ans d’expérience en SEO › Toutes les facettes du SEO
› CA 2012 : 5 Millions €
Yann SAUVAGEON Directeur de l’Expertise Twitter : @Yahn
Contexte
Technique. 10%
Contenu. 30%
Popularité. 60%
La technique
Des leviers SEO administrables
Performance du site (temps de chargement)
Accessibilité et Indexabilité des contenus existants
Il va falloir aider Google à trouver votre site !
Accessibilité
SEO
CRAWL INDEX RANK
Accessibilité
Les moteurs de recherche sont-ils capables d’accéder à votre site ?
Accessibilité
Disponibilité
Robots.txt
Sitemap XML
Codes HTTP
Voies sans issue
Le Mobile et le Responsive Web Design (RWS)
Accessibilité > Disponibilité
Votre site est-il tout simplement disponible ?
Accessibilité > Robots.txt
Où placer le robots.txt
A la racine du Nom De Domaine www.votresite.com/robots.txt
En sous-domaine hop.votresite.com/robots.txt
En sous-dossier www.votresite.com/hop/robots.txt
OK
NON
Bloquer tous les robots et tous les contenus Bloquer un robot en particulier et un dossier spécifique Bloquer un robot en particulier et un fichier spécifique
User-agent: * Disallow: /
User-agent: Googlebot Disallow: /archives/
User-agent: Googlebot Disallow: /archives/1995.html
Accessibilité > Robots.txt
Accessibilité > Robots.txt
Bloquer tout un répertoire sauf un fichier HTML spécifique Bloquer l'accès à tous les sous-répertoires commençant par "personnel" (wildcards) …
User-agent: * Allow: /repertoire/ficher.html
Disallow: /repertoire/
User-agent: Googlebot Disallow: /personnel*/
Accessibilité > Robots.txt
Les erreurs › Copier le robots.txt du serveur de préprod vers le serveur d’hébergement
› Protéger votre serveur de préprod par un mot de passe ou un filtre IP
User-agent: * Disallow: /
Accessibilité > Robots.txt
Robots.txt
Mauvais paramétrage du robots.txt Baisse du trafic hors marque d’environ 65%
Instructions de « blocage »
Sitemaps XML
Accessibilité > Robots.txt
Monitorer son Robots.txt › Suivi des changements sur le Robots.txt › Alerte immédiate › Enregistrement des changements
› Historique complet › Date et heure › Version des robots.txt
http://www.robotto.org
Accessibilité > Sitemap XML
Le sitemap XML
Un coup de pouce aux moteurs pour qu’ils trouvent plus facilement vos contenus
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url> </urlset>
Accessibilité > Sitemap XML
Spécifier l’adresse du fichier Sitemap.XML dans le robots.txt
User-agent: Googlebot Disallow: /nogooglebot/ User-agent: * Disallow: /onlygooglebot/ Sitemap: http://www.example.com/sitemap.xml
Accessibilité > Sitemap XML
Spécifier l’adresse du fichier Sitemap.XML dans GWT
Accessibilité > Sitemap XML
Priority
<url> <loc>http://www.example.com/</loc> <lastmod>2013-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url>
La priorité est relative. Elle ne s’applique qu’aux pages de votre site.
Ça ne sert à rien de pousser au MAX.
Accessibilité > Sitemap XML
Scinder vos contenus en plusieurs sitemaps.XML Sitemap Web
Extensions d’images et
Vidéos
Sitemap Mobile
Sitemap Vidéo Sitemap Google
Actualités
http://www.sitemaps.org https://support.google.com/webmasters/answer/156184?hl=fr&ref_topic=8476
Accessibilité > Sitemap XML
Nettoyez votre sitemap
Vérifiez les en-têtes http en erreur + la conformité des canonical
1
2
3
Accessibilité > Codes HTTP
200 > Succès / RAS 301 > Redirection permanente 302 > Redirection temporaire 404 > Page d’erreur 410 > Page supprimée 500 > Erreur serveur 503 > Page en maintenance
Accessibilité > Codes HTTP
Les erreurs > Les redirections en chaine !
URL redirigée
URL 1
URL 2
URL 3
URL 4
URL 5
OK
Idéalement
A éviter
Accessibilité > Codes HTTP
Les erreurs > Remplacer les pages supprimées par une 404
Page supprimée
404
410 ?
Accessibilité > Codes HTTP
Des codes d’erreur erronés
La page se charge normalement.
Et livre un
code 500!
Et livre un
code 200! La page se charge
en 404.
Désindexation des pages !
Contenu dupliqué en masse !
= « Soft 404 » / « crypto 404 »
Accessibilité > Codes HTTP
Des codes d’erreur erronés
Les erreurs 404 sont redirigées vers la
Home Page.
Toutes les erreurs sont en
code 200!
?
Accessibilité > Codes HTTP
Outil > Screaming Frog
Accessibilité > Les voies sans issue
Accessibilité > Les voies sans issue
Pages crawlables
Pages non crawlables
Accessibilité > Les voies sans issue
Pages non crawlables
Formulaires Liens Flash complexes Liens JS Jeux de Redirections
Accessibilité > Mobile
http://googlewebmastercentral.blogspot.fr/2012/06/recommendations-for-building-smartphone.html
Pensez accessibilité sur mobile !
Accessibilité > Mobile
S’assurer que le site est crawlable par Googlebot et Googlebot-mobile
Aider Googlebot à identifier que le site est responsive design › Spécifiez la largeur de votre site dans vos feuilles de style CSS › Autorisez le crawl des fichiers externes (CSS, JavaScript, and images)
Ne pas alourdir le site inutilement › Optimisez les images par support › Chargez les éléments uniquement nécessaires à la configuration requise › Travaillez les éléments de performance « classiques » : mise en cache du navigateur, activation de la compression GZIP
Indexabilité
Accessibilité
Crawl Indexation
CRAWL
• Accéder à des pages publiques
• Suivre les liens présents sur ces pages
INDEX
• Rassembler des informations à propos d’une page afin de la rendre disponible dans les résultats
Une page peut être crawlée et non
indexée.
Une page peut être indexée et non
crawlée.
Les moteurs de recherche sont-ils capables d’indexer vos contenus ?
Indexabilité
Gérer l’indexation
Identifier les points bloquants
Optimiser l’indexation
Indexabilité > Gérer l’indexation
Noindex > Bloquer l’indexation dans le robots.txt Robots meta tag > Bloquer l’indexation d’une page
User-agent: * Disallow: /page-a.html Noindex: /page-a.html
(commande non officielle)
<!DOCTYPE html> <html>
<head> <meta name="robots" value="noindex" /> ...
Attention : pour que cette commande puisse être prise en compte, les robots doivent pouvoir crawler la page.
Indexabilité > Gérer l’indexation
X-Robots-Tag HTTP header > Bloquer l’indexation d’un doc. non-html X-Robots-Tag HTTP header > Automatiser sur Apache via le .htaccess
HTTP/1.1 200 OK Date: Tue, 25 May 2010 21:42:43 GMT (…) X-Robots-Tag: noindex (…)
<Files ~ "\.pdf$"> Header set X-Robots-Tag "noindex, nofollow" </Files>
Indexabilité > Gérer l’indexation
Directives Robots Meta Tag & X-Robots-Tag HTTP header
noindex nofollow none
noarchive nosnippet noodp
notranslate noimageindex unavailable_after:
[RFC-850 date/time]
Indexabilité > Points bloquants
Scripts
› Les outils de recherche sont assez mauvais dans l’interprétation des scripts.
Google est-il capable d’accéder aux contenus présents dans les onglets 2 à 4 ?
Ça dépend du Framework utilisé.
Google s’améliore constamment.
Indexabilité > Points bloquants
Scripts
› Les outils de recherche sont assez mauvais dans l’interprétation des scripts.
OK
Pas OK
Indexabilité > Points bloquants
Flash › Aucune granularité de l’information › Pas d’URLs distinctes par contenus › Texte en désordre › Pas de deep-linking possible › Non compatible avec les mobiles/tablettes
Indexabilité > Points bloquants
Flash
› Utiliser le Flash comme des images › Pour illustrer le propos › Schéma › Explication visuelle
----------------------------------------------------------------------------------------------------
› Proscrire le flash
› Site Full-Flash › Contenus texte dans le Flash › Site mobile utilisant du Flash
Indexabilité > Points bloquants
Flash
› Matt Cutts Keynote at #Pubcon Las Vegas 2013 Smartphone ranking: If a searcher has a
phone that doesn’t do Flash, Google is less likely to deliver results with Flash
Indexabilité > Points bloquants
Vous souhaitez vraiment du Flash … OK… ! › Travaillez la dégradabilité de vos contenus Flash
› Créer une arborescence HTML de votre site Flash › Utilisez SWFObject pour détecter la nom prise en compte du Flash
› Deep-linking vers des sections du Flash via SWFAddress
Indexabilité > Points bloquants
Chasse au Duplicate Content !
Crédit : http://www.flickr.com/photos/paperpariah/5166989091/
Duplication à 100% › Pages similaires à 100%
Duplication partielle › Pages proches › Ordonnancement différent › Portions de texte qui varient
-------------------------------------------------------
Duplication cross-domaines › Plusieurs sites qui partagent › un contenu similaire ou proche
Indexabilité > Points bloquants
Duplication interne
Duplication externe
Indexabilité > Points bloquants
“www” vs. Non-www
www.monsite.com Vs.
site.com
Indexabilité > Points bloquants
Serveur d’hébergement
dev.monsite.com Vs.
site.com
Indexabilité > Points bloquants
Http / Https
http://www.monsite.com Vs.
https://site.com
Indexabilité > Points bloquants
Web / Print
http://www.monsite.com/superproduit.htm Vs.
http://www.monsite.com/superproduit-print.htm
Indexabilité > Points bloquants
La Casse (IIS Server)
http://www.monsite.com/superPRODUIT.htm Vs.
http://www.monsite.com/superproduit.htm
Indexabilité > Points bloquants
Home Page
http://www.monsite.com/index.php Vs.
http://www.monsite.com
Indexabilité > Points bloquants
Plusieurs chemins
http://www.monsite.com/chaises/chaises-design Vs.
http://www.monsite.com/design/chaises-design
Indexabilité > Points bloquants
FR/CH-FR/BE-FR
http://www.monsite.fr/chaises/chaises-design Vs.
http://www.monsite.ch/fr/chaises/chaises-design
Indexabilité > Points bloquants
Checker son duplicate
Duplication interne
Duplication externe
Indexabilité > Points bloquants
Checker son duplicate
Indexabilité > Points bloquants
Il est mieux de ne pas avoir de méta descriptions que
d'avoir des métas descriptions dupliquées !
Indexabilité > Points bloquants
votresite.com votresite.com/index.php
www.votresite.com www.votresite.com/index.php
1 page
4 pages
Indexabilité > Points bloquants
votresite.com votresite.com/index.php
www.votresite.com www.votresite.com/index.php
4 pages
Dilution de la popularité
Contenu dupliqué
Non-maitrise de l’URL indexée
Choisissez entre www et sans-www Supprimez le nom du fichier présent par défaut à la racine de vos dossiers (votresite.com/index.php) Linkez en interne vers la version canonique et paramétrez dans GWT votre domaine favori
Indexabilité > Points bloquants
mysite.com 301 www.mysite.com
Indexabilité > Points bloquants
URL Canonique › Assurez vous d’avoir une seule URL par page
› Passez les détails inutiles dans les cookies plutôt que dans les URLs (session IDs, paramètres de tracking )
› Utilisez la balise rel=“canonical” pour les filtres à ne pas indexer
<link rel="canonical"
href="http://www.example.com/produit.php?item=poisson_suedois"/>
http://www.example.com/produit.php?item=poisson_suedois&sort=prix
Indexabilité > Points bloquants
L’erreur > la même instruction Rel=Canonical sur tout le site
<link rel="canonical" href="http://www.monsite.com" />
Home
Page Produits
Page catégories Blog
rel=canonical rel=canonical rel=canonical
Indexabilité > Optimisation
Bien
Pas bien
www.decololo.com/chaises/chaises-design
www.decololo.com/cat74/chaises_design
www.decololo.com/cat74/sku456
www.decololo.com/find?cat=74&sku=456
www.decololo.com/find?cat=74&?sku=456&Idsession=...
cdn6.fr.decololo.com/find?cat=74&?sku=456&Idsession=...
Indexabilité > Optimisation
Quelques règles à respecter pour les URLs › Concises › Explicites › Courtes › Séparateur “-” et non “_” › Utilisez des mots clés › Utilisez une logique de dossiers/sous-dossiers plutôt que des paramètres
Ne misez pas tous sur les URLs Si vous êtes déjà bien positionnés, attendez une refonte.
La réécriture d’URLs peut faire plus de mal que de bien à court terme.
Indexabilité > Optimisation
• Pages de résultats ? • Navigation à facettes ? • Filtres ? • Options de tri ?
L’objectif n’est pas de tout
indexer mais d’indexer ce qui est stratégique.
Indexabilité > Optimisation
Faciliter l’accès aux pages les plus profondes
› Ici, le robot doit scanner chaque niveau de page :
› Pagination par dizaines et/ou centaines pour les bots
Indexabilité > Optimisation
Gestion du Crawl et pages de résultats du site
1 2 3 4 5 6 … 40
Indexabilité > Optimisation
Gestion du Crawl et pages de résultats du site
1 2 3 4 5 6 … 40
La première page de résultats = Home Page de catégories Bonnes pratiques = Editorialiser cette page / faire remonter vos produits clés
Ne pas les indexer – Insérer une méta « noindex, follow »
Indexabilité > Optimisation
Pages de résultats Index, Follow
NoIndex, Follow
Objectif SEO : Optimiser le temps de Crawl
<link rel="canonical" href="http://shop.nordstrom.com/c/mens-jeans" />
Indexabilité > Optimisation
Les logs - Définition
› Fichier regroupant l'ensemble des événements survenus sur un serveur › Adresse IP › URL visitée › Date › User Agent › Referer › Temps de chargement
204.152.18.22 www.synodiance.com - [19/May/2012:00:05:51 +0200] "GET /feed/ HTTP/1.1" 200 39060 "-" "Yammer Feed Eater"
209.85.224.82 blog.synodiance.com - [19/May/2012:00:04:54 +0200] "GET /interactive_traffic_strat/atom.xml HTTP/1.1" 404 4836 "-" "FeedBurner/1.0 (http://www.FeedBurner.com)" 74.86.158.106 synodiance.com - [19/May/2012:00:03:21 +0200] "HEAD / HTTP/1.1" 301 - "-" "Mozilla/5.0+(compatible; UptimeRobot/1.0; http://www.uptimerobot.com/)" 74.86.158.106 www.synodiance.com - [19/May/2012:00:03:24 +0200] "HEAD / HTTP/1.1" 200 - "-" "Mozilla/5.0+(compatible; UptimeRobot/1.0; http://www.uptimerobot.com/)"
Indexabilité > Optimisation
Analyse de logs
Performance
Performance des contenus
Performance des contenus › Le temps de chargement impacte 1% des requêtes soit 1 requête sur 100 ! › Ce sont les requêtes les plus stratégiques « Short Tail » qui sont impactées.
Performance des contenus
Les bots des moteurs ont un temps limité à allouer à chacun des sites.
Performance des contenus
Time to first byte (TTFB)
• TTFB mesure le temps qui s’écoule entre le moment où la requête est faite au serveur et le moment où le navigateur reçoit le premier byte de la réponse.
Start to render (STR)
• “start render” correspond au moment où le contenu commence à s’afficher dans le navigateur de l’utilisateur.
Document Complete
• Le temps nécessaire pour charger toutes les ressources nécessaire au navigateur (texte, images, scripts).
Performance des contenus
Source : Etude Search Metrics 2013
2.106s 1.925s 2.375s 2.436s 1.618s
2 sec. en moyenne
4,65 sec. en moyenne
4.224s 5.413s 4.314s
Performance des contenus
Source : http://moz.com/blog/how-website-speed-actually-impacts-search-ranking
Performance des contenus TTFB < 200 ms
Performance des contenus
Performance des contenus
Visez plus de 75/100 Comparez vous !
http://developers.google.com/speed/pagespeed/insights/
Performance des contenus
49
71 79
60
85 88
0
10
20
30
40
50
60
70
80
90
100
Fnac.com Pixmania.fr Amazon.fr
Page Speed MobilePage Speed Desktop
Performance des contenus
Facteurs Client Side Compression des images Externalisation des JS et CSS volumineux Mise en cache côté navigateur Chargement asynchrone Sprites CSS …
Facteurs Serveur Side Performance du serveur Localisation du serveur La Base de Données / Les requêtes associées …
Performance des contenus
Compression gzip/deflate Compression JS/CSS/HTML Optimisation des images Mise en cache Suppression des redirections
http://developers.google.com/speed/pagespeed/insights/
Quick Wins
Performance des contenus
Images Sprites
Performance des contenus
Images Sprites
Performance des contenus
CDN = Content Delivery Network
Performance des contenus
Content Delivery Network
Performance des contenus
Content Delivery Network
Performance des contenus
Load Balancing
Administration SEO
Administration SEO du site
Fonctionnalités clés SEO
› Edition du robots.txt › Gestion des 301s › Gestion de la redirection manuelle › Débloquer Title et description (override) › Sitemap Automatique › Gestion des syntaxes de réécriture par backoffice › Editeur en mode HTML › Taggage sémantique des pages (schema.org + tag de catégories) › …
La technique > Administration
La technique > Administration > 500 Plugins SEO > 50 Extensions SEO > 70 modules SEO > 40 Modules SEO > 70 extensions SEO
Synthèse
Synthèse
Inscrivez votre site sur « Google Webmaster Tools » › http://www.google.com/webmasters/
Synthèse
Sites de petite taille
• Sites « Corporate » • Sites institutionnels • Sites Vitrine
Sites de taille importante
• Sites e-commerce • Sites d’annonces • Sites d’actualités
Synthèse
1. Assurez l’accessibilité de vos pages 2. Favorisez l’indexabilité de vos contenus 3. Filtrez les contenus non stratégiques 4. Soignez votre temps de chargement 5. Dotez vous d’un CMS SEO-Friendly 6. Prévoyez d’être compatible mobile
Questions Yann SAUVAGEON Directeur de l’Expertise Twitter : @Yahn
top related