Ogni anno SemRush, Backlinko e Moz pubblicano ricerche sui fattori di ranking basate su dataset in lingua inglese. Il problema è che le SERP italiane hanno dinamiche proprie: domini diversi, abitudini di ricerca diverse, e un panorama competitivo dominato da attori locali che i dataset anglosassoni non colgono.
Abbiamo deciso di condurre il primo studio correlazionale sui fattori di ranking specifici per Google Italia, utilizzando keyword italiane reali estratte da siti che gestiamo o monitoriamo, tra cui wikiherbalist.com (erboristeria e botanica) e f-hack.com (cybersecurity e tech).
Disclaimer metodologico: questo è un pilot study con un dataset limitato (601 URL, 135 keyword, nicchie specifiche). I risultati sono indicativi, non definitivi. La correlazione non implica causalità: misuriamo associazioni statistiche, non meccanismi causali certi. Intendiamo espandere il dataset a 1.000+ keyword nei prossimi mesi.
Metodologia
1. Raccolta delle keyword
Abbiamo estratto le keyword di opportunità dai nostri siti tramite Google Search Console: query con posizione media tra 4 e 20 e almeno 20 impressioni mensili. Il risultato: 135 keyword italiane in nicchie di erboristeria, cybersecurity e altri settori, con volume di ricerca reale e verificato.
2. Scraping SERP da google.it
Per ogni keyword abbiamo estratto i primi 10 risultati organici da google.it (locale it-IT) usando Playwright con Chromium, lo stesso motore del browser Chrome. Totale: 1.187 URL raccolti dalle SERP.
3. Analisi delle pagine
Ogni URL è stato visitato e analizzato per estrarre 11 fattori on-page e tecnici. Gli URL irraggiungibili sono stati esclusi. Dataset finale: 601 pagine analizzate.
4. Correlazione di Spearman
Abbiamo calcolato il coefficiente di correlazione di Spearman tra ogni fattore e la posizione SERP. Abbiamo scelto Spearman invece di Pearson perché la relazione tra fattori e posizione non è lineare: la differenza tra posizione 1 e 2 non vale quanto quella tra 9 e 10. Soglia di significatività: p < 0.05.
I risultati
La mappa completa dei fattori

Valori negativi = correlazione con posizioni migliori. * p<0.05 · ** p<0.01 · *** p<0.001
Solo tre fattori risultano statisticamente significativi nelle SERP italiane analizzate:
| Fattore | r Spearman | Significatività | Effetto |
|---|---|---|---|
| Keyword nell'H1 | -0.144 | *** (p=0.0004) | Migliora il ranking |
| Keyword nel Title | -0.139 | *** (p=0.0006) | Migliora il ranking |
| Keyword nell'URL | -0.112 | ** (p=0.006) | Migliora il ranking |
Il fattore più importante: il keyword match
Le pagine in posizione 1-3 hanno la keyword (o una sua variante) nel titolo, nell'H1 e nello slug URL con una frequenza significativamente maggiore rispetto a quelle in posizioni inferiori:

Le pagine in posizione 1-3 includono la keyword target nel Title nel 28% dei casi, contro il 17% di quelle in posizione 7-10.
Questo non significa che basti inserire la keyword in questi campi per rankare. Significa che chi già ranka bene lo fa con maggiore frequenza, e che il keyword match nei meta-tag principali rimane un segnale rilevante per Google Italia nel 2026.
Caso pratico: wikiherbalist.com
Per la keyword "saponine" (9.600 impressioni/mese, posizione media 9.6), la pagina di wikiherbalist ha il termine nello slug e nell'H1, ma non nel tag title. Le pagine in posizione 1-3 per questa query hanno il termine nel title nel 100% dei casi. Una modifica al title tag è la prima ottimizzazione da effettuare.
Il dato che smonta un mito: il word count
Uno dei consigli SEO più diffusi è "scrivi contenuti lunghi per rankare meglio". I nostri dati raccontano una storia diversa, almeno per le SERP italiane analizzate:

Le pagine in posizione 1-3 hanno in media 1.949 parole, meno di quelle in posizione 4-6 (3.383 parole). La correlazione è praticamente nulla: r=-0.011, p=0.79.
Come si spiega questo paradosso? Osservando chi occupa le prime posizioni: Wikipedia e Treccani dominano la maggior parte delle SERP informazionali italiane analizzate. Questi siti non hanno bisogno di testi lunghissimi per rankare: è l'autorità del dominio a fare il lavoro.
I siti che cercano di compensare una bassa autorità con contenuti molto lunghi (posizione 4-6, media 3.383 parole) non riescono a superare le authority consolidate. Il takeaway non è "scrivi poco", ma che la lunghezza da sola non è un fattore discriminante: conta di più chi sei che quante parole scrivi.
Chi domina le SERP italiane: il Competitor Radar
Analizzando tutti i risultati SERP raccolti, emerge un quadro chiaro di chi presidia le prime posizioni:

I 10 domini con più apparizioni nelle prime 10 posizioni su 135 keyword italiane. Percentuale = % di keyword per cui il dominio compare.
Wikipedia appare nelle prime 10 posizioni per 83 keyword su 135 (61%). Treccani per 67 (50%). Questi due siti sono di fatto i gatekeeper delle SERP informazionali italiane.
La strategia giusta per chi compete in queste nicchie non è cercare di battere Wikipedia su query generiche. È targetare keyword a coda lunga e con intento specifico dove le grandi authority non sono presenti o non sono ottimizzate.
Caso pratico: f-hack.com
Per keyword come "content security policy esempi" (posizione 16, 130 impressioni), né Wikipedia né Treccani compaiono in SERP: il territorio è conteso da siti tecnici specializzati. Qui f-hack.com ha margini reali per salire, lavorando sul keyword match nei tag principali e sulla qualità tecnica della pagina.
I fattori non significativi: cosa NON conta (in queste SERP)
Altrettanto interessante è ciò che non risulta correlato alle posizioni:
- HTTPS (r=-0.032, p=0.43): il 99.2% delle pagine analizzate usa già HTTPS. È diventato prerequisito, non vantaggio competitivo.
- Indice Gulpease (r=-0.034, p=0.42): la leggibilità del testo in italiano non mostra correlazione significativa con le posizioni in questo dataset.
- Freshness (r=+0.012, p=0.88): la data di aggiornamento del contenuto è irrilevante nelle nicchie analizzate. Le authority mantengono le posizioni indipendentemente da quanto siano recenti i contenuti.
- TLD .it (r=+0.069, p=0.09): contrariamente a quanto spesso consigliato, il dominio .it non porta vantaggi sistematici nelle SERP italiane. Wikipedia (.org) e molti .com coesistono ai vertici senza differenze significative.
- Presenza di immagini (r=+0.073, p=0.072): borderline non significativo, ma con una direzione interessante - le pagine con immagini tendono leggermente a rankare peggio. Probabile effetto Wikipedia: le authority dominanti sono spesso pagine a testo puro.
- Presenza di video (r=-0.001, p=0.979): correlazione praticamente zero. I video embedded non mostrano alcuna associazione con le posizioni nelle SERP analizzate.
- Lunghezza del title tag (r=+0.004, p=0.916): la lunghezza in caratteri del tag title è irrilevante. Conta cosa c'è scritto (keyword match), non quanto è lungo.
- Dati strutturati (schema.org): misurato tramite rilevamento JSON-LD, ma risultato 0 su 601 pagine nel dataset. I principali siti di autorità italiani (Wikipedia, Treccani) usano microdata o RDFa invece di JSON-LD, che non viene rilevato dal nostro parser. Ripeteremo l'analisi con rilevamento completo nello studio v2.
Limitazioni e prossimi passi
Siamo i primi a riconoscere i limiti di questo studio:
- Dataset limitato: 601 URL e 135 keyword in nicchie specifiche. Le correlazioni potrebbero essere diverse in altri settori (e-commerce, local SEO, query transazionali).
- Fattori non misurati: autorità del dominio (backlink), segnali comportamentali degli utenti (CTR, dwell time), Core Web Vitals. Si tratta di fattori che richiedono dati non accessibili tramite scraping pubblico.
- Correlazione non è causalità: i fattori significativi sono associati alle buone posizioni, ma non necessariamente ne sono la causa diretta.
Lo studio v2 è già in corso. Abbiamo espanso il dataset a 900 nuove keyword generate con Google Autocomplete su 15 nicchie diverse - cucina, salute, finanza, tech, viaggi, casa, lavoro, scuola, legge, auto e altre - portando il totale a oltre 1.000 keyword italiane. I nuovi dati verranno integrati in questo post una volta completata l'analisi.
Nello studio completo introdurremo anche nuovi fattori di analisi, in parte già misurabili tramite il crawler di insights.perseodesign.com:
- Core Web Vitals (LCP, CLS, INP): Google utilizza questi segnali di performance come fattore di ranking. Misureremo i valori reali di ogni pagina competitor tramite Lighthouse.
- Autorità del dominio: tramite la API gratuita di OpenPageRank otterremo un proxy del profilo backlink, probabilmente il fattore più influente che questo pilot study non ha potuto misurare.
- Link interni alla pagina: il numero di link interni che puntano a una pagina riflette il peso che il sito stesso le attribuisce.
- Struttura degli heading: conteggio H2/H3, presenza della keyword negli H2, profondità della gerarchia degli heading.
- Alt text delle immagini: presenza della keyword target nell'attributo alt delle immagini principali.
- Profondità della pagina: il numero di livelli nell'URL come proxy della distanza dalla homepage e dell'importanza percepita nella struttura del sito.
- Dati strutturati completi: rilevamento di JSON-LD, microdata e RDFa per coprire anche i siti di autorità italiani che non usano JSON-LD.
- Segnali E-E-A-T: presenza di autore, data di pubblicazione e firma redazionale - elementi sempre più rilevanti con l'avvento delle AI Overviews.
Suggerimenti
Basandoci sui dati raccolti, le azioni con il miglior rapporto sforzo/impatto per un sito italiano sono:
- Ottimizza title, H1 e URL con la keyword target. È il fattore più correlato alle buone posizioni. Prima di qualsiasi altra cosa, verifica che ogni pagina abbia la keyword (o una variante naturale) in questi tre elementi.
- Scegli keyword dove le authority non presidiano. Competere con Wikipedia su query generiche è perdente a priori. Identifica le query a coda lunga dove il campo è aperto.
- Non ossessionarti con la lunghezza del contenuto. Scrivi quello che serve per rispondere alla query. La lunghezza da sola non sposta le posizioni nelle SERP italiane analizzate.
- Monitora i tuoi veri competitor organici. Chi appare davvero nelle tue SERP? Spesso non sono i brand che percepisci come competitor, ma siti di settore che magari non conosci.
Metodologia completa: scraping con Playwright/Chromium da google.it (locale it-IT), analisi HTML con BeautifulSoup/Python, correlazione di Spearman con scipy. Dataset: giugno 2026.
Vuoi analizzare le opportunità SEO del tuo sito? Prova insights.perseodesign.com: analisi tecnica, keyword di opportunità da GSC e confronto con i competitor nelle tue SERP.