Ogni anno SemRush, Backlinko e Moz pubblicano ricerche sui fattori di ranking basate su dataset in lingua inglese. Il problema è che le SERP italiane hanno dinamiche proprie: domini diversi, abitudini di ricerca diverse, e un panorama competitivo dominato da attori locali che i dataset anglosassoni non colgono.

Abbiamo deciso di condurre il primo studio correlazionale sui fattori di ranking specifici per Google Italia, utilizzando keyword italiane reali estratte da siti che gestiamo o monitoriamo, tra cui wikiherbalist.com (erboristeria e botanica) e f-hack.com (cybersecurity e tech).

Disclaimer metodologico: questo è un pilot study con un dataset limitato (601 URL, 135 keyword, nicchie specifiche). I risultati sono indicativi, non definitivi. La correlazione non implica causalità: misuriamo associazioni statistiche, non meccanismi causali certi. Intendiamo espandere il dataset a 1.000+ keyword nei prossimi mesi.

Metodologia

1. Raccolta delle keyword

Abbiamo estratto le keyword di opportunità dai nostri siti tramite Google Search Console: query con posizione media tra 4 e 20 e almeno 20 impressioni mensili. Il risultato: 135 keyword italiane in nicchie di erboristeria, cybersecurity e altri settori, con volume di ricerca reale e verificato.

2. Scraping SERP da google.it

Per ogni keyword abbiamo estratto i primi 10 risultati organici da google.it (locale it-IT) usando Playwright con Chromium, lo stesso motore del browser Chrome. Totale: 1.187 URL raccolti dalle SERP.

3. Analisi delle pagine

Ogni URL è stato visitato e analizzato per estrarre 11 fattori on-page e tecnici. Gli URL irraggiungibili sono stati esclusi. Dataset finale: 601 pagine analizzate.

4. Correlazione di Spearman

Abbiamo calcolato il coefficiente di correlazione di Spearman tra ogni fattore e la posizione SERP. Abbiamo scelto Spearman invece di Pearson perché la relazione tra fattori e posizione non è lineare: la differenza tra posizione 1 e 2 non vale quanto quella tra 9 e 10. Soglia di significatività: p < 0.05.

I risultati

La mappa completa dei fattori

Correlazione di Spearman tra fattori on-page e posizione SERP su Google Italia 2026

Valori negativi = correlazione con posizioni migliori. * p<0.05 · ** p<0.01 · *** p<0.001

Solo tre fattori risultano statisticamente significativi nelle SERP italiane analizzate:

Fattorer SpearmanSignificativitàEffetto
Keyword nell'H1-0.144*** (p=0.0004)Migliora il ranking
Keyword nel Title-0.139*** (p=0.0006)Migliora il ranking
Keyword nell'URL-0.112** (p=0.006)Migliora il ranking

Il fattore più importante: il keyword match

Le pagine in posizione 1-3 hanno la keyword (o una sua variante) nel titolo, nell'H1 e nello slug URL con una frequenza significativamente maggiore rispetto a quelle in posizioni inferiori:

Percentuale di pagine con keyword in title, H1 e URL per gruppo di posizione SERP italiana

Le pagine in posizione 1-3 includono la keyword target nel Title nel 28% dei casi, contro il 17% di quelle in posizione 7-10.

Questo non significa che basti inserire la keyword in questi campi per rankare. Significa che chi già ranka bene lo fa con maggiore frequenza, e che il keyword match nei meta-tag principali rimane un segnale rilevante per Google Italia nel 2026.

Caso pratico: wikiherbalist.com

Per la keyword "saponine" (9.600 impressioni/mese, posizione media 9.6), la pagina di wikiherbalist ha il termine nello slug e nell'H1, ma non nel tag title. Le pagine in posizione 1-3 per questa query hanno il termine nel title nel 100% dei casi. Una modifica al title tag è la prima ottimizzazione da effettuare.

Il dato che smonta un mito: il word count

Uno dei consigli SEO più diffusi è "scrivi contenuti lunghi per rankare meglio". I nostri dati raccontano una storia diversa, almeno per le SERP italiane analizzate:

Word count medio delle pagine per gruppo di posizione SERP su Google Italia - dato contro-intuitivo

Le pagine in posizione 1-3 hanno in media 1.949 parole, meno di quelle in posizione 4-6 (3.383 parole). La correlazione è praticamente nulla: r=-0.011, p=0.79.

Come si spiega questo paradosso? Osservando chi occupa le prime posizioni: Wikipedia e Treccani dominano la maggior parte delle SERP informazionali italiane analizzate. Questi siti non hanno bisogno di testi lunghissimi per rankare: è l'autorità del dominio a fare il lavoro.

I siti che cercano di compensare una bassa autorità con contenuti molto lunghi (posizione 4-6, media 3.383 parole) non riescono a superare le authority consolidate. Il takeaway non è "scrivi poco", ma che la lunghezza da sola non è un fattore discriminante: conta di più chi sei che quante parole scrivi.

Chi domina le SERP italiane: il Competitor Radar

Analizzando tutti i risultati SERP raccolti, emerge un quadro chiaro di chi presidia le prime posizioni:

Domini più frequenti nelle SERP italiane - Competitor Radar 2026

I 10 domini con più apparizioni nelle prime 10 posizioni su 135 keyword italiane. Percentuale = % di keyword per cui il dominio compare.

Wikipedia appare nelle prime 10 posizioni per 83 keyword su 135 (61%). Treccani per 67 (50%). Questi due siti sono di fatto i gatekeeper delle SERP informazionali italiane.

La strategia giusta per chi compete in queste nicchie non è cercare di battere Wikipedia su query generiche. È targetare keyword a coda lunga e con intento specifico dove le grandi authority non sono presenti o non sono ottimizzate.

Caso pratico: f-hack.com

Per keyword come "content security policy esempi" (posizione 16, 130 impressioni), né Wikipedia né Treccani compaiono in SERP: il territorio è conteso da siti tecnici specializzati. Qui f-hack.com ha margini reali per salire, lavorando sul keyword match nei tag principali e sulla qualità tecnica della pagina.

I fattori non significativi: cosa NON conta (in queste SERP)

Altrettanto interessante è ciò che non risulta correlato alle posizioni:

  • HTTPS (r=-0.032, p=0.43): il 99.2% delle pagine analizzate usa già HTTPS. È diventato prerequisito, non vantaggio competitivo.
  • Indice Gulpease (r=-0.034, p=0.42): la leggibilità del testo in italiano non mostra correlazione significativa con le posizioni in questo dataset.
  • Freshness (r=+0.012, p=0.88): la data di aggiornamento del contenuto è irrilevante nelle nicchie analizzate. Le authority mantengono le posizioni indipendentemente da quanto siano recenti i contenuti.
  • TLD .it (r=+0.069, p=0.09): contrariamente a quanto spesso consigliato, il dominio .it non porta vantaggi sistematici nelle SERP italiane. Wikipedia (.org) e molti .com coesistono ai vertici senza differenze significative.
  • Presenza di immagini (r=+0.073, p=0.072): borderline non significativo, ma con una direzione interessante - le pagine con immagini tendono leggermente a rankare peggio. Probabile effetto Wikipedia: le authority dominanti sono spesso pagine a testo puro.
  • Presenza di video (r=-0.001, p=0.979): correlazione praticamente zero. I video embedded non mostrano alcuna associazione con le posizioni nelle SERP analizzate.
  • Lunghezza del title tag (r=+0.004, p=0.916): la lunghezza in caratteri del tag title è irrilevante. Conta cosa c'è scritto (keyword match), non quanto è lungo.
  • Dati strutturati (schema.org): misurato tramite rilevamento JSON-LD, ma risultato 0 su 601 pagine nel dataset. I principali siti di autorità italiani (Wikipedia, Treccani) usano microdata o RDFa invece di JSON-LD, che non viene rilevato dal nostro parser. Ripeteremo l'analisi con rilevamento completo nello studio v2.

Limitazioni e prossimi passi

Siamo i primi a riconoscere i limiti di questo studio:

  • Dataset limitato: 601 URL e 135 keyword in nicchie specifiche. Le correlazioni potrebbero essere diverse in altri settori (e-commerce, local SEO, query transazionali).
  • Fattori non misurati: autorità del dominio (backlink), segnali comportamentali degli utenti (CTR, dwell time), Core Web Vitals. Si tratta di fattori che richiedono dati non accessibili tramite scraping pubblico.
  • Correlazione non è causalità: i fattori significativi sono associati alle buone posizioni, ma non necessariamente ne sono la causa diretta.

Lo studio v2 è già in corso. Abbiamo espanso il dataset a 900 nuove keyword generate con Google Autocomplete su 15 nicchie diverse - cucina, salute, finanza, tech, viaggi, casa, lavoro, scuola, legge, auto e altre - portando il totale a oltre 1.000 keyword italiane. I nuovi dati verranno integrati in questo post una volta completata l'analisi.

Nello studio completo introdurremo anche nuovi fattori di analisi, in parte già misurabili tramite il crawler di insights.perseodesign.com:

  • Core Web Vitals (LCP, CLS, INP): Google utilizza questi segnali di performance come fattore di ranking. Misureremo i valori reali di ogni pagina competitor tramite Lighthouse.
  • Autorità del dominio: tramite la API gratuita di OpenPageRank otterremo un proxy del profilo backlink, probabilmente il fattore più influente che questo pilot study non ha potuto misurare.
  • Link interni alla pagina: il numero di link interni che puntano a una pagina riflette il peso che il sito stesso le attribuisce.
  • Struttura degli heading: conteggio H2/H3, presenza della keyword negli H2, profondità della gerarchia degli heading.
  • Alt text delle immagini: presenza della keyword target nell'attributo alt delle immagini principali.
  • Profondità della pagina: il numero di livelli nell'URL come proxy della distanza dalla homepage e dell'importanza percepita nella struttura del sito.
  • Dati strutturati completi: rilevamento di JSON-LD, microdata e RDFa per coprire anche i siti di autorità italiani che non usano JSON-LD.
  • Segnali E-E-A-T: presenza di autore, data di pubblicazione e firma redazionale - elementi sempre più rilevanti con l'avvento delle AI Overviews.

Suggerimenti

Basandoci sui dati raccolti, le azioni con il miglior rapporto sforzo/impatto per un sito italiano sono:

  1. Ottimizza title, H1 e URL con la keyword target. È il fattore più correlato alle buone posizioni. Prima di qualsiasi altra cosa, verifica che ogni pagina abbia la keyword (o una variante naturale) in questi tre elementi.
  2. Scegli keyword dove le authority non presidiano. Competere con Wikipedia su query generiche è perdente a priori. Identifica le query a coda lunga dove il campo è aperto.
  3. Non ossessionarti con la lunghezza del contenuto. Scrivi quello che serve per rispondere alla query. La lunghezza da sola non sposta le posizioni nelle SERP italiane analizzate.
  4. Monitora i tuoi veri competitor organici. Chi appare davvero nelle tue SERP? Spesso non sono i brand che percepisci come competitor, ma siti di settore che magari non conosci.

Metodologia completa: scraping con Playwright/Chromium da google.it (locale it-IT), analisi HTML con BeautifulSoup/Python, correlazione di Spearman con scipy. Dataset: giugno 2026.

Vuoi analizzare le opportunità SEO del tuo sito? Prova insights.perseodesign.com: analisi tecnica, keyword di opportunità da GSC e confronto con i competitor nelle tue SERP.