Di 57 fattori tecnici e on-page misurati su 6.824 pagine nelle prime dieci posizioni di Google Italia, solo 10 superano la soglia di significatività statistica. I Core Web Vitals non sono tra questi. Nemmeno la velocità di caricamento, il word count o lo schema markup. La keyword nel title, invece, è il fattore con la correlazione più forte su 841 keyword italiane e cinque nicchie di mercato.
Questa è la seconda edizione del nostro studio sui fattori di ranking specifici per Google Italia. La prima versione, pubblicata il 17 giugno 2026, si basava su 601 URL e 135 keyword: un pilot study utile per tracciare una direzione, ma con un dataset troppo limitato per risultati robusti. In questo round abbiamo espanso tutto di un ordine di grandezza.
Cosa è cambiato rispetto alla prima edizione
Il confronto tra v1 (601 URL, 135 keyword, 11 fattori) e v3 (6.824 URL, 841 keyword, 57 fattori) non è solo quantitativo.
Nella v1 i tre fattori significativi erano keyword in H1 (r=-0.144), keyword nel title (r=-0.139) e keyword nell'URL (r=-0.112). La direzione era chiara, ma le correlazioni erano forti probabilmente anche per effetto di un dataset piccolo e concentrato su poche nicchie.
Con 6.824 URL, le stesse correlazioni si attenuano: keyword nel title scende a r=-0.087, URL a r=-0.071, H1 a r=-0.056. I valori assoluti sono più bassi, ma la significatività statistica è più solida (p<0.001 su n=7.404). In un dataset grande le correlazioni "vere" persistono, quelle spurie scompaiono.
La v3 aggiunge anche 7 nuovi fattori significativi che nel v1 non erano stati testati o non emergevano: numero di H2, link esterni, keyword nell'H2, numero di H1, TLD .it, e il ratio testo/HTML (l'unico fattore che peggiora il ranking).
Su un punto la v1 aveva torto: il TLD .it. Nella prima versione risultava non significativo con correlazione positiva (r=+0.069, p=0.09). Con 6.824 pagine emerge invece come fattore significativo negativo: r=-0.031, p=0.007. Il vantaggio del dominio italiano esiste, è poco ma presente.
Metodologia
Le 841 keyword provengono da cinque siti con Google Search Console reale: wikiherbalist.com (erboristeria), stampa3f.it (stampa 3D), f-hack.com (cybersecurity), instapetshop.com (e-commerce pet) e perseodesign.com (web agency). Abbiamo integrato le keyword di opportunità con varianti da Google Autocomplete, portando il pool iniziale a oltre 17.000 query. Da queste abbiamo estratto le 841 con segnale GSC verificato.
Per ogni keyword: primi 10 risultati organici da google.it (locale it-IT, Chrome headless con delay 8-15 secondi), per un totale di 7.404 URL, di cui 6.824 univoci. Ogni URL è stato analizzato da PerSeo Insights: caricamento reale con Playwright, Core Web Vitals via Lighthouse, 57 segnali tecnici e on-page estratti. La correlazione di Spearman misura l'associazione tra ogni fattore e la posizione SERP (1-10).
Correlazione non implica causalità. I dataset di cinque nicchie specifiche potrebbero non essere rappresentativi di tutti i segmenti del web italiano.
I risultati
Su 57 fattori, 10 superano la soglia di significatività. Nove migliorano il ranking (correlazione negativa con la posizione), uno la peggiora.
| Fattore | r Spearman | Sig. | Effetto |
|---|---|---|---|
| Keyword nel title | -0.087 | *** | Migliora |
| Keyword nell'URL | -0.071 | *** | Migliora |
| Keyword nell'H1 | -0.056 | *** | Migliora |
| Keyword nel meta desc | -0.055 | *** | Migliora |
| Numero di H2 | -0.039 | *** | Migliora |
| Link esterni | -0.039 | ** | Migliora |
| Keyword nell'H2 | -0.036 | ** | Migliora |
| Numero di H1 | -0.033 | ** | Migliora |
| TLD .it | -0.031 | ** | Migliora |
| Ratio testo/HTML | +0.045 | *** | Peggiora |
**** p<0.001, *** p<0.01*
La keyword: il fattore più robusto
Il fattore con correlazione più forte è la presenza della keyword (o di una sua variante) nel title tag (r=-0.087, p<0.001). Segue l'URL (r=-0.071), poi H1, meta description e H2.
Il dato per gruppo di posizione è netto. Per la keyword nel title: le pagine in posizione 1-3 ce l'hanno nel title nell'11,4% dei casi, quelle in posizione 7-10 nel 5,7%. Per l'URL: 8,7% contro 4,8%. La progressione è costante su tutte le posizioni e su tutti gli elementi.
La struttura della pagina conta più della lunghezza
Tre fattori strutturali risultano significativi: numero di H2 (r=-0.039), numero di H1 (r=-0.033) e link esterni (r=-0.039).
Il numero di H2 è interessante perché non misura la lunghezza del testo, ma la sua organizzazione in sezioni. Una pagina con più H2 è probabilmente più completa e navigabile. Il word count invece non è significativo (r=-0.007, p=0.60): scrivere di più non aiuta, ma organizzare meglio sì.
I link esterni (r=-0.039) potrebbero riflettere un pattern di qualità: gli articoli approfonditi citano fonti, quelli superficiali no. Non si tratta di link in uscita come fattore diretto, ma come proxy della cura editoriale.
Il TLD .it: vantaggio locale confermato
Con 6.824 pagine il TLD .it emerge come fattore significativo (r=-0.031, p=0.007). Le pagine in posizione 1-3 sono su dominio .it nel 65% dei casi, quelle in posizione 7-10 nel 61,1%. La differenza, per quanto modesta, appare statisticamente solida.
Nella v1 questo fattore sembrava non significativo, con correlazione positiva (r=+0.069). Il cambio di segno e il raggiungimento della significatività con un dataset più grande suggerisce che era un artefatto del campione piccolo. Il vantaggio del .it per le SERP italiane esiste.
L'unico fattore che peggiora il ranking
Il ratio testo/HTML è il solo fattore con correlazione positiva significativa (r=+0.045, p=0.0006). Un valore alto significa una pagina quasi interamente testo, con poco markup strutturale.
Non contraddice il punto sugli H2. Una pagina moderna ha molto HTML intorno al testo: header articolato, footer ricco, breadcrumb, sidebar, componenti interattivi. Il testo puro rappresenta una frazione minore del codice totale. Una pagina "muro di testo" con layout minimale ha un ratio testo/HTML alto e, secondo questi dati, tende a posizionarsi peggio.
I Core Web Vitals non spostano nulla
È il risultato più sorprendente. Nessun CWV supera la soglia di significatività:
- LCP: r=-0.011, p=0.36
- FCP: r=-0.007, p=0.57
- CLS: r=-0.002, p=0.84
- Performance score Lighthouse: r=+0.009, p=0.45
- TTFB: r=+0.014, p=0.26
La spiegazione più plausibile: i siti nelle prime dieci posizioni per query competitive sono già abbastanza veloci da non essere penalizzati. La variazione di performance all'interno del top 10 non produce un segnale statisticamente rilevante. Non significa che la velocità non conti mai, ma che nel top 10 italiano non è ciò che discrimina le posizioni.
Altri fattori non significativi: schema markup (r=-0.019, p=0.10), HTTPS (r=+0.010, p=0.37), lunghezza del title (r=+0.002, p=0.90), profondità dell'URL (r=+0.003, p=0.77), OpenGraph (r=-0.013, p=0.26).
Suggerimenti
Keyword placement prima di tutto. Se una pagina deve posizionare per una query specifica, la query va nel title, nello slug URL, nell'H1 e nella meta description. È il segnale con la correlazione più forte su 841 keyword italiane e 6.824 pagine, confermato anche dalla v1.
Struttura il contenuto in sezioni. Più H2 significativi e una struttura HTML ricca pesano più del word count totale. Un articolo da 800 parole ben strutturato può fare meglio di uno da 3.000 parole in flusso continuo.
Non ottimizzare la velocità a scapito della rilevanza. I Core Web Vitals non distinguono le posizioni nel top 10 italiano. Non ha senso inseguire miglioramenti di LCP di 200ms se la keyword non è ancora nel title. Tuttavia, le performance contano, pur non avendo un forte impatto diretto sulla SEO.
Il TLD .it vale la scelta. Se stai avviando un sito rivolto al mercato italiano e hai ancora la scelta del dominio, i dati supportano il .it su varianti internazionali.
Vuoi visualizzare l'infografica con i risultati chiave? Visualizza l'infografica · English version
Paper accademico pubblicato su Zenodo: Scarica il PDF
Manetti, G. (2026). Google Italy Ranking Factors 2026: A Correlational Analysis of 6,824 SERP Pages Across 57 Technical and On-Page Signals (3.0). PerseoDesign. https://doi.org/10.5281/zenodo.20797976
Dataset: giugno 2026. Scraping con Playwright/Chromium da google.it (it-IT), analisi con PerSeo Insights, correlazione di Spearman con scipy.