Visibilidad en IA: no un KPI, sí un radar

Per què la visibilitat en IA no és un KPI (i tot i així mereix atenció)

En les últimes setmanes el debat s’ha intensificat: eines per mesurar la “visibilitat en IA”, promeses de “rànquing a ChatGPT” i una sensació general que estem repetint els mateixos errors que ja vam viure en altres onades del màrqueting.

Dues peces recents han posat dades i arguments sòlids sobre la taula: l’estudi de Rand Fishkin (SparkToro) sobre la inconsistència de les recomanacions en IA, i l’anàlisi tècnica de Natzir Turrado sobre les limitacions metodològiques dels prompt trackers.

Des de Mindset Digital volem aportar una posició clara: la visibilitat en IA no és un KPI. Però sí que és un senyal. I en un entorn probabilístic, aprendre a treballar amb senyals (sense vendre-les com a certeses) és un avantatge competitiu.

Primer: què NO és la visibilitat en IA

Per evitar malentesos, comencem pel que la visibilitat en IA no és:

  • No és “posicionament” a l’estil del SEO clàssic (no hi ha una SERP estable).
  • No és “rànquing” (l’ordre de les respostes dels LLMs varia de manera extrema).
  • No és un proxy directe de negoci (no implica trànsit, leads ni vendes per si sola).
  • No és l’experiència real de l’usuari (memòria, context, geografia, historial, sessió i eines connectades modifiquen la resposta).

Aquestes aclariments no són una opinió: el mateix estudi de SparkToro mostra que, davant del mateix prompt, les llistes de recomanacions rarament es repeteixen i gairebé mai ho fan en el mateix ordre.

Aleshores, per què diem que no és un KPI?

Perquè un KPI, per definició, hauria de complir (com a mínim) aquestes condicions:

  • Definició estable (mateix concepte entre equips i proveïdors).
  • Mesura comparable (entre períodes, mercats i eines).
  • Relació raonable amb outcomes (impacte demostrable en negoci, encara que sigui indirecte).

En la visibilitat en IA, avui, aquestes condicions fallen sovint:

  • Cada eina calcula els “scores” de manera diferent (i poques vegades explicita la fórmula amb claredat).
  • L’API i la interfície poden retornar resultats diferents.
  • La personalització fa que la “mateixa pregunta” no sigui la mateixa pregunta a la pràctica.

Per això, convertir un “AI visibility score” en un KPI corporatiu sol generar dos problemes: falsa precisió i decisions basades en soroll.

El que sí que és: un radar (senyal exploratori)

Que no sigui un KPI no vol dir que sigui inútil.

L’estudi de SparkToro aporta un matís clau: encara que el rànquing sigui pràcticament aleatori, la presència agregada (quantes vegades apareix una marca al llarg de moltes execucions) pot capturar un patró estadístic raonable en determinats contextos.

Aquí és on la visibilitat en IA té valor: com a radar. Un radar no et diu “quantes vendes tindràs”, però sí que t’ajuda a:

  • Detecció de gaps: temes o intencions on la teva marca no entra en el “set de consideració”.
  • Diagnòstic de cobertura: quines àrees estan sobrerepresentades vs infracobertes.
  • Senyals competitives: en quins tòpics apareixen competidors (i tu no).
  • Alertes de volatilitat: canvis bruscos que obliguen a revisar hipòtesis.

Per què el “soroll” és estructural

Una part del “soroll” no és un bug: és el sistema.

  • Els LLMs són probabilístics: busquen diversitat de resposta.
  • Els prompts reals són altament variables: persones amb la mateixa intenció formulen preguntes molt diferents.
  • Els sistemes de citació i selecció de fonts canvien amb el temps.

Sobre aquest últim punt, hi ha una dada que convé interioritzar: un estudi de Profound va mesurar el “citation drift” mes a mes i va observar canvis molt elevats en dominis citats fins i tot per a prompts idèntics (en la seva anàlisi, Google AI Overviews i ChatGPT mostraven variacions mensuals de desenes de punts percentuals).

Això no invalida treballar amb IA. El que invalida és pretendre una estabilitat tipus “rànquing” allà on no n’hi ha.

Quan SÍ que mereix atenció (i quan no)

Casos on sol aportar valor

  • Diagnòstic inicial: entendre si la marca existeix o és invisible en determinades intencions.
  • Detecció d’oportunitats per tòpics: especialment en sectors amb molta comparació i recomanació.
  • Sector acotat: quan l’“espai d’opcions” és limitat, els patrons tendeixen a ser més interpretables.
  • Estratègia de marca i reputació: quan la presència depèn de tercers (rànquings, llistats, mencions), no només del teu web.

Casos on convé molta cautela

  • Marques molt emergents: el senyal pot ser massa volàtil i sensible al mostreig.
  • Decisions d’inversió basades en un únic score: sense triangulació amb Search Console, PR, mencions, branded demand i analítica.
  • Pocs prompts “a dit”: risc alt de mesurar la intuïció de l’equip, no el mercat.

Com ho treballem a Mindset Digital (sense hype)

El nostre enfocament parteix d’una premissa: la visibilitat en IA és un senyal estratègic, no un KPI de performance.

Per això, quan la mesurem, ho fem amb regles clares:

  • No venem “rànquings en IA”. Parlem de presència i probabilitat.
  • Prioritzem l’anàlisi per intenció i per clusters temàtics, no per prompts solts.
  • Busquem consistència agregada, no “captures” fàcilment manipulables.
  • Triangulem amb SEO tradicional (demanda, contingut, autoritat, PR, marca) i amb objectius de negoci.

El 2026, l’avantatge no està en “tenir una eina”. Està en saber interpretar senyals imperfectes i convertir-les en decisions assenyades.

FAQs

Si no és un KPI, com ho reporto a direcció sense que sembli fum?

Presenta-ho com un indicador exploratori (radar) amb un objectiu concret: detecció de gaps, presència per intenció i alertes de canvis. Acompanya-ho sempre de 2–3 mètriques de negoci (leads, MQL, branded demand) i de SEO tradicional per contextualitzar.

Què hauria d’exigir a una eina de visibilitat en IA abans de contractar-la?

Transparència metodològica (models, freqüència, regions, accés API vs web, com detecta marca/cites), capacitat d’agrupar per intenció o tòpics, i reporting orientat a distribucions/presència més que a rànquings.

Com evito mesurar “el que el meu equip creu que pregunta l’usuari” en lloc de la realitat?

Partint de senyals de demanda (temes recurrents del sector, FAQs reals, pain points, consultes de suport i vendes) i treballant amb clusters. L’objectiu és cobrir intencions, no redactar prompts “perfectes”.

Té sentit comparar la meva visibilitat entre eines diferents?

Amb cautela: cada eina sol utilitzar universos de prompts i metodologies diferents, de manera que els números absoluts no són comparables. Si compares, fes-ho per tendències i per troballes qualitatives (gaps temàtics) més que per scores.

Quin horitzó temporal és raonable per veure canvis?

Depèn del sector i de la font del coneixement (si és més “memòria” del model o més “cerca/cites”). Com a guia pràctica, treballa en cicles de setmanes per a hipòtesis i revisions, i en cicles de mesos per validar tendències.

Mindset como solución 360º para tu negocio