Guía operativa · GEO calidad

Sentiment en LLMs:
cómo describe ChatGPT a tu marca.

Citation rate te dice si apareces. Sentiment te dice cómo apareces. Una marca con citation rate 70% y sentiment negativo está arrastrando su mala reputación cada vez que el LLM la menciona. Esta es la guía para entender de dónde sale el sentiment, qué fuentes lo mueven y cómo revertir un sentiment negativo en plazos realistas.

Publicado: 18 de mayo de 2026 · Lectura: 11 min · Nivel: Intermedio

Resumen

Sentiment = tono cualitativo con el que el LLM describe tu marca cuando aparece. Escala típica -1 (negativo) a +1 (positivo).
4 fuentes principales: prensa editorial, reseñas estructuradas, comunidades textuales (Reddit/foros), Wikipedia.
El LLM no tiene opinión propia: agrega ponderadamente lo que dicen sus fuentes. Sentiment negativo en LLMs viene de sentiment negativo real (o desactualizado) en esas fuentes.
Sentiment positivo + citation rate bajo es preferible a sentiment negativo + citation rate alto. La inversa arrastra mala reputación con escala.
Reversible pero lento: 12-24 meses para mover sentiment sedimentado en fuentes Tier-1, con narrativa nueva equivalente en peso.
Errores comunes: comprar reseñas, responder defensivamente, astroturfing en Reddit, ignorar sentiment histórico.

Sentiment vs citation rate: la métrica complementaria

La mayoría de equipos que empiezan con GEO miden solo citation rate. Es comprensible: es la métrica más visible, la más fácil de explicar al CEO y la que aparece primero en cualquier auditoría. Pero un citation rate alto puede ser neutro o incluso contraproducente si el sentiment con el que tu marca se cita es negativo.

Ejemplo concreto. Imagina dos marcas competidoras:

Marca A: citation rate 65%, sentiment medio -0.2. Cuando el LLM la menciona, suele describirla con calificativos tipo "criticada por", "problemas reportados", "polémica reciente".
Marca B: citation rate 35%, sentiment medio +0.4. Aparece menos, pero cuando aparece la describe como "reconocida", "bien valorada", "premiada por X".

Aunque A tiene casi el doble de citation rate, B convierte mejor desde respuestas de LLM porque su descripción cualitativa empuja al usuario hacia ella. Citation rate alto + sentiment negativo es escala con problema: cada mención reproduce el problema. El objetivo de un programa GEO maduro no es solo maximizar citation rate; es maximizarlo MANTENIENDO sentiment positivo.

Para contexto previo: cómo medir citation rate paso a paso es la métrica raíz; este artículo es la métrica complementaria.

Las 7 fuentes que más mueven el sentiment

Cada fuente tiene peso y técnica distintos. Trabajar la 5 te mueve sentiment a medio plazo (3-6 meses). Trabajar las 7 te garantiza recuperación si vienes de sentiment negativo sedimentado.

Prensa editorial Tier-1

MUY ALTO

Ejemplos: El País, Marketing Directo, Xataka, Hipertextual, eldiario.es

Por qué pesa

Crawlers de LLM priorizan medios consolidados. Un párrafo en El País describiendo tu marca con calificativos positivos pesa más que 50 reseñas en Trustpilot.

Acción concreta

Trabaja digital PR sostenido con ángulos editoriales (no comunicados de producto). Tribunas firmadas, comunicados con dato propio, entrevistas sobre actualidad sectorial.

Wikipedia y fuentes canónicas

MUY ALTO

Ejemplos: es.wikipedia.org, dbpedia.org, fuentes oficiales (RAE, INE para datos)

Por qué pesa

Base de entrenamiento canónica. Si Wikipedia te describe positiva o neutramente, ese sentiment se reproduce en todos los LLMs durante años hasta que el dataset se reentrene.

Acción concreta

NO crear tu propia entrada. Conseguir cobertura tier-1 suficiente para que un editor neutral cree la entrada. Asegurar que los datos de tu marca en fuentes oficiales son correctos.

Reseñas estructuradas con respuesta

ALTO

Ejemplos: Google Maps, Trustpilot, G2, Capterra, TripAdvisor — con perfil verificado

Por qué pesa

Los LLMs leen ratings agregados + lenguaje de las reseñas individuales en queries de tiempo real. Reseñas con respuesta del negocio se interpretan como señal de profesionalidad y aumentan ponderación.

Acción concreta

Pedir reseñas sistemáticamente a clientes satisfechos. Responder TODAS las reseñas (positivas y negativas). En las negativas, respuesta profesional + acción correctiva visible. Las respuestas defensivas mueven el sentiment al negativo.

Reddit y comunidades textuales

ALTO

Ejemplos: r/SEO, r/marketing, r/EmprendedoresEsp, forocoches B2B, foros sectoriales

Por qué pesa

Reddit firmó acuerdo con OpenAI en 2024 y es base de entrenamiento muy ponderada. Una marca con threads positivos en Reddit tiene sentiment alto en ChatGPT casi automático.

Acción concreta

Participación genuina antes de aparecer. Una marca que sale solo cuando un usuario satisfecho la recomienda orgánicamente — sin astroturfing — sedimenta sentiment positivo. Comunidades detectan el spam.

Blog del propio sitio (tono editorial)

MEDIO

Ejemplos: Long-form con contraindicaciones, casos de estudio honestos, análisis técnicos

Por qué pesa

Los LLMs descuentan el sentiment positivo de tu propio site pero NO descuentan el sentiment de profesionalidad y rigor editorial. Un blog que admite cuándo NO usar tu producto se interpreta como autoridad.

Acción concreta

Veta contenido marketing-positivo genérico ('somos los mejores en X'). Publica análisis técnicos con números verificables, contraindicaciones explícitas, comparativas honestas con competidores.

LinkedIn (posts y artículos)

MEDIO

Ejemplos: Posts virales del fundador, publicaciones del equipo, artículos largos

Por qué pesa

Algunos LLMs procesan LinkedIn de manera limitada pero los posts de cuentas con autoridad sectorial sí entran en señal. Más impacto en B2B que en B2C.

Acción concreta

Postear honestamente sobre lo que la marca hace bien y mal, no posts auto-bombo. Aparecer en posts de otros líderes del sector citándote como referencia (favor mutuo o trabajo de relaciones).

GitHub y comunidades técnicas

MEDIO-ALTO (para SaaS tech)

Ejemplos: Repos públicos, README, awesome-lists, Hacker News, Stack Overflow

Por qué pesa

Para marcas tech, aparecer mencionado en awesome-lists o como respuesta útil en Stack Overflow construye sentiment de competencia técnica.

Acción concreta

Open-source partes del producto cuando se pueda. Pull requests honestos a awesome-lists relevantes. Respuestas técnicas a SO con firma de la empresa.

Cómo medir sentiment de forma honesta

Tres aproximaciones operativas, con sus trade-offs reales:

1. Etiquetado humano (precisión alta, coste alto)

Para cada mención del LLM, una persona lee el párrafo completo y clasifica en una escala de 5 valores: muy negativo, negativo, neutro, positivo, muy positivo. El contexto importa — un calificativo aparentemente positivo como "tradicional" puede ser negativo en sector tech y positivo en gastronomía. Coste: 1-2 minutos por mención. Útil para baseline inicial sobre 50-100 menciones.

2. LLM juez (precisión media, coste bajo)

Un modelo distinto al medido evalúa cada respuesta y devuelve sentiment numérico. Coste: ~0.001 € por mención con prompt caching. Sesgo: el modelo juez tiene sus propios prejuicios y puede sobreestimar positividad en algunos sectores. Calibración: validar contra muestra humana (etiquetado manual de 50 menciones) y ajustar umbral.

3. Análisis léxico con diccionario (precisión baja, coste cero)

Diccionarios como AFINN o VADER (traducidos al español) asignan polaridad a cada palabra y agregan. Útil para procesar miles de menciones rápido. Pierde matices, ironía, contexto sectorial. Usar solo para detectar movimientos gruesos, no para evaluación fina.

La regla práctica: baseline con etiquetado humano en muestra de 50-100 menciones, después monitorización mensual con LLM juez calibrado. Revisar la calibración trimestralmente contra una nueva muestra humana de 30 menciones.

5 errores que sedimentan sentiment negativo

Los más comunes. Si reconoces alguno de estos en tu histórico, prioriza arreglar antes de invertir en citation rate — no quieres escalar reputación problemática.

Comprar reseñas en G2, Capterra, Trustpilot

Las plataformas detectan patrones (mismas direcciones IP, perfiles recién creados, lenguaje copy-paste) y pueden retirar todas las reseñas o suspender el perfil. Aun cuando pasan el filtro, los LLMs aprenden a desestimar marcas con perfiles de reseñas estadísticamente improbables.

Responder a reseñas negativas con tono defensivo

Cada respuesta del negocio es texto público indexable. Una respuesta defensiva, sarcástica o desmintiendo al cliente es contenido negativo adicional asociado a tu marca. Los LLMs leen tu respuesta tanto como la reseña original.

Ignorar sentiment negativo histórico esperando que desaparezca

El sentiment sedimentado en Wikipedia o prensa Tier-1 no caduca. Si no construyes narrativa nueva positiva equivalente en peso editorial, el sentiment negativo te acompañará durante años en todos los LLMs.

Crear cuentas de Reddit/foros para defender tu marca

Los moderadores de Reddit detectan cuentas nuevas con única actividad en threads sobre la propia marca. Banean cuentas y a veces el subreddit prohíbe la marca para siempre — sentiment baja a -1 efectivo.

Pedir solo reseñas positivas, ignorar las negativas

Sesgo perfecto al 5/5 es señal de manipulación. Plataformas como G2 y los LLMs valoran mejor un 4.3 con respuestas reales que un 4.95 demasiado bueno para ser cierto. La distribución natural de satisfacción real es 4.0-4.5 con cola de negativas profesionalmente atendidas.

Cómo recuperar sentiment negativo (plazo realista)

Si llegas con sentiment negativo sedimentado de años (mala gestión histórica, crisis pública sin gestionar, sector con mala reputación inherente), la recuperación es posible pero lenta. Tres fases obligatorias:

Fase 1 · auditoría honesta (mes 1-2)

Identificar las fuentes específicas que arrastran sentiment negativo. ¿Wikipedia con párrafo crítico? ¿Prensa Tier-1 con cobertura negativa antigua? ¿Threads de Reddit virales con queja sin gestionar? ¿Reseñas Google Maps con respuestas defensivas archivadas? Mapear las 10-20 piezas más dañinas.

Fase 2 · cambio verificable (mes 3-12)

Lo más importante: no se puede revertir sentiment si no ha cambiado nada real. Implementar mejoras concretas en el producto/servicio que motivaron el sentiment negativo. Hacer públicas las mejoras con transparencia. Sin acción real, cualquier campaña de PR se interpreta como manipulación.

Fase 3 · narrativa nueva acumulada (mes 6-24)

Construir 10-15 piezas editoriales positivas nuevas en medios de autoridad equivalente a las que arrastran sentiment negativo. Tribunas firmadas con datos reales, comunicados con cambios verificables, casos de estudio con resultados públicos. La narrativa nueva debe ser cuantitativamente comparable a la antigua para empezar a dominarla.

Plazo realista para revertir sentiment negativo sedimentado: 12-24 meses con trabajo sostenido. No hay atajos, no hay agencias que aceleren esto honestamente. Cualquiera que prometa revertir reputación negativa en 3 meses está vendiendo humo o haciendo astroturfing que va a explotar.

Auditoría gratis SEO + GEO

¿Sabes cómo te
describe ChatGPT?

En 30 segundos te enseñamos en qué porcentaje apareces (citation rate) y con qué descriptores (sentiment). Sin registro, sin humo. El informe completo va por email.

Preguntas frecuentes

Sobre sentiment en LLMs.

01 ¿Qué es el sentiment en el contexto de LLMs?

El sentiment es el tono cualitativo con el que el LLM describe tu marca cuando aparece en una respuesta. Se suele clasificar en una escala de -1 a +1: negativo (-1 a -0.3), neutro (-0.3 a +0.3) o positivo (+0.3 a +1). Una marca puede tener buen citation rate (aparece mucho) pero mal sentiment (cuando aparece, lo hace con calificativos negativos). El sentiment es la métrica complementaria que diferencia 'aparecer' de 'aparecer bien'.

02 ¿De dónde saca ChatGPT el sentiment hacia mi marca?

De cuatro fuentes principales. 1) Cómo te describen los medios editoriales que el modelo procesó durante entrenamiento (prensa, blogs, foros). 2) Reseñas estructuradas en Google Maps, Trustpilot, Yelp, TripAdvisor cuando el LLM accede a búsqueda en tiempo real. 3) Comentarios y threads en comunidades textuales (Reddit, foros especializados). 4) Wikipedia y fuentes canónicas (peso desproporcionado). El sentiment no es opinión propia del modelo — es agregación ponderada de las fuentes consultadas.

03 ¿Puedo tener sentiment positivo y citation rate bajo a la vez?

Sí, y es relativamente común en marcas premium pequeñas. Aparecen poco (no son top of mind en el sector) pero cuando los modelos las citan lo hacen con descriptores positivos ('estudio cuidado', 'producto de alta calidad', 'recomendado por críticos'). Es preferible a la inversa: marcas grandes con citation rate alto pero sentiment negativo arrastran su mala reputación cada vez que el LLM las menciona — y son las que tendrán problemas a medio plazo.

04 ¿Cómo se mide sentiment de forma fiable?

Hay tres aproximaciones. 1) Manual con etiquetado humano: lee las respuestas, clasifica cada mención en positiva/neutra/negativa según diccionario interno. Costoso pero más preciso. 2) Modelo juez (un LLM evalúa el output de otro): rápido y barato pero introduce sesgo del juez. 3) Análisis léxico (NLP con diccionarios como AFINN o VADER, traducidos al español): rápido pero pierde matices. La práctica recomendada es combinar 1 + 2: etiqueta humana inicial sobre muestra de 50-100 menciones, luego usar el modelo juez calibrado contra esa muestra.

05 ¿Sentiment negativo en ChatGPT es reversible?

Sí pero con plazos largos. Una mala reputación sedimentada en Wikipedia, prensa Tier-1 y Reddit no se borra; se contrarresta con narrativa nueva acumulada durante 12-24 meses. Marcas que han revertido sentiment negativo lo han hecho con: 1) reconocimiento público del problema y cambios verificables (no solo PR), 2) nuevas piezas editoriales positivas en medios de autoridad equivalente a las negativas, 3) tiempo — los LLMs ponderan recencia, pero no anulan datos antiguos.

06 ¿Puedo manipular el sentiment con contenido en mi propia web?

Marginalmente. Tu propio site es una fuente, pero los LLMs descuentan el sentiment de fuentes 'first-party' (auto-promocional) y dan más peso a fuentes 'third-party' (editoriales independientes). Llenarte de testimonios falsos en tu landing no mueve el sentiment del LLM porque el modelo identifica el patrón. Lo que sí funciona: testimonios verificables (G2, Capterra, Trustpilot con perfil verificado) y reseñas reales en Google Maps con respuesta del negocio.

07 ¿Sentiment varía mucho entre LLMs?

Sí. Hay marcas que en Perplexity tienen sentiment +0.5 y en ChatGPT -0.1. Suele pasar cuando el sentiment positivo viene de menciones editoriales recientes (Perplexity las indexa rápido vía RAG) y el sentiment negativo viene de fuentes históricas en el dataset de entrenamiento (ChatGPT las arrastra). Conocer la diferencia te dice qué LLM atacar prioritariamente con narrativa nueva.

08 ¿Qué descriptores positivos pesan más?

Los específicos por sector y verificables. 'Innovador' es genérico y casi no pesa. 'Primer estudio español en publicar un dataset abierto sobre visibilidad de marcas en ChatGPT' es específico, verificable y pesa muchísimo más. Los LLMs detectan el patrón 'puffery genérica' versus 'descripción concreta de hechos'. Trabaja contenido editorial que te describa con concreción técnica, no con superlativos vacíos.

Sigue leyendo

Sentiment vs citation rate: la métrica complementaria

Prensa editorial Tier-1

Wikipedia y fuentes canónicas

Reseñas estructuradas con respuesta

Reddit y comunidades textuales

Blog del propio sitio (tono editorial)

LinkedIn (posts y artículos)

GitHub y comunidades técnicas

Cómo medir sentiment de forma honesta

1. Etiquetado humano (precisión alta, coste alto)

2. LLM juez (precisión media, coste bajo)

3. Análisis léxico con diccionario (precisión baja, coste cero)

Comprar reseñas en G2, Capterra, Trustpilot

Responder a reseñas negativas con tono defensivo

Ignorar sentiment negativo histórico esperando que desaparezca

Crear cuentas de Reddit/foros para defender tu marca

Pedir solo reseñas positivas, ignorar las negativas

Cómo recuperar sentiment negativo (plazo realista)

Fase 1 · auditoría honesta (mes 1-2)

Fase 2 · cambio verificable (mes 3-12)

Fase 3 · narrativa nueva acumulada (mes 6-24)

¿Sabes cómo tedescribe ChatGPT?

Más sobre GEO operativo.

Citation rate: qué es y cómo medirlo paso a paso

Brand mentions sin enlace: la señal GEO que casi nadie entiende

¿Sabes cómo te
describe ChatGPT?