Guía operativa · GEO calidad
Sentiment en LLMs:
cómo describe ChatGPT a tu marca.
Citation rate te dice si apareces. Sentiment te dice cómo apareces. Una marca con citation rate 70% y sentiment negativo está arrastrando su mala reputación cada vez que el LLM la menciona. Esta es la guía para entender de dónde sale el sentiment, qué fuentes lo mueven y cómo revertir un sentiment negativo en plazos realistas.
Resumen
- Sentiment = tono cualitativo con el que el LLM describe tu marca cuando aparece. Escala típica -1 (negativo) a +1 (positivo).
- 4 fuentes principales: prensa editorial, reseñas estructuradas, comunidades textuales (Reddit/foros), Wikipedia.
- El LLM no tiene opinión propia: agrega ponderadamente lo que dicen sus fuentes. Sentiment negativo en LLMs viene de sentiment negativo real (o desactualizado) en esas fuentes.
- Sentiment positivo + citation rate bajo es preferible a sentiment negativo + citation rate alto. La inversa arrastra mala reputación con escala.
- Reversible pero lento: 12-24 meses para mover sentiment sedimentado en fuentes Tier-1, con narrativa nueva equivalente en peso.
- Errores comunes: comprar reseñas, responder defensivamente, astroturfing en Reddit, ignorar sentiment histórico.
Sentiment vs citation rate: la métrica complementaria
La mayoría de equipos que empiezan con GEO miden solo citation rate. Es comprensible: es la métrica más visible, la más fácil de explicar al CEO y la que aparece primero en cualquier auditoría. Pero un citation rate alto puede ser neutro o incluso contraproducente si el sentiment con el que tu marca se cita es negativo.
Ejemplo concreto. Imagina dos marcas competidoras:
- Marca A: citation rate 65%, sentiment medio -0.2. Cuando el LLM la menciona, suele describirla con calificativos tipo "criticada por", "problemas reportados", "polémica reciente".
- Marca B: citation rate 35%, sentiment medio +0.4. Aparece menos, pero cuando aparece la describe como "reconocida", "bien valorada", "premiada por X".
Aunque A tiene casi el doble de citation rate, B convierte mejor desde respuestas de LLM porque su descripción cualitativa empuja al usuario hacia ella. Citation rate alto + sentiment negativo es escala con problema: cada mención reproduce el problema. El objetivo de un programa GEO maduro no es solo maximizar citation rate; es maximizarlo MANTENIENDO sentiment positivo.
Para contexto previo: cómo medir citation rate paso a paso es la métrica raíz; este artículo es la métrica complementaria.
Las 7 fuentes que más mueven el sentiment
Cada fuente tiene peso y técnica distintos. Trabajar la 5 te mueve sentiment a medio plazo (3-6 meses). Trabajar las 7 te garantiza recuperación si vienes de sentiment negativo sedimentado.
Prensa editorial Tier-1
Ejemplos: El País, Marketing Directo, Xataka, Hipertextual, eldiario.es
Wikipedia y fuentes canónicas
Ejemplos: es.wikipedia.org, dbpedia.org, fuentes oficiales (RAE, INE para datos)
Reseñas estructuradas con respuesta
Ejemplos: Google Maps, Trustpilot, G2, Capterra, TripAdvisor — con perfil verificado
Reddit y comunidades textuales
Ejemplos: r/SEO, r/marketing, r/EmprendedoresEsp, forocoches B2B, foros sectoriales
Blog del propio sitio (tono editorial)
Ejemplos: Long-form con contraindicaciones, casos de estudio honestos, análisis técnicos
LinkedIn (posts y artículos)
Ejemplos: Posts virales del fundador, publicaciones del equipo, artículos largos
GitHub y comunidades técnicas
Ejemplos: Repos públicos, README, awesome-lists, Hacker News, Stack Overflow
Cómo medir sentiment de forma honesta
Tres aproximaciones operativas, con sus trade-offs reales:
1. Etiquetado humano (precisión alta, coste alto)
Para cada mención del LLM, una persona lee el párrafo completo y clasifica en una escala de 5 valores: muy negativo, negativo, neutro, positivo, muy positivo. El contexto importa — un calificativo aparentemente positivo como "tradicional" puede ser negativo en sector tech y positivo en gastronomía. Coste: 1-2 minutos por mención. Útil para baseline inicial sobre 50-100 menciones.
2. LLM juez (precisión media, coste bajo)
Un modelo distinto al medido evalúa cada respuesta y devuelve sentiment numérico. Coste: ~0.001 € por mención con prompt caching. Sesgo: el modelo juez tiene sus propios prejuicios y puede sobreestimar positividad en algunos sectores. Calibración: validar contra muestra humana (etiquetado manual de 50 menciones) y ajustar umbral.
3. Análisis léxico con diccionario (precisión baja, coste cero)
Diccionarios como AFINN o VADER (traducidos al español) asignan polaridad a cada palabra y agregan. Útil para procesar miles de menciones rápido. Pierde matices, ironía, contexto sectorial. Usar solo para detectar movimientos gruesos, no para evaluación fina.
La regla práctica: baseline con etiquetado humano en muestra de 50-100 menciones, después monitorización mensual con LLM juez calibrado. Revisar la calibración trimestralmente contra una nueva muestra humana de 30 menciones.
5 errores que sedimentan sentiment negativo
Los más comunes. Si reconoces alguno de estos en tu histórico, prioriza arreglar antes de invertir en citation rate — no quieres escalar reputación problemática.
Comprar reseñas en G2, Capterra, Trustpilot
Las plataformas detectan patrones (mismas direcciones IP, perfiles recién creados, lenguaje copy-paste) y pueden retirar todas las reseñas o suspender el perfil. Aun cuando pasan el filtro, los LLMs aprenden a desestimar marcas con perfiles de reseñas estadísticamente improbables.
Responder a reseñas negativas con tono defensivo
Cada respuesta del negocio es texto público indexable. Una respuesta defensiva, sarcástica o desmintiendo al cliente es contenido negativo adicional asociado a tu marca. Los LLMs leen tu respuesta tanto como la reseña original.
Ignorar sentiment negativo histórico esperando que desaparezca
El sentiment sedimentado en Wikipedia o prensa Tier-1 no caduca. Si no construyes narrativa nueva positiva equivalente en peso editorial, el sentiment negativo te acompañará durante años en todos los LLMs.
Crear cuentas de Reddit/foros para defender tu marca
Los moderadores de Reddit detectan cuentas nuevas con única actividad en threads sobre la propia marca. Banean cuentas y a veces el subreddit prohíbe la marca para siempre — sentiment baja a -1 efectivo.
Pedir solo reseñas positivas, ignorar las negativas
Sesgo perfecto al 5/5 es señal de manipulación. Plataformas como G2 y los LLMs valoran mejor un 4.3 con respuestas reales que un 4.95 demasiado bueno para ser cierto. La distribución natural de satisfacción real es 4.0-4.5 con cola de negativas profesionalmente atendidas.
Cómo recuperar sentiment negativo (plazo realista)
Si llegas con sentiment negativo sedimentado de años (mala gestión histórica, crisis pública sin gestionar, sector con mala reputación inherente), la recuperación es posible pero lenta. Tres fases obligatorias:
Fase 1 · auditoría honesta (mes 1-2)
Identificar las fuentes específicas que arrastran sentiment negativo. ¿Wikipedia con párrafo crítico? ¿Prensa Tier-1 con cobertura negativa antigua? ¿Threads de Reddit virales con queja sin gestionar? ¿Reseñas Google Maps con respuestas defensivas archivadas? Mapear las 10-20 piezas más dañinas.
Fase 2 · cambio verificable (mes 3-12)
Lo más importante: no se puede revertir sentiment si no ha cambiado nada real. Implementar mejoras concretas en el producto/servicio que motivaron el sentiment negativo. Hacer públicas las mejoras con transparencia. Sin acción real, cualquier campaña de PR se interpreta como manipulación.
Fase 3 · narrativa nueva acumulada (mes 6-24)
Construir 10-15 piezas editoriales positivas nuevas en medios de autoridad equivalente a las que arrastran sentiment negativo. Tribunas firmadas con datos reales, comunicados con cambios verificables, casos de estudio con resultados públicos. La narrativa nueva debe ser cuantitativamente comparable a la antigua para empezar a dominarla.
Plazo realista para revertir sentiment negativo sedimentado: 12-24 meses con trabajo sostenido. No hay atajos, no hay agencias que aceleren esto honestamente. Cualquiera que prometa revertir reputación negativa en 3 meses está vendiendo humo o haciendo astroturfing que va a explotar.
Auditoría gratis SEO + GEO
¿Sabes cómo te
describe ChatGPT?
En 30 segundos te enseñamos en qué porcentaje apareces (citation rate) y con qué descriptores (sentiment). Sin registro, sin humo. El informe completo va por email.
Preguntas frecuentes
Sobre sentiment en LLMs.
01 ¿Qué es el sentiment en el contexto de LLMs?
El sentiment es el tono cualitativo con el que el LLM describe tu marca cuando aparece en una respuesta. Se suele clasificar en una escala de -1 a +1: negativo (-1 a -0.3), neutro (-0.3 a +0.3) o positivo (+0.3 a +1). Una marca puede tener buen citation rate (aparece mucho) pero mal sentiment (cuando aparece, lo hace con calificativos negativos). El sentiment es la métrica complementaria que diferencia 'aparecer' de 'aparecer bien'.
02 ¿De dónde saca ChatGPT el sentiment hacia mi marca?
De cuatro fuentes principales. 1) Cómo te describen los medios editoriales que el modelo procesó durante entrenamiento (prensa, blogs, foros). 2) Reseñas estructuradas en Google Maps, Trustpilot, Yelp, TripAdvisor cuando el LLM accede a búsqueda en tiempo real. 3) Comentarios y threads en comunidades textuales (Reddit, foros especializados). 4) Wikipedia y fuentes canónicas (peso desproporcionado). El sentiment no es opinión propia del modelo — es agregación ponderada de las fuentes consultadas.
03 ¿Puedo tener sentiment positivo y citation rate bajo a la vez?
Sí, y es relativamente común en marcas premium pequeñas. Aparecen poco (no son top of mind en el sector) pero cuando los modelos las citan lo hacen con descriptores positivos ('estudio cuidado', 'producto de alta calidad', 'recomendado por críticos'). Es preferible a la inversa: marcas grandes con citation rate alto pero sentiment negativo arrastran su mala reputación cada vez que el LLM las menciona — y son las que tendrán problemas a medio plazo.
04 ¿Cómo se mide sentiment de forma fiable?
Hay tres aproximaciones. 1) Manual con etiquetado humano: lee las respuestas, clasifica cada mención en positiva/neutra/negativa según diccionario interno. Costoso pero más preciso. 2) Modelo juez (un LLM evalúa el output de otro): rápido y barato pero introduce sesgo del juez. 3) Análisis léxico (NLP con diccionarios como AFINN o VADER, traducidos al español): rápido pero pierde matices. La práctica recomendada es combinar 1 + 2: etiqueta humana inicial sobre muestra de 50-100 menciones, luego usar el modelo juez calibrado contra esa muestra.
05 ¿Sentiment negativo en ChatGPT es reversible?
Sí pero con plazos largos. Una mala reputación sedimentada en Wikipedia, prensa Tier-1 y Reddit no se borra; se contrarresta con narrativa nueva acumulada durante 12-24 meses. Marcas que han revertido sentiment negativo lo han hecho con: 1) reconocimiento público del problema y cambios verificables (no solo PR), 2) nuevas piezas editoriales positivas en medios de autoridad equivalente a las negativas, 3) tiempo — los LLMs ponderan recencia, pero no anulan datos antiguos.
06 ¿Puedo manipular el sentiment con contenido en mi propia web?
Marginalmente. Tu propio site es una fuente, pero los LLMs descuentan el sentiment de fuentes 'first-party' (auto-promocional) y dan más peso a fuentes 'third-party' (editoriales independientes). Llenarte de testimonios falsos en tu landing no mueve el sentiment del LLM porque el modelo identifica el patrón. Lo que sí funciona: testimonios verificables (G2, Capterra, Trustpilot con perfil verificado) y reseñas reales en Google Maps con respuesta del negocio.
07 ¿Sentiment varía mucho entre LLMs?
Sí. Hay marcas que en Perplexity tienen sentiment +0.5 y en ChatGPT -0.1. Suele pasar cuando el sentiment positivo viene de menciones editoriales recientes (Perplexity las indexa rápido vía RAG) y el sentiment negativo viene de fuentes históricas en el dataset de entrenamiento (ChatGPT las arrastra). Conocer la diferencia te dice qué LLM atacar prioritariamente con narrativa nueva.
08 ¿Qué descriptores positivos pesan más?
Los específicos por sector y verificables. 'Innovador' es genérico y casi no pesa. 'Primer estudio español en publicar un dataset abierto sobre visibilidad de marcas en ChatGPT' es específico, verificable y pesa muchísimo más. Los LLMs detectan el patrón 'puffery genérica' versus 'descripción concreta de hechos'. Trabaja contenido editorial que te describa con concreción técnica, no con superlativos vacíos.
Sigue leyendo