ORÁCULO · TDI
Blueprint · Audience Intelligence · Análisis de 3 auditores

Qué hace Audiense, cómo lo hace,
y qué puede implementar ORÁCULO.

Ingeniería inversa de Audiense + arquitectura para ORÁCULO + factibilidad, verificado con su documentación, precios reales y el marco legal mexicano. La conclusión corta: el valor de Audiense no es su tecnología — es su acceso al dato de X. Ese no se copia. Pero ORÁCULO puede ganar por otro lado.
Veredicto

ORÁCULO no debe clonar Audiense (perdería en su único fuerte: el grafo de X). Debe ofrecer audience intelligence sobre la audiencia REAL del cliente (first-party) + simulación poblacional con HUM△NS — más barato, foco LATAM, y honesto sobre qué es medido vs modelado. Eso Audiense NO lo tiene.

01 · Qué hace Audiense
Toma los seguidores de una marca en X/Twitter y produce un reporte de audiencia. (El PDF analizado: Pilgrim's México.)

Demografía + afinidades

Edad, género, ciudad, idioma, nombres — y a qué marcas/cuentas sigue la audiencia, todo vs. baseline.

Psicográficos

Personalidad OCEAN (Big Five), valores Schwartz y 12 needs, inferidos del texto de tweets.

Segmentos + hábitos

4–10 segmentos con persona propia, y hábitos online (device, horas activas, amplificación).

02 · Cómo lo hace (verificado con su doc)

Fuente del dato

Es Official X Partner: grafo de seguidores + Decahose (~40M tweets/día) + base precomputada de 1,500M perfiles (11M/día). No consulta en vivo — lo tiene cacheado.

Afinidad / over-index

over-index = afinidad_audiencia / afinidad_baseline. 9.3× = siguen esa cuenta 9.3 veces más que la media. Su métrica Uniqueness premia lo distintivo y castiga lo mainstream (Walmart: afinidad alta, uniqueness baja).

OCEAN / valores / needs

Históricamente IBM Watson Personality Insights (LIWC + regresión sobre tweets propios). Watson murió en 2021 → lo reimplementaron con modelo propio. ⚠️ Válido como señal relativa agregada, NO diagnóstico individual (r≈0.2–0.4).

Segmentación

Louvain (community detection) sobre el grafo de follows internos → los segmentos emergen de la estructura social, no se eligen. Ese es el diferenciador metodológico vs. cortes demográficos.

El moat real — lo único que no se copia

Los algoritmos (Louvain, over-index, OCEAN) son commodity público. El foso es el DATO: acceso privilegiado y persistente al grafo de X + histórico desde 2006 + 1,500M perfiles + 90M ya scoreados. El cierre del API de X en 2023 (enterprise ~$42,000/mes) volvió ese dato casi imposible de reconstruir. Si copias su matemática, aún te falta lo que no puedes comprar barato: el grafo.

03 · Qué puede implementar ORÁCULO — el modelo híbrido
No comprar el mismo dato (no se puede al precio actual). Ganar por otro lado: el dato real del propio cliente + el motor sintético que Audiense no tiene.

① Dato real = FIRST-PARTY

Seguidores propios del cliente, CRM, campañas, reviews. Limpio, ~$0 licencia, sin riesgo de ToS. Es el input primario y lo que el cliente más quiere ver.

② Enriquecimiento ML propio

OCEAN: LLM (MVP) → RoBERTa fine-tuned (número defendible) → Receptiviti/LIWC (sello). Segmentos con Leiden (mejor que Louvain). Over-index en SQL.

③ HUM△NS = el diferenciador

Genera la baseline poblacional (censo/Euromonitor), las personas y la expansión look-alike. Audiense NO tiene un motor sintético calibrado a censo.

Corre en el stack Cloudflare que ORÁCULO ya usa

Ingesta (Worker) → R2 → Workflows/Queues para enriquecimiento por lotes → Workers AI (OCEAN/redacción) + Vectorize (embeddings/clustering) + D1 (métricas/segmentos) → dashboard en Pages. Único hueco: Leiden + RoBERTa en un contenedor GPU externo. Todo lo demás, nativo.

04 · Roadmap por fases
F1 · POC

Reporte sintético honesto

Con lo que YA tienes (HUM△NS + Euromonitor): 3–6 arquetipos con demografía, OCEAN y afinidades hipotéticas, todo etiquetado. El 80% del esfuerzo va en la taxonomía de etiquetas de honestidad.

2–4 semanas · 1 analista
F2 · Piloto

Dato real first-party

Inyectar el dato del cliente (BIA/CR3/Pilgrim's) y calibrar HUM△NS contra ground truth. Reporte híbrido lado a lado: modelado vs medido, con el delta como métrica de confianza.

6–12 semanas · +1 data eng + costo dato
F3 · Producto

Servicio recurrente

Pipeline reproducible por marca/geo. Modelo comercial retainer, NO SaaS autoservicio (no hay dato en tiempo real que justifique suscripción tipo Audiense).

3–6 meses+ · solo si F2 valida
05 · Precio y posición
PlayerPrecio 2026Qué es
Audiense$12,000–28,750/añoSegmentación de audiencia social real (X)
Brandwatch~$36k–150k+/añoSocial listening enterprise
SparkToro$50–300/mes"Dónde está tu audiencia" vía clickstream (no X API)
ORÁCULO (propuesto)Add-on de estudio, < Audiense BaseFirst-party real + HUM△NS + foco LATAM, integrado al brand study
Dónde NO competir: volumen de dato social en tiempo real, "quién sigue a quién" a escala global. Dónde SÍ: LATAM/México + híbrido sintético-real + integración con el estudio de marca y Euromonitor.
06 · Guardas de honestidad y legal — el moat que sí controlas

Badge por dato (obligatorio en cada cifra)

🔵 OBSERVADO — dato real (first-party / listening licenciado). Cita fuente y n.🟡 INFERIDO — ML sobre texto real (con banda de incertidumbre).🟢 SIMULADO — salida de HUM△NS (hipótesis calibrada).

Nunca un OCEAN modelado presentado como medido. Nada de scores de dos decimales que fingen precisión. Es a la vez rigor, diferenciador de venta y blindaje reputacional.

Líneas rojas (legal + reputación)
ORÁCULO · TDI (Tlapalería de Ideas) — Blueprint de Audience Intelligence. Síntesis de 3 auditores (ingeniería inversa de método, arquitectura de datos/ML, factibilidad/legal), verificado con documentación de Audiense, IBM (deprecación Watson), cambios del API de X 2023–2026, pricing público (G2/Vendr/SparkToro), papers de Big Five (RoBERTa/BIG5-TPoT), Leiden (Traag et al. 2019) y la nueva LFPDPPP (EY/KPMG). Documento de estrategia interna — no contractual.