ORÁCULO no debe clonar Audiense (perdería en su único fuerte: el grafo de X). Debe ofrecer audience intelligence sobre la audiencia REAL del cliente (first-party) + simulación poblacional con HUM△NS — más barato, foco LATAM, y honesto sobre qué es medido vs modelado. Eso Audiense NO lo tiene.
Edad, género, ciudad, idioma, nombres — y a qué marcas/cuentas sigue la audiencia, todo vs. baseline.
Personalidad OCEAN (Big Five), valores Schwartz y 12 needs, inferidos del texto de tweets.
4–10 segmentos con persona propia, y hábitos online (device, horas activas, amplificación).
Es Official X Partner: grafo de seguidores + Decahose (~40M tweets/día) + base precomputada de 1,500M perfiles (11M/día). No consulta en vivo — lo tiene cacheado.
over-index = afinidad_audiencia / afinidad_baseline. 9.3× = siguen esa cuenta 9.3 veces más que la media. Su métrica Uniqueness premia lo distintivo y castiga lo mainstream (Walmart: afinidad alta, uniqueness baja).
Históricamente IBM Watson Personality Insights (LIWC + regresión sobre tweets propios). Watson murió en 2021 → lo reimplementaron con modelo propio. ⚠️ Válido como señal relativa agregada, NO diagnóstico individual (r≈0.2–0.4).
Louvain (community detection) sobre el grafo de follows internos → los segmentos emergen de la estructura social, no se eligen. Ese es el diferenciador metodológico vs. cortes demográficos.
Los algoritmos (Louvain, over-index, OCEAN) son commodity público. El foso es el DATO: acceso privilegiado y persistente al grafo de X + histórico desde 2006 + 1,500M perfiles + 90M ya scoreados. El cierre del API de X en 2023 (enterprise ~$42,000/mes) volvió ese dato casi imposible de reconstruir. Si copias su matemática, aún te falta lo que no puedes comprar barato: el grafo.
Seguidores propios del cliente, CRM, campañas, reviews. Limpio, ~$0 licencia, sin riesgo de ToS. Es el input primario y lo que el cliente más quiere ver.
OCEAN: LLM (MVP) → RoBERTa fine-tuned (número defendible) → Receptiviti/LIWC (sello). Segmentos con Leiden (mejor que Louvain). Over-index en SQL.
Genera la baseline poblacional (censo/Euromonitor), las personas y la expansión look-alike. Audiense NO tiene un motor sintético calibrado a censo.
Ingesta (Worker) → R2 → Workflows/Queues para enriquecimiento por lotes → Workers AI (OCEAN/redacción) + Vectorize (embeddings/clustering) + D1 (métricas/segmentos) → dashboard en Pages. Único hueco: Leiden + RoBERTa en un contenedor GPU externo. Todo lo demás, nativo.
Con lo que YA tienes (HUM△NS + Euromonitor): 3–6 arquetipos con demografía, OCEAN y afinidades hipotéticas, todo etiquetado. El 80% del esfuerzo va en la taxonomía de etiquetas de honestidad.
Inyectar el dato del cliente (BIA/CR3/Pilgrim's) y calibrar HUM△NS contra ground truth. Reporte híbrido lado a lado: modelado vs medido, con el delta como métrica de confianza.
Pipeline reproducible por marca/geo. Modelo comercial retainer, NO SaaS autoservicio (no hay dato en tiempo real que justifique suscripción tipo Audiense).
| Player | Precio 2026 | Qué es |
|---|---|---|
| Audiense | $12,000–28,750/año | Segmentación de audiencia social real (X) |
| Brandwatch | ~$36k–150k+/año | Social listening enterprise |
| SparkToro | $50–300/mes | "Dónde está tu audiencia" vía clickstream (no X API) |
| ORÁCULO (propuesto) | Add-on de estudio, < Audiense Base | First-party real + HUM△NS + foco LATAM, integrado al brand study |
Nunca un OCEAN modelado presentado como medido. Nada de scores de dos decimales que fingen precisión. Es a la vez rigor, diferenciador de venta y blindaje reputacional.