Skip to main content

Pipeline de Conhecimento da Make Talk

Aqui explicamos o fluxo completo de como a Make Talk transforma documentos, dados e integrações em uma IA inteligente e operacional — ótimo para documentação ou onboarding.

Fluxo completo: Do conhecimento à ação

1. Coleta de dados

A primeira etapa é reunir todas as fontes de conhecimento:
  • PDFs - Manuais, políticas, documentação técnica
  • Documentos - Textos estruturados sobre produtos e serviços
  • Textos enviados - Conteúdo adicional fornecido pela empresa
  • URLs - Páginas do site para coleta automática
  • Manuais - Documentação operacional
  • Políticas internas - Regras e diretrizes da empresa
O documento de treinamento sempre tem prioridade sobre informações coletadas do site, pois sites frequentemente têm informações desatualizadas.

2. Processamento e limpeza

Os documentos são processados e preparados:
  • Separação em trechos - Documentos grandes são divididos em partes menores e relevantes
  • Extração semântica - Identificação de conceitos e relações
  • Divisão inteligente - Quebra em unidades que fazem sentido contextualmente
  • Remoção de ruído - Limpeza de formatação desnecessária
Isso garante que a IA consiga encontrar informações relevantes rapidamente.

3. Vetorização (embeddings)

Cada trecho de conhecimento é transformado:
  • Representação numérica - Texto convertido em vetores matemáticos
  • Preservação de significado - Trechos semelhantes ficam próximos no espaço vetorial
  • Otimização para busca - Estrutura que permite busca rápida e precisa
Essa etapa é crucial para que a IA encontre informações relevantes mesmo quando a pergunta é formulada de forma diferente.

4. Armazenamento em base vetorial por cliente

O conhecimento processado é armazenado:
  • Base isolada - Cada cliente/hotel/organização tem sua própria base
  • Segurança - Informações são isoladas e protegidas
  • Personalização total - Cada base é única e específica
  • Escalabilidade - Suporta grandes volumes de conhecimento
Base isolada, segura e personalizada por cliente - Isso garante que informações de um cliente nunca sejam acessadas por outro e permite personalização completa.

5. Resgate inteligente (retrieval)

Quando o cliente faz uma pergunta:
  • Busca em tempo real - A IA procura apenas os trechos relevantes
  • Ranking por relevância - Os trechos mais relevantes são priorizados
  • Contexto completo - Múltiplos trechos podem ser combinados para resposta completa
  • Filtragem inteligente - Remove informações irrelevantes ou desatualizadas
Isso garante que a IA use apenas informações pertinentes para gerar a resposta.

6. Geração de resposta contextualizada

Com os trechos relevantes em mãos:
  • Síntese inteligente - O modelo combina informações de múltiplas fontes
  • Tom de voz - Aplica o tom e estilo definidos para a marca
  • Contexto da conversa - Considera o histórico da conversa
  • Resposta natural - Gera texto fluido e humanizado
A resposta é gerada somente com base na sua documentação, não inventada.

7. Ferramentas executam ações dinâmicas

Além de responder, a IA pode executar ações:
  • APIs - Consultar sistemas externos em tempo real
  • Cálculos - Realizar operações matemáticas e lógicas
  • Web scraping - Buscar informações atualizadas de páginas web
  • Consultas ao CRM - Acessar histórico e dados do cliente
  • Reservas - Verificar disponibilidade e fazer reservas
  • Preços - Consultar tarifas e calcular valores
  • Sistemas internos - Integrar com infraestrutura do cliente
Essas ações acontecem em tempo real, complementando o conhecimento estático do RAG.

8. Auditoria e logs

Tudo fica registrado para:
  • Segurança - Rastreabilidade completa das ações
  • Melhoria contínua - Identificar pontos de melhoria
  • Análise de desempenho - Métricas de acurácia e satisfação
  • Compliance - Registro para conformidade regulatória
  • Debugging - Facilitar identificação e correção de problemas

Diagrama do fluxo

┌─────────────────┐
│  Coleta de      │
│  Dados          │
│  (PDFs, docs,   │
│   URLs, textos) │
└────────┬────────┘


┌─────────────────┐
│  Processamento  │
│  e Limpeza      │
│  (Separação,    │
│   extração)     │
└────────┬────────┘


┌─────────────────┐
│  Vetorização    │
│  (Embeddings)   │
└────────┬────────┘


┌─────────────────┐
│  Armazenamento  │
│  (Base isolada  │
│   por cliente)  │
└────────┬────────┘


┌─────────────────┐      ┌─────────────────┐
│  Pergunta do    │─────▶│  Resgate        │
│  Cliente        │      │  Inteligente    │
└─────────────────┘      └────────┬────────┘

                    ┌─────────────┴─────────────┐
                    │                           │
                    ▼                           ▼
         ┌──────────────────┐      ┌──────────────────┐
         │  RAG: Busca na   │      │  Ferramentas:     │
         │  Base            │      │  Dados em tempo   │
         │  (Conhecimento   │      │  real, APIs,      │
         │   estático)      │      │  cálculos         │
         └────────┬─────────┘      └────────┬─────────┘
                  │                        │
                  └────────────┬───────────┘


                  ┌────────────────────┐
                  │  Geração de        │
                  │  Resposta          │
                  │  Contextualizada   │
                  └──────────┬─────────┘


                  ┌────────────────────┐
                  │  Execução de        │
                  │  Ações (se          │
                  │  necessário)        │
                  └──────────┬─────────┘


                  ┌────────────────────┐
                  │  Auditoria e        │
                  │  Logs               │
                  └────────────────────┘

Exemplo prático completo

Cenário: Cliente pergunta sobre disponibilidade e preço de um quarto de hotel.

Passo a passo:

  1. Coleta → Base contém informações sobre tipos de quartos, políticas, FAQs
  2. Processamento → Informações foram organizadas e indexadas
  3. Vetorização → Cada informação está em formato que permite busca rápida
  4. Armazenamento → Base isolada do hotel está pronta
  5. Pergunta do cliente: “Tem quarto deluxe disponível para 3 noites?”
  6. Resgate (RAG):
    • Busca informações sobre “quarto deluxe” na base
    • Encontra descrição, características, políticas
  7. Ferramentas (Tempo real):
    • Consulta sistema de reservas → Verifica disponibilidade
    • Consulta API de preços → Busca tarifas atualizadas
    • Calcula valor total → 3 noites × tarifa + taxas
    • Verifica promoções → Aplica descontos vigentes
  8. Geração de resposta:
    • Combina informações da base (RAG) + dados em tempo real (Ferramentas)
    • Aplica tom de voz da marca
    • Gera resposta natural e completa
  9. Ação (opcional):
    • Se cliente confirmar, pode registrar reserva no sistema
    • Criar lead no CRM
    • Enviar confirmação por email
  10. Auditoria:
    • Tudo é registrado nos logs
    • Métricas são atualizadas
    • Dados disponíveis para análise

Por que esse pipeline é importante?

Vantagens

  • Precisão - Combina conhecimento estático com dados dinâmicos
  • Atualização - Informações sempre atualizadas via ferramentas
  • Segurança - Base isolada por cliente
  • Rastreabilidade - Tudo é auditado
  • Escalabilidade - Suporta grandes volumes
  • Personalização - Cada cliente tem sua própria base

Resultado

Uma IA que:
  • ✅ Responde com base no conhecimento real da empresa
  • ✅ Acessa dados atualizados em tempo real
  • ✅ Executa ações operacionais
  • ✅ Não inventa informações
  • ✅ Aprende e melhora continuamente

Próximos passos