Pipeline de Conhecimento

Pipeline de Conhecimento da Make Talk

Aqui explicamos o fluxo completo de como a Make Talk transforma documentos, dados e integrações em uma IA inteligente e operacional — ótimo para documentação ou onboarding.

Fluxo completo: Do conhecimento à ação

1. Coleta de dados

A primeira etapa é reunir todas as fontes de conhecimento:

PDFs - Manuais, políticas, documentação técnica
Documentos - Textos estruturados sobre produtos e serviços
Textos enviados - Conteúdo adicional fornecido pela empresa
URLs - Páginas do site para coleta automática
Manuais - Documentação operacional
Políticas internas - Regras e diretrizes da empresa

O documento de treinamento sempre tem prioridade sobre informações coletadas do site, pois sites frequentemente têm informações desatualizadas.

2. Processamento e limpeza

Os documentos são processados e preparados:

Separação em trechos - Documentos grandes são divididos em partes menores e relevantes
Extração semântica - Identificação de conceitos e relações
Divisão inteligente - Quebra em unidades que fazem sentido contextualmente
Remoção de ruído - Limpeza de formatação desnecessária

Isso garante que a IA consiga encontrar informações relevantes rapidamente.

3. Vetorização (embeddings)

Cada trecho de conhecimento é transformado:

Representação numérica - Texto convertido em vetores matemáticos
Preservação de significado - Trechos semelhantes ficam próximos no espaço vetorial
Otimização para busca - Estrutura que permite busca rápida e precisa

Essa etapa é crucial para que a IA encontre informações relevantes mesmo quando a pergunta é formulada de forma diferente.

4. Armazenamento em base vetorial por cliente

O conhecimento processado é armazenado:

Base isolada - Cada cliente/hotel/organização tem sua própria base
Segurança - Informações são isoladas e protegidas
Personalização total - Cada base é única e específica
Escalabilidade - Suporta grandes volumes de conhecimento

Base isolada, segura e personalizada por cliente - Isso garante que informações de um cliente nunca sejam acessadas por outro e permite personalização completa.

5. Resgate inteligente (retrieval)

Quando o cliente faz uma pergunta:

Busca em tempo real - A IA procura apenas os trechos relevantes
Ranking por relevância - Os trechos mais relevantes são priorizados
Contexto completo - Múltiplos trechos podem ser combinados para resposta completa
Filtragem inteligente - Remove informações irrelevantes ou desatualizadas

Isso garante que a IA use apenas informações pertinentes para gerar a resposta.

6. Geração de resposta contextualizada

Com os trechos relevantes em mãos:

Síntese inteligente - O modelo combina informações de múltiplas fontes
Tom de voz - Aplica o tom e estilo definidos para a marca
Contexto da conversa - Considera o histórico da conversa
Resposta natural - Gera texto fluido e humanizado

A resposta é gerada somente com base na sua documentação, não inventada.

7. Ferramentas executam ações dinâmicas

Além de responder, a IA pode executar ações:

APIs - Consultar sistemas externos em tempo real
Cálculos - Realizar operações matemáticas e lógicas
Web scraping - Buscar informações atualizadas de páginas web
Consultas ao CRM - Acessar histórico e dados do cliente
Reservas - Verificar disponibilidade e fazer reservas
Preços - Consultar tarifas e calcular valores
Sistemas internos - Integrar com infraestrutura do cliente

Essas ações acontecem em tempo real, complementando o conhecimento estático do RAG.

8. Auditoria e logs

Tudo fica registrado para:

Segurança - Rastreabilidade completa das ações
Melhoria contínua - Identificar pontos de melhoria
Análise de desempenho - Métricas de acurácia e satisfação
Compliance - Registro para conformidade regulatória
Debugging - Facilitar identificação e correção de problemas

Diagrama do fluxo

┌─────────────────┐
│  Coleta de      │
│  Dados          │
│  (PDFs, docs,   │
│   URLs, textos) │
└────────┬────────┘
         │
         ▼
┌─────────────────┐
│  Processamento  │
│  e Limpeza      │
│  (Separação,    │
│   extração)     │
└────────┬────────┘
         │
         ▼
┌─────────────────┐
│  Vetorização    │
│  (Embeddings)   │
└────────┬────────┘
         │
         ▼
┌─────────────────┐
│  Armazenamento  │
│  (Base isolada  │
│   por cliente)  │
└────────┬────────┘
         │
         ▼
┌─────────────────┐      ┌─────────────────┐
│  Pergunta do    │─────▶│  Resgate        │
│  Cliente        │      │  Inteligente    │
└─────────────────┘      └────────┬────────┘
                                  │
                    ┌─────────────┴─────────────┐
                    │                           │
                    ▼                           ▼
         ┌──────────────────┐      ┌──────────────────┐
         │  RAG: Busca na   │      │  Ferramentas:     │
         │  Base            │      │  Dados em tempo   │
         │  (Conhecimento   │      │  real, APIs,      │
         │   estático)      │      │  cálculos         │
         └────────┬─────────┘      └────────┬─────────┘
                  │                        │
                  └────────────┬───────────┘
                               │
                               ▼
                  ┌────────────────────┐
                  │  Geração de        │
                  │  Resposta          │
                  │  Contextualizada   │
                  └──────────┬─────────┘
                              │
                              ▼
                  ┌────────────────────┐
                  │  Execução de        │
                  │  Ações (se          │
                  │  necessário)        │
                  └──────────┬─────────┘
                              │
                              ▼
                  ┌────────────────────┐
                  │  Auditoria e        │
                  │  Logs               │
                  └────────────────────┘

Exemplo prático completo

Cenário: Cliente pergunta sobre disponibilidade e preço de um quarto de hotel.

Passo a passo:

Coleta → Base contém informações sobre tipos de quartos, políticas, FAQs
Processamento → Informações foram organizadas e indexadas
Vetorização → Cada informação está em formato que permite busca rápida
Armazenamento → Base isolada do hotel está pronta
Pergunta do cliente: “Tem quarto deluxe disponível para 3 noites?”
Resgate (RAG):
- Busca informações sobre “quarto deluxe” na base
- Encontra descrição, características, políticas
Ferramentas (Tempo real):
- Consulta sistema de reservas → Verifica disponibilidade
- Consulta API de preços → Busca tarifas atualizadas
- Calcula valor total → 3 noites × tarifa + taxas
- Verifica promoções → Aplica descontos vigentes
Geração de resposta:
- Combina informações da base (RAG) + dados em tempo real (Ferramentas)
- Aplica tom de voz da marca
- Gera resposta natural e completa
Ação (opcional):
- Se cliente confirmar, pode registrar reserva no sistema
- Criar lead no CRM
- Enviar confirmação por email
Auditoria:
- Tudo é registrado nos logs
- Métricas são atualizadas
- Dados disponíveis para análise

Por que esse pipeline é importante?

Vantagens

Precisão - Combina conhecimento estático com dados dinâmicos
Atualização - Informações sempre atualizadas via ferramentas
Segurança - Base isolada por cliente
Rastreabilidade - Tudo é auditado
Escalabilidade - Suporta grandes volumes
Personalização - Cada cliente tem sua própria base

Resultado

Uma IA que:

✅ Responde com base no conhecimento real da empresa
✅ Acessa dados atualizados em tempo real
✅ Executa ações operacionais
✅ Não inventa informações
✅ Aprende e melhora continuamente

Próximos passos

O que é RAG?

Entenda a base de conhecimento.

Ferramentas e Integrações

Veja como a IA vai além do RAG.

Como funciona a IA

Visão completa da tecnologia.

Criar base eficiente

Boas práticas para sua base.

Comece Aqui

Treinamento da IA

Operação

Administradores

Relatórios