Marketing ABM com InsightRed

Repositório GitHub do Projeto

Sobre

InsightRed é uma ferramenta de Marketing Baseado em Conta (ABM) alimentada por LLM que extrai os comentários mais recentes do Reddit de Subreddits, classificados por “Quente”, e identifica usuários que demonstram potencial interesse em seu projeto ou produto. Ele ajuda você a identificar e direcionar usuários de alto valor no Reddit para conseguir seus usuários iniciais para seu produto/projeto. Este projeto foi construído para o ANARCHY Hackathon de Outubro de 2023.

Anúncio(s)

19 de Outubro de 2023

Como um acompanhamento deste projeto, estou animado para anunciar que ganhamos o 1º lugar no Hackathon de Outubro de 2023 da Anarchy!

Clique aqui para ver a mensagem em modo TEXTO (modificada devido à formatação do Discord)
@everyone **👑 HACKATHON 👑**

Estou muito animado para anunciar os vencedores do segundo hackathon da anarquia, conforme segue:

🥇 "@Ben Zimmerman [T3CH3Y]", @Mehmet, e "@Ananya Aithal"'s InsightRed! https://www.youtube.com/watch?v=xhKwnKxmg5k

🥈 @partho e @Karan's DistillClassifier https://www.loom.com/share/d7e7c8e12dd14bcabdf41051433901a1?sid=900cb491-8117-4530-a131-d87eeca1ca6f

Realmente **TRABALHO INCRÍVEL A TODOS** @MathYouF e eu ficamos super impressionados com todas as submissões.

Menções especiais vão para:

1. @B3LOL, @alastine, e @AndrewKamau 's WiE: https://youtu.be/V8gqCvgRcpk
2. "@Mert Bozkir | mertbozkir"'s Doc-String-Ify: https://www.loom.com/share/274565d0ddec417783e739ee728654d3?sid=6bb1b07a-f06a-4ec3-82c6-1d7ba6eae0d3

O feedback que recebemos desses projetos foi super valioso e vamos trabalhar para corrigir cada detalhe 🦜

Vamos entrar em contato com as equipes individualmente para prêmios. Além disso, achamos que esses projetos foram incríveis o suficiente para que gostaríamos de passar as próximas semanas trabalhando na apresentação desses projetos incríveis.

Demonstração

Componentes do InsightRed

🧩 Coletor

O Coletor coleta as postagens mais recentes do Reddit e os comentários dessa postagem, para um determinado Subreddit, usando a API do Reddit. Após a coleta, o coletor salva os dados coletados em um banco de dados SQLite local. Isso é facilitado pelo uso do pacote python praw para auxiliar no uso da API do Reddit e SQLAlchemy para realizar operações CRUD no banco de dados SQLite local.

🧩 Vetorizador

O Vetorizador verifica o banco de dados SQLite local para ver quais comentários não foram salvos no banco de dados vetorial. Após obter uma lista de comentários, ele cria uma incorporação da postagem+comentário usando o modelo “text-embedding-ada-002” da OpenAI. Essa incorporação é usada como um Índice no banco de dados vetorial e alguns metadados, na forma de um JSON, também são criados. O Índice e os metadados são então enviados para o banco de dados vetorial, que neste caso é Pinecone (baseado em nuvem). Após ser enviado, o banco de dados SQLite local é atualizado para evitar o reenvio dos mesmos dados para o Pinecone. Tudo isso é feito usando o cliente python do Pinecone (pinecone-client) para fazer opções CRUD no banco de dados vetorial e LangChain para gerenciar o processo de incorporação.

🧩 Interface

A interface é o que é usado pelo usuário para interagir com a ferramenta. Neste caso, a interface é uma CLI. A interface tem uma implementação de Geração Aumentada por Recuperação (RAG). Onde o usuário fornece uma descrição de seu produto, uma lista de Subreddits a serem verificados, bem como alguns filtros. Dado esse contexto, o Coletor é chamado e então o Vetorizador é chamado. Após esses dois serviços terminarem o processamento, a descrição do produto inserida é usada para fazer uma busca semelhante no banco de dados vetorial. Os principais resultados e a descrição do produto são então alimentados em um modelo de prompt que cria o prompt final. O prompt final é então enviado para o modelo GPT-4 da OpenAI e os resultados finais são apresentados ao usuário. Esses resultados serão uma lista de todos os comentários do Reddit que sugerem fortemente que o(s) usuário(s) do Reddit estariam interessados no produto fornecido, com base em sua descrição. Este componente funciona usando os comentários do Coletor e do Vetorizador, bem como usando o LLM-VM da Anarchy para gerenciar a consulta ao modelo GPT-4 da OpenAI.

Membros da Equipe

Crédito Externo Notável

casta (Hacker News)

Fornecendo a inspiração para este projeto através de seu post no HN. Como sua solução não era de código aberto, fui motivado a criar uma versão de código aberto (este projeto).

ChatGPT (GPT-4)

Foi muito útil no desenvolvimento, acelerando realmente o ciclo de desenvolvimento. E gerou o logotipo do projeto e a miniatura do YouTube usando o novo modelo DALL-E 3 da OpenAI.

James Briggs (YouTuber)

O vídeo de James realmente explicou como usar a API do Reddit, bem como como implementar um pipeline básico de RAG usando Python.

Fontes