Marketing ABM con InsightRed

Repository GitHub del progetto

Informazioni

InsightRed è uno strumento di Account-Based Marketing (ABM) potenziato da LLM che estrae i commenti più recenti di Reddit dai subreddit, ordinati per “Hot”, e individua gli utenti che mostrano potenziale interesse per il tuo progetto o prodotto. Ti aiuta a identificare e mirare agli utenti ad alto valore su Reddit per ottenere i tuoi primi utenti per il tuo prodotto/progetto. Questo progetto è stato realizzato per l’Hackathon ANARCHY di ottobre 2023.

Annunci

19 ottobre 2023

A seguito di questo progetto, sono entusiasta di annunciare che abbiamo vinto il primo posto all’Hackathon Anarchy di ottobre 2023!

Clicca qui per visualizzare il messaggio in modalità TESTO (modificato a causa del formato di Discord)
@everyone **👑 HACKATHON 👑**

I'm very excited to announce the second anarchy hackathon's winners as follows:

🥇 "@Ben Zimmerman [T3CH3Y]", @Mehmet, and "@Ananya Aithal"'s InsightRed! https://www.youtube.com/watch?v=xhKwnKxmg5k

🥈 @partho and @Karan's  DistillClassifier https://www.loom.com/share/d7e7c8e12dd14bcabdf41051433901a1?sid=900cb491-8117-4530-a131-d87eeca1ca6f

Really **AMAZING WORK EVERYBODY** @MathYouF and I were super impressed by all the submissions.

Special mentions go out to:

1. @B3LOL, @alastine , and @AndrewKamau 's WiE: https://youtu.be/V8gqCvgRcpk
2. "@Mert Bozkir | mertbozkir"'s Doc-String-Ify: https://www.loom.com/share/274565d0ddec417783e739ee728654d3?sid=6bb1b07a-f06a-4ec3-82c6-1d7ba6eae0d3

The feedback we got from these projects has been super valuable and we're going to work on fixing every bit 🦜

We're going to reach out to the teams individually for prizes. Additionally, we think these were incredible enough that we'd like to spend the next few weeks working on showcasing these incredible projects.

Dimostrazione

Componenti di InsightRed

🧩 Raccoglitore

Il Raccoglitore raccoglie i post più recenti di Reddit e i commenti di quei post, per uno specifico insieme di subreddit, utilizzando l’API di Reddit. Dopo la raccolta, il raccoglitore salva i dati raccolti in un database SQLite locale. Questo è reso semplice dall’utilizzo del pacchetto Python praw per assistere nell’uso dell’API di Reddit e di SQLAlchemy per eseguire operazioni CRUD nel database SQLite locale.

🧩 Vettorizzatore

Il Vettorizzatore controlla il database SQLite locale per vedere quali commenti non sono stati ancora salvati nel database vettoriale. Dopo aver ottenuto una lista di commenti, crea un embedding del post+commento usando il modello di OpenAI “text-embedding-ada-002”. Questo embedding è usato come indice nel database vettoriale e viene creato anche qualche metadata, sotto forma di JSON. L’indice e i metadata vengono poi caricati nel database vettoriale, che in questo caso è Pinecone (cloud). Dopo il caricamento, il database SQLite locale viene aggiornato per evitare di ricaricare gli stessi dati su Pinecone. Tutto ciò viene fatto utilizzando il client Python di Pinecone (pinecone-client) per eseguire operazioni CRUD sul database vettoriale e LangChain per gestire il processo di embedding.

🧩 Interfaccia

L’interfaccia è ciò che viene usato dall’utente per interagire con lo strumento. In questo caso, l’interfaccia è una CLI. L’interfaccia implementa la Generazione arricchita dal recupero (RAG). Dove l’utente fornisce una descrizione del proprio prodotto, una lista di subreddit da controllare, oltre ad alcuni filtri. Dato questo contesto, viene chiamato prima il Raccoglitore e poi il Vettorizzatore. Dopo che questi due servizi hanno terminato l’elaborazione, la descrizione del prodotto inserita viene utilizzata per effettuare una ricerca simile nel database vettoriale. I risultati principali e la descrizione del prodotto vengono quindi inseriti in un modello di prompt che crea il prompt finale. Il prompt finale viene poi inviato al modello GPT-4 di OpenAI e i risultati finali vengono presentati all’utente. Questi risultati saranno un elenco di tutti i commenti Reddit che suggeriscono fortemente che gli utenti di Reddit sarebbero interessati al prodotto fornito, sulla base della sua descrizione. Questo componente funziona utilizzando i commenti del Raccoglitore e del Vettorizzatore, e inoltre utilizzando l’LLM-VM di Anarchy per gestire le interrogazioni al modello GPT-4 di OpenAI.

Membri del team

Riconoscimenti esterni notevoli

casta (Hacker News)

Fornendo l’ispirazione per questo progetto tramite il loro post su HN. Poiché la loro soluzione non era open-source, sono stato motivato a creare una versione open-source (questo progetto).

ChatGPT (GPT-4)

È stato molto utile nello sviluppo accelerando davvero il ciclo di sviluppo. E ha generato il logo del progetto e l’immagine di anteprima di YouTube utilizzando il nuovo modello DALL-E 3 di OpenAI.

James Briggs (YouTuber)

Il video di James ha davvero spiegato come usare l’API di Reddit e come implementare una pipeline RAG di base usando Python.

Fonti