Marketing ABM con InsightRed
Repository GitHub del progetto
Informazioni
InsightRed è uno strumento di Account-Based Marketing (ABM) potenziato da LLM che estrae i commenti più recenti di Reddit dai subreddit, ordinati per “Hot”, e individua gli utenti che mostrano potenziale interesse per il tuo progetto o prodotto. Ti aiuta a identificare e mirare agli utenti ad alto valore su Reddit per ottenere i tuoi primi utenti per il tuo prodotto/progetto. Questo progetto è stato realizzato per l’Hackathon ANARCHY di ottobre 2023.
Annunci
19 ottobre 2023
A seguito di questo progetto, sono entusiasta di annunciare che abbiamo vinto il primo posto all’Hackathon Anarchy di ottobre 2023!
Clicca qui per visualizzare il messaggio in modalità TESTO (modificato a causa del formato di Discord)
@everyone **👑 HACKATHON 👑**
I'm very excited to announce the second anarchy hackathon's winners as follows:
🥇 "@Ben Zimmerman [T3CH3Y]", @Mehmet, and "@Ananya Aithal"'s InsightRed! https://www.youtube.com/watch?v=xhKwnKxmg5k
🥈 @partho and @Karan's DistillClassifier https://www.loom.com/share/d7e7c8e12dd14bcabdf41051433901a1?sid=900cb491-8117-4530-a131-d87eeca1ca6f
Really **AMAZING WORK EVERYBODY** @MathYouF and I were super impressed by all the submissions.
Special mentions go out to:
1. @B3LOL, @alastine , and @AndrewKamau 's WiE: https://youtu.be/V8gqCvgRcpk
2. "@Mert Bozkir | mertbozkir"'s Doc-String-Ify: https://www.loom.com/share/274565d0ddec417783e739ee728654d3?sid=6bb1b07a-f06a-4ec3-82c6-1d7ba6eae0d3
The feedback we got from these projects has been super valuable and we're going to work on fixing every bit 🦜
We're going to reach out to the teams individually for prizes. Additionally, we think these were incredible enough that we'd like to spend the next few weeks working on showcasing these incredible projects.
Dimostrazione
Componenti di InsightRed
🧩 Raccoglitore
Il Raccoglitore raccoglie i post più recenti di Reddit e i commenti di quei post, per uno specifico insieme di subreddit, utilizzando l’API di Reddit. Dopo la raccolta, il raccoglitore salva i dati raccolti in un database SQLite locale. Questo è reso semplice dall’utilizzo del pacchetto Python praw per assistere nell’uso dell’API di Reddit e di SQLAlchemy per eseguire operazioni CRUD nel database SQLite locale.
🧩 Vettorizzatore
Il Vettorizzatore controlla il database SQLite locale per vedere quali commenti non sono stati ancora salvati nel database vettoriale. Dopo aver ottenuto una lista di commenti, crea un embedding del post+commento usando il modello di OpenAI “text-embedding-ada-002”. Questo embedding è usato come indice nel database vettoriale e viene creato anche qualche metadata, sotto forma di JSON. L’indice e i metadata vengono poi caricati nel database vettoriale, che in questo caso è Pinecone (cloud). Dopo il caricamento, il database SQLite locale viene aggiornato per evitare di ricaricare gli stessi dati su Pinecone. Tutto ciò viene fatto utilizzando il client Python di Pinecone (pinecone-client) per eseguire operazioni CRUD sul database vettoriale e LangChain per gestire il processo di embedding.
🧩 Interfaccia
L’interfaccia è ciò che viene usato dall’utente per interagire con lo strumento. In questo caso, l’interfaccia è una CLI. L’interfaccia implementa la Generazione arricchita dal recupero (RAG). Dove l’utente fornisce una descrizione del proprio prodotto, una lista di subreddit da controllare, oltre ad alcuni filtri. Dato questo contesto, viene chiamato prima il Raccoglitore e poi il Vettorizzatore. Dopo che questi due servizi hanno terminato l’elaborazione, la descrizione del prodotto inserita viene utilizzata per effettuare una ricerca simile nel database vettoriale. I risultati principali e la descrizione del prodotto vengono quindi inseriti in un modello di prompt che crea il prompt finale. Il prompt finale viene poi inviato al modello GPT-4 di OpenAI e i risultati finali vengono presentati all’utente. Questi risultati saranno un elenco di tutti i commenti Reddit che suggeriscono fortemente che gli utenti di Reddit sarebbero interessati al prodotto fornito, sulla base della sua descrizione. Questo componente funziona utilizzando i commenti del Raccoglitore e del Vettorizzatore, e inoltre utilizzando l’LLM-VM di Anarchy per gestire le interrogazioni al modello GPT-4 di OpenAI.
Membri del team
Riconoscimenti esterni notevoli
casta (Hacker News)
Fornendo l’ispirazione per questo progetto tramite il loro post su HN. Poiché la loro soluzione non era open-source, sono stato motivato a creare una versione open-source (questo progetto).
ChatGPT (GPT-4)
È stato molto utile nello sviluppo accelerando davvero il ciclo di sviluppo. E ha generato il logo del progetto e l’immagine di anteprima di YouTube utilizzando il nuovo modello DALL-E 3 di OpenAI.
James Briggs (YouTuber)
Il video di James ha davvero spiegato come usare l’API di Reddit e come implementare una pipeline RAG di base usando Python.
Fonti
- Show HN: Progetto divertente del Labor Day, Trova commenti Reddit per promuovere la tua attività
- Documentazione panoramica sull’indicizzazione di Pinecone
- YouTube: Chatbot con RAG - Guida completa a LangChain
- Pagina API di OpenAI
- Documentazione Quickstart di Pinecone
- Reddit: Limiti di velocità aggiornati che entreranno in vigore nelle prossime settimane
- Pagina delle App di Reddit
- YouTube: Come usare l’API di Reddit in Python
- Medium: Estrazione di dati Reddit usando l’API di Reddit
- GitHub Gist: API di Reddit
- GitHub: praw
- ChatGPT - Applicazione Web