Marketing ABM con InsightRed
Repositorio de GitHub del Proyecto
Acerca de
InsightRed es una herramienta de Marketing Basado en Cuentas (ABM) impulsada por LLM que extrae los últimos comentarios de Reddit de Subreddits, ordenados por “Caliente”, y señala a los usuarios que muestran un interés potencial en tu proyecto o producto. Te ayuda a identificar y dirigir a usuarios de alto valor en Reddit para conseguir tus primeros usuarios para tu producto/proyecto. Este proyecto fue construido para el ANARCHY Hackathon de octubre de 2023.
Anuncio(s)
19 de octubre de 2023
Como seguimiento a este proyecto, ¡estoy emocionado de anunciar que ganamos el primer lugar en el Hackathon de octubre de 2023 de Anarchy!
Haz clic aquí para ver el mensaje en modo TEXTO (modificado debido al formato de Discord)
@everyone **👑 HACKATHON 👑**
¡Estoy muy emocionado de anunciar a los ganadores del segundo hackathon de anarquía como sigue:
🥇 "@Ben Zimmerman [T3CH3Y]", @Mehmet, y "@Ananya Aithal"'s InsightRed! https://www.youtube.com/watch?v=xhKwnKxmg5k
🥈 @partho y @Karan's DistillClassifier https://www.loom.com/share/d7e7c8e12dd14bcabdf41051433901a1?sid=900cb491-8117-4530-a131-d87eeca1ca6f
Realmente **TRABAJO INCREÍBLE A TODOS** @MathYouF y yo estamos muy impresionados por todas las presentaciones.
Menciones especiales para:
1. @B3LOL, @alastine, y @AndrewKamau 's WiE: https://youtu.be/V8gqCvgRcpk
2. "@Mert Bozkir | mertbozkir"'s Doc-String-Ify: https://www.loom.com/share/274565d0ddec417783e739ee728654d3?sid=6bb1b07a-f06a-4ec3-82c6-1d7ba6eae0d3
Los comentarios que recibimos de estos proyectos han sido muy valiosos y vamos a trabajar en corregir cada detalle 🦜
Vamos a contactar a los equipos individualmente para los premios. Además, creemos que estos fueron lo suficientemente increíbles como para que nos gustaría pasar las próximas semanas trabajando en mostrar estos increíbles proyectos.
Demostración
Componentes de InsightRed
🧩 Recolector
El Recolector recoge las últimas publicaciones de Reddit y los comentarios de esa publicación, para un Subreddit dado, utilizando la API de Reddit. Después de recolectar, el recolector guarda los datos recolectados en una base de datos SQLite local. Esto se facilita utilizando el paquete de python praw para ayudar con el uso de la API de Reddit y SQLAlchemy para realizar operaciones CRUD en la base de datos SQLite local.
🧩 Vectorizador
El Vectorizador verifica la base de datos SQLite local para ver qué comentarios no han sido guardados en la base de datos vectorial. Después de obtener una lista de comentarios, crea una incrustación de la publicación+comentario utilizando el modelo “text-embedding-ada-002” de OpenAI. Esta incrustación se utiliza como un Índice en la base de datos vectorial y también se crea algún metadato, en forma de JSON. El Índice y los metadatos se suben a la base de datos vectorial, que en este caso es Pinecone (basada en la nube). Después de ser subidos, la base de datos SQLite local se actualiza para evitar volver a subir los mismos datos a Pinecone. Todo esto se realiza utilizando el cliente de python de Pinecone (pinecone-client) para hacer opciones CRUD a la base de datos vectorial y LangChain para manejar el proceso de incrustación.
🧩 Interfaz
La interfaz es lo que utiliza el usuario para interactuar con la herramienta. En este caso, la interfaz es una CLI. La interfaz tiene una implementación de Generación Aumentada por Recuperación (RAG). Donde el usuario proporciona una descripción de su producto, una lista de Subreddits a verificar, así como algunos filtros. Dado este contexto, se llama al Recolector y luego se llama al Vectorizador. Después de que esos dos servicios hayan terminado de procesar, la descripción del producto ingresada se utiliza para hacer una búsqueda similar en la base de datos vectorial. Los mejores resultados y la descripción del producto se alimentan en una plantilla de aviso que crea el aviso final. El aviso final se envía al modelo GPT-4 de OpenAI y los resultados finales se presentan al usuario. Estos resultados serán una lista de todos los comentarios de Reddit que sugieren altamente que el/los usuario(s) de Reddit estarían interesados en el producto proporcionado, basado en su descripción. Este componente funciona utilizando los comentarios del Recolector y el Vectorizador, así como utilizando el LLM-VM de Anarchy para manejar las consultas al modelo GPT-4 de OpenAI.
Miembros del Equipo
Crédito Externo Notable
casta (Hacker News)
Proporcionando la inspiración para este proyecto a través de su publicación en HN. Dado que su solución no era de código abierto, me motivé a crear una versión de código abierto (este proyecto).
ChatGPT (GPT-4)
Fue muy útil en el desarrollo al acelerar realmente el ciclo de desarrollo. Y generó el logo del proyecto y la miniatura de YouTube utilizando el nuevo modelo DALL-E 3 de OpenAI.
James Briggs (YouTuber)
El video de James realmente explicó cómo usar la API de Reddit así como cómo implementar un pipeline básico de RAG utilizando Python.
Fuentes
- Mostrar HN: Proyecto Divertido del Día del Trabajo, Encuentra Comentarios de Reddit para Promover Tu Negocio
- Documentación de Visión General de Indexación de Pinecone
- YouTube: Chatbots con RAG - Recorrido Completo de LangChain
- Página de API de OpenAI
- Documentación de Inicio Rápido de Pinecone
- Reddit: Límites de tasa actualizados que entrarán en efecto en las próximas semanas
- Página de Aplicaciones de Reddit
- YouTube: Cómo Usar La API de Reddit en Python
- Medium: Extrayendo datos de Reddit usando la API de Reddit
- GitHub Gist: API de Reddit
- GitHub: praw
- ChatGPT - Aplicación Web