Account-Based Marketing (ABM) gamit ang InsightRed
Tungkol
InsightRed ay isang LLM-powered na tool para sa Marketing na Nakatuon sa Account (Account-Based Marketing, ABM) na kumukuha ng pinakabagong mga komento sa Reddit mula sa mga Subreddit, inayos ayon sa “Hot”, at tinutukoy ang mga gumagamit na nagpapakita ng potensyal na interes sa iyong proyekto o produkto. Tinutulungan ka nitong tukuyin at i-target ang mga mahahalagang gumagamit sa Reddit upang makuha ang iyong mga unang user para sa iyong produkto/proyekto. Ang proyektong ito ay ginawa para sa ANARCHY Oktubre 2023 Hackathon.
Anunsyo
Oktubre 19, 2023
Bilang karugtong sa proyektong ito, ikinagagalak kong ianunsyo na kami ang nanalo ng unang puwesto sa hackathon ng Anarchy noong Oktubre 2023!
I-click dito upang makita ang mensahe sa MODE TEKSTO (na binago dahil sa pag-format ng Discord)
@everyone **👑 HACKATHON 👑**
I'm very excited to announce the second anarchy hackathon's winners as follows:
🥇 "@Ben Zimmerman [T3CH3Y]", @Mehmet, and "@Ananya Aithal"'s InsightRed! https://www.youtube.com/watch?v=xhKwnKxmg5k
🥈 @partho and @Karan's DistillClassifier https://www.loom.com/share/d7e7c8e12dd14bcabdf41051433901a1?sid=900cb491-8117-4530-a131-d87eeca1ca6f
Really **AMAZING WORK EVERYBODY** @MathYouF and I were super impressed by all the submissions.
Special mentions go out to:
1. @B3LOL, @alastine , and @AndrewKamau 's WiE: https://youtu.be/V8gqCvgRcpk
2. "@Mert Bozkir | mertbozkir"'s Doc-String-Ify: https://www.loom.com/share/274565d0ddec417783e739ee728654d3?sid=6bb1b07a-f06a-4ec3-82c6-1d7ba6eae0d3
The feedback we got from these projects has been super valuable and we're going to work on fixing every bit 🦜
We're going to reach out to the teams individually for prizes. Additionally, we think these were incredible enough that we'd like to spend the next few weeks working on showcasing these incredible projects.
Demonstrasyon
Mga Komponent ng InsightRed
🧩 Kolektor
Ang Kolektor ay kumukuha ng pinakabagong mga post sa Reddit at mga komento ng post na iyon, para sa isang ibinigay na mga Subreddit, gamit ang API ng Reddit. Matapos kolektahin, isinasave ng kolektor ang nakalipong data sa isang lokal na SQLite database. Pinapadali ito sa pamamagitan ng paggamit ng Python package na praw para tumulong sa paggamit ng Reddit API at SQLAlchemy para sa pagganap ng mga operasyon ng CRUD sa lokal na SQLite database.
🧩 Vektorizer
Tiningnan ng Vektorizer ang lokal na SQLite database upang makita kung aling mga komento ang hindi pa naisusumite sa vector database. Pagkatapos makakuha ng listahan ng mga komento, gumagawa ito ng embedding ng post+komento gamit ang modelong “text-embedding-ada-002” ng OpenAI. Ang embedding na ito ay ginagamit bilang isang Index sa vector database at ang ilang metadata, sa anyo ng isang JSON, ay nilikha rin. Ang Index at metadata ay pagkatapos nai-upload sa vector database, na sa kasong ito ay Pinecone (cloud-based). Pagkatapos ma-upload, ina-update ang lokal na SQLite database upang maiwasan ang muling pag-upload ng parehong data sa Pinecone. Lahat ng ito ay ginagawa gamit ang pinecone Python client (pinecone-client) para gumawa ng mga CRUD na opsyon sa vector database at LangChain para sa paghawak ng proseso ng embedding.
🧩 Interface
Ang interface ang ginagamit ng gumagamit para makipag-ugnayan sa tool. Sa kasong ito, ang interface ay isang CLI. Ang interface ay may implementasyon ng Retrieval-Augmented-Generation (RAG). Kung saan nagbibigay ang gumagamit ng paglalarawan ng kanilang produkto, isang listahan ng mga Subreddit na susuriin, pati na rin ang ilang mga filter. Ibinigay ang kontekstong ito, tinatawag ang Kolektor at pagkatapos ay tinatawag ang Vektorizer. Pagkatapos matapos ng dalawang serbisyong iyon ang pagproseso, ang inilagay na paglalarawan ng produkto ay ginagamit para gumawa ng isang katulad na paghahanap sa vector database. Ang mga nangungunang resulta at ang paglalarawan ng produkto ay ipapasok sa isang prompt template na lumilikha ng panghuling prompt. Ang panghuling prompt ay ipinapadala sa GPT-4 na modelo ng OpenAI at ang panghuling mga resulta ay ipinapakita sa gumagamit. Ang mga resultang ito ay magiging listahan ng lahat ng mga komento sa Reddit na mataas ang posibilidad na nagpapahiwatig na ang mga gumagamit ng Reddit ay magkakainteres sa ibinigay na produkto, batay sa paglalarawan nito. Gumagana ang komponent na ito sa pamamagitan ng paggamit ng mga komento mula sa Kolektor at Vektorizer, pati na rin sa pamamagitan ng paggamit ng LLM-VM ng Anarchy para hawakan ang pag-query sa GPT-4 na modelo ng OpenAI.
Mga Miyembro ng Koponan
Mga Kapuri-puring Kredito mula sa Labas
casta (Hacker News)
Nagbigay ng inspirasyon para sa proyektong ito sa pamamagitan ng kanilang post sa Hacker News. Dahil ang kanilang solusyon ay hindi open-source, naudyok ako na lumikha ng isang open-source na bersyon (ang proyektong ito).
ChatGPT (GPT-4)
Malaking tulong sa pag-develop sa pamamagitan ng mabilis na pagpapaikli ng dev cycle. At nilikha nito ang logo ng proyekto at ang thumbnail ng YouTube gamit ang bagong DALL-E 3 model ng OpenAI.
James Briggs (YouTuber)
Ang video ni James ay talagang nagpaliwanag kung paano gamitin ang API ng Reddit pati na rin kung paano magpatupad ng isang basic na RAG pipeline gamit ang Python.
Mga Pinagmulan
- Show HN: Labor Day Fun Project, Hanapin ang mga Komento sa Reddit para I-promote ang Iyong Negosyo
- Pinecone Indexing Overview Docs
- YouTube: Chatbots with RAG - LangChain Full Walkthrough
- OpenAI API Page
- Pinecone Quickstart Docs
- Reddit: Updated rate limits going into effect over the coming weeks
- Reddit Apps Page
- YouTube: How-to Use The Reddit API in Python
- Medium: Scraping Reddit data using Reddit API
- GitHub Gist: Reddit API
- GitHub: praw
- ChatGPT - Web App