InsightRed के साथ ABM मार्केटिंग

प्रोजेक्ट का GitHub Repo

बारे में

InsightRed एक LLM-संचालित खाता-आधारित मार्केटिंग (ABM) टूल है जो सबरेडिट्स से नवीनतम Reddit टिप्पणियों को “हॉट” के अनुसार क्रमबद्ध करता है, और उन उपयोगकर्ताओं को लक्षित करता है जो आपके प्रोजेक्ट या उत्पाद में संभावित रुचि दिखाते हैं। यह आपको Reddit पर उच्च-मूल्य वाले उपयोगकर्ताओं की पहचान करने और लक्षित करने में मदद करता है ताकि आप अपने उत्पाद/प्रोजेक्ट के लिए प्रारंभिक उपयोगकर्ता प्राप्त कर सकें। यह प्रोजेक्ट ANARCHY अक्टूबर 2023 हैकाथॉन के लिए बनाया गया था।

घोषणा(एं)

19 अक्टूबर 2023

इस प्रोजेक्ट के बाद, मुझे यह घोषणा करते हुए खुशी हो रही है कि हम Anarchy के अक्टूबर 2023 हैकाथॉन में पहले स्थान पर रहे!

यहां क्लिक करें TEXT मोड में संदेश देखने के लिए (Discord के फॉर्मेटिंग के कारण संशोधित)
@everyone **👑 हैकाथॉन 👑**

मुझे यह घोषणा करते हुए बहुत खुशी हो रही है कि दूसरे अराजकता हैकाथॉन के विजेताओं की सूची इस प्रकार है:

🥇 "@Ben Zimmerman [T3CH3Y]", @Mehmet, और "@Ananya Aithal"'s InsightRed! https://www.youtube.com/watch?v=xhKwnKxmg5k

🥈 @partho और @Karan का DistillClassifier https://www.loom.com/share/d7e7c8e12dd14bcabdf41051433901a1?sid=900cb491-8117-4530-a131-d87eeca1ca6f

सभी का **शानदार काम** @MathYouF और मैं सभी प्रस्तुतियों से बहुत प्रभावित हुए।

विशेष उल्लेख:

1. @B3LOL, @alastine, और @AndrewKamau का WiE: https://youtu.be/V8gqCvgRcpk
2. "@Mert Bozkir | mertbozkir"'s Doc-String-Ify: https://www.loom.com/share/274565d0ddec417783e739ee728654d3?sid=6bb1b07a-f06a-4ec3-82c6-1d7ba6eae0d3

इन प्रोजेक्ट्स से हमें जो फीडबैक मिला है, वह बहुत मूल्यवान रहा है और हम हर एक चीज को ठीक करने पर काम करेंगे 🦜

हम पुरस्कारों के लिए टीमों से व्यक्तिगत रूप से संपर्क करेंगे। इसके अतिरिक्त, हमें लगता है कि ये इतने अद्भुत थे कि हम अगले कुछ हफ्तों में इन अद्भुत प्रोजेक्ट्स को प्रदर्शित करने पर काम करना चाहेंगे।

डेमो

InsightRed के घटक

🧩 कलेक्टर

कलेक्टर एक दिए गए सबरेडिट्स के लिए नवीनतम Reddit पोस्ट और उस पोस्ट की टिप्पणियों को Reddit के API का उपयोग करके एकत्र करता है। एकत्र करने के बाद, कलेक्टर एक स्थानीय SQLite डेटाबेस में एकत्रित डेटा को सहेजता है। यह Reddit API का उपयोग करने में मदद करने के लिए python पैकेज praw और स्थानीय SQLite डेटाबेस में CRUD ऑपरेशनों को करने के लिए SQLAlchemy का उपयोग करके आसान बनाया गया है।

🧩 वेक्टराइज़र

वेक्टराइज़र स्थानीय SQLite डेटाबेस की जांच करता है कि कौन सी टिप्पणियाँ वेक्टर डेटाबेस में सहेजी नहीं गई हैं। टिप्पणियों की एक सूची प्राप्त करने के बाद, यह OpenAI के “text-embedding-ada-002” मॉडल का उपयोग करके पोस्ट+टिप्पणी का एक एम्बेडिंग बनाता है। यह एम्बेडिंग वेक्टर डेटाबेस में एक इंडेक्स के रूप में उपयोग की जाती है और कुछ मेटाडेटा, JSON के रूप में भी बनाया जाता है। इंडेक्स और मेटाडेटा फिर वेक्टर डेटाबेस में अपलोड किया जाता है, जो इस मामले में Pinecone (क्लाउड-आधारित) है। अपलोड होने के बाद, स्थानीय SQLite डेटाबेस को अपडेट किया जाता है ताकि Pinecone में समान डेटा को फिर से अपलोड करने से बचा जा सके। यह सब Pinecone के python क्लाइंट (pinecone-client) का उपयोग करके वेक्टर डेटाबेस के लिए CRUD विकल्प बनाने और LangChain का उपयोग करके एम्बेडिंग प्रक्रिया को संभालने के लिए किया जाता है।

🧩 इंटरफेस

इंटरफेस वह है जिसका उपयोग उपयोगकर्ता टूल के साथ बातचीत करने के लिए करता है। इस मामले में, इंटरफेस एक CLI है। इंटरफेस में Retrieval-Augmented-Generation (RAG) का कार्यान्वयन है। जहां उपयोगकर्ता अपने उत्पाद का विवरण, जांचने के लिए सबरेडिट्स की एक सूची, साथ ही कुछ फ़िल्टर प्रदान करता है। इस संदर्भ में, कलेक्टर को कॉल किया जाता है फिर वेक्टराइज़र को कॉल किया जाता है। जब ये दोनों सेवाएँ प्रोसेसिंग कर लेती हैं, तो इनपुट किया गया उत्पाद विवरण वेक्टर डेटाबेस में समान रूप से खोज करने के लिए उपयोग किया जाता है। शीर्ष परिणाम और उत्पाद विवरण फिर एक प्रॉम्प्ट टेम्पलेट में फीड किए जाते हैं जो अंतिम प्रॉम्प्ट बनाता है। अंतिम प्रॉम्प्ट फिर OpenAI के GPT-4 मॉडल को भेजा जाता है और अंतिम परिणाम उपयोगकर्ता को प्रस्तुत किए जाते हैं। ये परिणाम सभी Reddit टिप्पणियों की एक सूची होगी जो यह सुझाव देती है कि Reddit उपयोगकर्ता(ओं) को प्रदान किए गए उत्पाद में रुचि हो सकती है, इसके विवरण के आधार पर। यह घटक कलेक्टर और वेक्टराइज़र टिप्पणियों का उपयोग करके काम करता है, साथ ही Anarchy के LLM-VM का उपयोग करके OpenAI के GPT-4 मॉडल को क्वेरी करने के लिए।

टीम के सदस्य

उल्लेखनीय बाहरी श्रेय

कास्टा (हैकर न्यूज़)

इस प्रोजेक्ट के लिए प्रेरणा प्रदान करना उनके HN पोस्ट के माध्यम से। चूंकि उनका समाधान ओपन-सोर्स नहीं था, मुझे एक ओपन-सोर्स संस्करण (यह प्रोजेक्ट) बनाने के लिए प्रेरित किया गया।

ChatGPT (GPT-4)

विकास में बहुत मददगार रहा, वास्तव में विकास चक्र को तेज किया। और इसने OpenAI के नए DALL-E 3 मॉडल का उपयोग करके प्रोजेक्ट का लोगो और YouTube थंबनेल उत्पन्न किया।

जेम्स ब्रिग्स (YouTuber)

जेम्स का वीडियो वास्तव में Reddit के API का उपयोग करने के तरीके और Python का उपयोग करके एक बुनियादी RAG पाइपलाइन को लागू करने के तरीके को समझाता है।

स्रोत