InsightRed के साथ ABM मार्केटिंग
बारे में
InsightRed एक LLM-संचालित खाता-आधारित मार्केटिंग (ABM) टूल है जो सबरेडिट्स से नवीनतम Reddit टिप्पणियों को “हॉट” के अनुसार क्रमबद्ध करता है, और उन उपयोगकर्ताओं को लक्षित करता है जो आपके प्रोजेक्ट या उत्पाद में संभावित रुचि दिखाते हैं। यह आपको Reddit पर उच्च-मूल्य वाले उपयोगकर्ताओं की पहचान करने और लक्षित करने में मदद करता है ताकि आप अपने उत्पाद/प्रोजेक्ट के लिए प्रारंभिक उपयोगकर्ता प्राप्त कर सकें। यह प्रोजेक्ट ANARCHY अक्टूबर 2023 हैकाथॉन के लिए बनाया गया था।
घोषणा(एं)
19 अक्टूबर 2023
इस प्रोजेक्ट के बाद, मुझे यह घोषणा करते हुए खुशी हो रही है कि हम Anarchy के अक्टूबर 2023 हैकाथॉन में पहले स्थान पर रहे!
यहां क्लिक करें TEXT मोड में संदेश देखने के लिए (Discord के फॉर्मेटिंग के कारण संशोधित)
@everyone **👑 हैकाथॉन 👑**
मुझे यह घोषणा करते हुए बहुत खुशी हो रही है कि दूसरे अराजकता हैकाथॉन के विजेताओं की सूची इस प्रकार है:
🥇 "@Ben Zimmerman [T3CH3Y]", @Mehmet, और "@Ananya Aithal"'s InsightRed! https://www.youtube.com/watch?v=xhKwnKxmg5k
🥈 @partho और @Karan का DistillClassifier https://www.loom.com/share/d7e7c8e12dd14bcabdf41051433901a1?sid=900cb491-8117-4530-a131-d87eeca1ca6f
सभी का **शानदार काम** @MathYouF और मैं सभी प्रस्तुतियों से बहुत प्रभावित हुए।
विशेष उल्लेख:
1. @B3LOL, @alastine, और @AndrewKamau का WiE: https://youtu.be/V8gqCvgRcpk
2. "@Mert Bozkir | mertbozkir"'s Doc-String-Ify: https://www.loom.com/share/274565d0ddec417783e739ee728654d3?sid=6bb1b07a-f06a-4ec3-82c6-1d7ba6eae0d3
इन प्रोजेक्ट्स से हमें जो फीडबैक मिला है, वह बहुत मूल्यवान रहा है और हम हर एक चीज को ठीक करने पर काम करेंगे 🦜
हम पुरस्कारों के लिए टीमों से व्यक्तिगत रूप से संपर्क करेंगे। इसके अतिरिक्त, हमें लगता है कि ये इतने अद्भुत थे कि हम अगले कुछ हफ्तों में इन अद्भुत प्रोजेक्ट्स को प्रदर्शित करने पर काम करना चाहेंगे।
डेमो
InsightRed के घटक
🧩 कलेक्टर
कलेक्टर एक दिए गए सबरेडिट्स के लिए नवीनतम Reddit पोस्ट और उस पोस्ट की टिप्पणियों को Reddit के API का उपयोग करके एकत्र करता है। एकत्र करने के बाद, कलेक्टर एक स्थानीय SQLite डेटाबेस में एकत्रित डेटा को सहेजता है। यह Reddit API का उपयोग करने में मदद करने के लिए python पैकेज praw और स्थानीय SQLite डेटाबेस में CRUD ऑपरेशनों को करने के लिए SQLAlchemy का उपयोग करके आसान बनाया गया है।
🧩 वेक्टराइज़र
वेक्टराइज़र स्थानीय SQLite डेटाबेस की जांच करता है कि कौन सी टिप्पणियाँ वेक्टर डेटाबेस में सहेजी नहीं गई हैं। टिप्पणियों की एक सूची प्राप्त करने के बाद, यह OpenAI के “text-embedding-ada-002” मॉडल का उपयोग करके पोस्ट+टिप्पणी का एक एम्बेडिंग बनाता है। यह एम्बेडिंग वेक्टर डेटाबेस में एक इंडेक्स के रूप में उपयोग की जाती है और कुछ मेटाडेटा, JSON के रूप में भी बनाया जाता है। इंडेक्स और मेटाडेटा फिर वेक्टर डेटाबेस में अपलोड किया जाता है, जो इस मामले में Pinecone (क्लाउड-आधारित) है। अपलोड होने के बाद, स्थानीय SQLite डेटाबेस को अपडेट किया जाता है ताकि Pinecone में समान डेटा को फिर से अपलोड करने से बचा जा सके। यह सब Pinecone के python क्लाइंट (pinecone-client) का उपयोग करके वेक्टर डेटाबेस के लिए CRUD विकल्प बनाने और LangChain का उपयोग करके एम्बेडिंग प्रक्रिया को संभालने के लिए किया जाता है।
🧩 इंटरफेस
इंटरफेस वह है जिसका उपयोग उपयोगकर्ता टूल के साथ बातचीत करने के लिए करता है। इस मामले में, इंटरफेस एक CLI है। इंटरफेस में Retrieval-Augmented-Generation (RAG) का कार्यान्वयन है। जहां उपयोगकर्ता अपने उत्पाद का विवरण, जांचने के लिए सबरेडिट्स की एक सूची, साथ ही कुछ फ़िल्टर प्रदान करता है। इस संदर्भ में, कलेक्टर को कॉल किया जाता है फिर वेक्टराइज़र को कॉल किया जाता है। जब ये दोनों सेवाएँ प्रोसेसिंग कर लेती हैं, तो इनपुट किया गया उत्पाद विवरण वेक्टर डेटाबेस में समान रूप से खोज करने के लिए उपयोग किया जाता है। शीर्ष परिणाम और उत्पाद विवरण फिर एक प्रॉम्प्ट टेम्पलेट में फीड किए जाते हैं जो अंतिम प्रॉम्प्ट बनाता है। अंतिम प्रॉम्प्ट फिर OpenAI के GPT-4 मॉडल को भेजा जाता है और अंतिम परिणाम उपयोगकर्ता को प्रस्तुत किए जाते हैं। ये परिणाम सभी Reddit टिप्पणियों की एक सूची होगी जो यह सुझाव देती है कि Reddit उपयोगकर्ता(ओं) को प्रदान किए गए उत्पाद में रुचि हो सकती है, इसके विवरण के आधार पर। यह घटक कलेक्टर और वेक्टराइज़र टिप्पणियों का उपयोग करके काम करता है, साथ ही Anarchy के LLM-VM का उपयोग करके OpenAI के GPT-4 मॉडल को क्वेरी करने के लिए।
टीम के सदस्य
उल्लेखनीय बाहरी श्रेय
कास्टा (हैकर न्यूज़)
इस प्रोजेक्ट के लिए प्रेरणा प्रदान करना उनके HN पोस्ट के माध्यम से। चूंकि उनका समाधान ओपन-सोर्स नहीं था, मुझे एक ओपन-सोर्स संस्करण (यह प्रोजेक्ट) बनाने के लिए प्रेरित किया गया।
ChatGPT (GPT-4)
विकास में बहुत मददगार रहा, वास्तव में विकास चक्र को तेज किया। और इसने OpenAI के नए DALL-E 3 मॉडल का उपयोग करके प्रोजेक्ट का लोगो और YouTube थंबनेल उत्पन्न किया।
जेम्स ब्रिग्स (YouTuber)
जेम्स का वीडियो वास्तव में Reddit के API का उपयोग करने के तरीके और Python का उपयोग करके एक बुनियादी RAG पाइपलाइन को लागू करने के तरीके को समझाता है।
स्रोत
- Show HN: लेबर डे फन प्रोजेक्ट, अपने व्यवसाय को बढ़ावा देने के लिए Reddit टिप्पणियाँ खोजें
- Pinecone इंडेक्सिंग ओवरव्यू डॉक
- YouTube: RAG के साथ चैटबॉट - LangChain पूर्ण वॉकथ्रू
- OpenAI API पृष्ठ
- Pinecone क्विकस्टार्ट डॉक
- Reddit: आने वाले हफ्तों में प्रभावी होने वाले अपडेटेड रेट लिमिट्स
- Reddit ऐप्स पृष्ठ
- YouTube: Python में Reddit API का उपयोग कैसे करें
- Medium: Reddit API का उपयोग करके Reddit डेटा को स्क्रैप करना
- GitHub Gist: Reddit API
- GitHub: praw
- ChatGPT - वेब ऐप