InsightRed ile ABM Pazarlama
Hakkında
InsightRed, “Hot” sıralamasına göre Subreddit’lerden en son Reddit yorumlarını çıkaran ve projenize veya ürününüze potansiyel ilgi gösteren kullanıcıları belirleyen LLM destekli Hesap Tabanlı Pazarlama (ABM) aracıdır. Bu, Reddit’te yüksek değerli kullanıcıları tanımlamanıza ve hedeflemenize yardımcı olur, böylece ürününüz/projeniz için ilk kullanıcılarınızı elde edebilirsiniz. Bu proje, ANARCHY Ekim 2023 Hackathonu için oluşturulmuştur.
Duyuru(lar)
19 Ekim 2023
Bu projenin bir devamı olarak, Anarchy’nin Ekim 2023 Hackathonu’nda 1. sırayı kazandığımızı duyurmaktan heyecan duyuyorum!
Mesajı METİN modunda görüntülemek için buraya tıklayın (Discord'un formatlaması nedeniyle değiştirilmiştir)
@everyone **👑 HACKATHON 👑**
İkinci anarchy hackathon'unun kazananlarını duyurmaktan çok heyecanlıyım:
🥇 "@Ben Zimmerman [T3CH3Y]", @Mehmet ve "@Ananya Aithal"'in InsightRed'i! https://www.youtube.com/watch?v=xhKwnKxmg5k
🥈 @partho ve @Karan'ın DistillClassifier'ı https://www.loom.com/share/d7e7c8e12dd14bcabdf41051433901a1?sid=900cb491-8117-4530-a131-d87eeca1ca6f
Gerçekten **HERKES İÇİN HARİKA BİR ÇALIŞMA** @MathYouF ve tüm başvurulardan çok etkilendik.
Özel teşekkürler:
1. @B3LOL, @alastine ve @AndrewKamau'nın WiE'si: https://youtu.be/V8gqCvgRcpk
2. "@Mert Bozkir | mertbozkir"'in Doc-String-Ify'ı: https://www.loom.com/share/274565d0ddec417783e739ee728654d3?sid=6bb1b07a-f06a-4ec3-82c6-1d7ba6eae0d3
Bu projelerden aldığımız geri bildirimler çok değerliydi ve her birini düzeltmek için çalışacağız 🦜
Ödüller için takımlarla bireysel olarak iletişime geçeceğiz. Ayrıca, bu projelerin yeterince olağanüstü olduğunu düşündüğümüz için, önümüzdeki birkaç hafta boyunca bu olağanüstü projeleri sergilemek için çalışmak istiyoruz.
Demo
InsightRed’in Bileşenleri
🧩 Toplayıcı
Toplayıcı, belirli Subreddit’ler için en son Reddit gönderilerini ve bu gönderilerin yorumlarını Reddit’in API’sini kullanarak toplar. Toplama işlemi tamamlandıktan sonra, toplayıcı toplanan verileri yerel bir SQLite veritabanına kaydeder. Bu, Reddit API’sini kullanmaya yardımcı olmak için python paketi praw ve yerel SQLite veritabanında CRUD işlemleri gerçekleştirmek için SQLAlchemy kullanılarak kolaylaştırılmıştır.
🧩 Vektörleştirici
Vektörleştirici, yerel SQLite veritabanını kontrol ederek hangi yorumların vektör veritabanına kaydedilmediğini belirler. Yorumların bir listesini aldıktan sonra, OpenAI’nin “text-embedding-ada-002” modelini kullanarak gönderi+yorumun bir gömme (embedding) oluşturur. Bu gömme, vektör veritabanında bir İndeks olarak kullanılır ve ayrıca bir JSON biçiminde bazı meta veriler de oluşturulur. İndeks ve meta veriler daha sonra bu durumda Pinecone (bulut tabanlı) olan vektör veritabanına yüklenir. Yüklendikten sonra, yerel SQLite veritabanı, aynı verilerin Pinecone’a yeniden yüklenmesini önlemek için güncellenir. Bu, vektör veritabanına CRUD seçenekleri yapmak için Pinecone’un python istemcisini (pinecone-client) ve gömme sürecini yönetmek için LangChain kullanarak gerçekleştirilir.
🧩 Arayüz
Arayüz, kullanıcının araçla etkileşimde bulunduğu yerdir. Bu durumda, arayüz bir CLI’dir. Arayüz, Retrieval-Augmented-Generation (RAG) uygulamasına sahiptir. Kullanıcı, ürününün bir tanımını, kontrol edilecek Subreddit’lerin bir listesini ve bazı filtreleri sağlar. Bu bağlamda, Toplayıcı çağrılır ve ardından Vektörleştirici çağrılır. Bu iki hizmet işleme tamamlandıktan sonra, girilen ürün tanımı, vektör veritabanında benzer bir arama yapmak için kullanılır. En iyi sonuçlar ve ürün tanımı, nihai istemi oluşturan bir istem şablonuna beslenir. Nihai istem, OpenAI’nin GPT-4 modeline gönderilir ve nihai sonuçlar kullanıcıya sunulur. Bu sonuçlar, sağlanan ürünle ilgili olarak Reddit kullanıcısının ilgisini yüksek oranda gösteren tüm Reddit yorumlarının bir listesini içerecektir. Bu bileşen, Toplayıcı ve Vektörleştirici yorumlarını kullanarak ve Anarchy’nin LLM-VM kullanarak OpenAI’nin GPT-4 modeline sorgu yapmayı yöneterek çalışır.
Takım Üyeleri
Dikkate Değer Dış Kredi
casta (Hacker News)
Bu projeye ilham veren HN gönderileri aracılığıyla. Çözümü açık kaynak olmadığı için, açık kaynak bir versiyon oluşturmak için motive oldum (bu proje).
ChatGPT (GPT-4)
Geliştirme sürecini gerçekten hızlandırarak çok yardımcı oldu. Ayrıca, projenin logosunu ve YouTube küçük resmini OpenAI’nin yeni DALL-E 3 modeli kullanarak oluşturdu.
James Briggs (YouTuber)
James’in videosu, Reddit’in API’sini nasıl kullanacağınızı ve Python kullanarak temel bir RAG boru hattını nasıl uygulayacağınızı gerçekten açıkladı.
Kaynaklar
- Show HN: İşletmenizi Tanıtmak için Reddit Yorumlarını Bulun
- Pinecone İndeksleme Genel Bakış Belgeleri
- YouTube: RAG ile Chatbotlar - LangChain Tam Geçiş
- OpenAI API Sayfası
- Pinecone Hızlandırma Belgeleri
- Reddit: Önümüzdeki haftalarda yürürlüğe girecek güncellenmiş oran limitleri
- Reddit Uygulamaları Sayfası
- YouTube: Python’da Reddit API’sini Kullanma
- Medium: Reddit API’sini Kullanarak Reddit verilerini Kazıma
- GitHub Gist: Reddit API
- GitHub: praw
- ChatGPT - Web Uygulaması