使用 InsightRed 的 ABM 营销
关于
InsightRed 是一个基于 LLM 的 账户营销(ABM) 工具,它从 Subreddits 中提取最新的 Reddit 评论,按“热门”排序,并确定对您的项目或产品表现出潜在兴趣的用户。它帮助您识别和定位 Reddit 上的高价值用户,以获取您的产品/项目的初始用户。该项目是为 ANARCHY 2023 年 10 月黑客马拉松构建的。
公告
2023 年 10 月 19 日
作为该项目的后续,我很高兴地宣布我们在 Anarchy 的 2023 年 10 月黑客马拉松中获得了第一名!
点击这里以文本模式查看消息(由于 Discord 的格式进行了修改)
@everyone **👑 黑客马拉松 👑**
我非常高兴地宣布第二届 Anarchy 黑客马拉松的获奖者如下:
🥇 "@Ben Zimmerman [T3CH3Y]"、@Mehmet 和 "@Ananya Aithal" 的 InsightRed! https://www.youtube.com/watch?v=xhKwnKxmg5k
🥈 @partho 和 @Karan 的 DistillClassifier https://www.loom.com/share/d7e7c8e12dd14bcabdf41051433901a1?sid=900cb491-8117-4530-a131-d87eeca1ca6f
真的 **每个人的工作都很棒** @MathYouF 和我对所有提交的作品都感到非常印象深刻。
特别提到:
1. @B3LOL、@alastine 和 @AndrewKamau 的 WiE: https://youtu.be/V8gqCvgRcpk
2. "@Mert Bozkir | mertbozkir" 的 Doc-String-Ify: https://www.loom.com/share/274565d0ddec417783e739ee728654d3?sid=6bb1b07a-f06a-4ec3-82c6-1d7ba6eae0d3
我们从这些项目中获得的反馈非常有价值,我们将努力修复每一个细节 🦜
我们将单独联系团队以发放奖品。此外,我们认为这些项目非常出色,我们希望在接下来的几周内展示这些令人惊叹的项目。
演示
InsightRed 的组件
🧩 收集器
收集器通过使用 Reddit 的 API 收集给定 Subreddits 的最新 Reddit 帖子及其评论。在收集后,收集器将收集到的数据保存到本地 SQLite 数据库中。这是通过使用 Python 包 praw 来辅助使用 Reddit API 和 SQLAlchemy 来执行本地 SQLite 数据库中的 CRUD 操作来简化的。
🧩 向量化器
向量化器检查本地 SQLite 数据库,查看哪些评论尚未保存到向量数据库中。在获取评论列表后,它使用 OpenAI 的“text-embedding-ada-002”模型创建帖子+评论的嵌入。该嵌入用作向量数据库中的索引,并且还创建了一些以 JSON 形式呈现的元数据。然后将索引和元数据上传到向量数据库,在这种情况下是 Pinecone(基于云)。上传后,本地 SQLite 数据库会更新,以避免将相同数据重新上传到 Pinecone。这一切都是通过使用 Pinecone 的 Python 客户端 (pinecone-client) 来对向量数据库进行 CRUD 操作,以及使用 LangChain 来处理嵌入过程。
🧩 界面
界面是用户与工具交互的方式。在这种情况下,界面是一个 CLI。该界面实现了 检索增强生成(RAG)。用户提供其产品的描述、要检查的 Subreddits 列表以及一些过滤器。在给定此上下文后,调用收集器,然后调用向量化器。在这两个服务完成处理后,输入的产品描述用于在向量数据库中进行类似搜索。然后将顶部结果和产品描述输入到提示模板中,生成最终提示。最终提示随后发送到 OpenAI 的 GPT-4 模型,最终结果呈现给用户。这些结果将是所有 Reddit 评论的列表,这些评论高度表明 Reddit 用户可能对提供的产品感兴趣,基于其描述。该组件通过使用收集器和向量化器的评论,以及使用 Anarchy 的 LLM-VM 来处理查询 OpenAI 的 GPT-4 模型。
团队成员
显著的外部信用
casta(Hacker News)
通过他们的 HN 帖子 为该项目提供了灵感。由于他们的解决方案不是开源的,我受到激励创建了一个开源版本(该项目)。
ChatGPT(GPT-4)
在开发过程中非常有帮助,极大地加快了开发周期。它使用 OpenAI 的新 DALL-E 3 模型生成了项目的徽标和 YouTube 缩略图。
James Briggs(YouTuber)
James 的视频详细解释了如何使用 Reddit 的 API 以及如何使用 Python 实现基本的 RAG 管道。