DocuInsight
🟢 DocuInsight 已上线!请访问 www.docuinsight.ai 或查看我们的实时演示 这里,无需创建账户或任何其他操作!
🔴 本项目帖子几乎完全复制了我们于 2025 年 1 月 27 日提交的 Devpost hackathon submission 。DocuInsight 由 Mehmet Yilmaz 和 Dylan Eck 为 2024-2025 年的 DocuSign Hackathon Unlocked 所构建。截止 2025 年 3 月 12 日,我们未获胜,但我们学到了很多,并相信 DocuInsight 能为发送者和签署者提供真实价值。因此我们将精力集中在将其打造为提供真实价值的真实产品上。
关于
DocuInsight 是一个通过突出关键条款、将其翻译成通俗英文,并与 DocuSign 集成以实现电子签名,同时提供法律专家访问的简化法律合同平台。
DocuInsight 的创建旨在解决“协议陷阱”,即关键合同细节隐藏在法律术语背后,导致人们在未完全了解自己的权利或义务的情况下签署。我们的愿景是帮助协议双方——签署者和发送者——在签署前获得完整的清晰度。此外,我们还希望为用户提供一种简便的方式,以便在需要个性化咨询时与法律专业人士联系。
该项目于 2024 年 12 月至 2025 年 1 月期间为 DocuSign Hackathon 开发,DocuInsight 与 DocuSign 技术集成,以导入协议或模板,利用 OpenAI API 进行文本分析,并提供一个聊天界面,可回答关于合同的问题或提供寻找律师的来源。我们相信,弥合这一知识鸿沟将减少混淆、法律争议以及错失的机会。
灵感
2024 年初,我与一位密友共同创办了一家初创公司。出于信任,我在未仔细审阅的情况下签署了公司初始合同。随后,我在没有报酬的情况下投入大量时间和专业知识开发公司的 MVP,随后我的朋友利用其额外的股权迫使我要么减少我的股份,要么被公司除名。找律师后,我发现自己不知不觉签署了重要权利的放弃,无法有效为自己或公司辩护。由于这位曾经亲密的朋友的自私和鲁莽行为,争议在个人层面上给我带来了压力,也让公司浪费了宝贵时间。这段经历让我深刻认识到,了解法律协议的每个细节对于保护个人权利和确保组织稳定至关重要。
功能
-
清晰的合同摘要:DocuInsight 使用先进的 AI 模型分析法律文件并生成简明摘要。这些摘要突出关键条款、异常条款、潜在风险和主要承诺,为用户提供清晰易懂的合同概览。
-
交互式聊天界面:AI 驱动的聊天功能允许用户“与合同对话”。他们可以询问特定条款、协议的整体目的或相关法律概念。聊天机器人还能浏览网络,提供可靠、准确且最新的信息,确保用户获得可靠答案。
-
律师推荐:对于需要额外法律帮助的用户,DocuInsight 生成优化的搜索查询,根据用户所在位置和所审阅的合同类型推荐律师。搜索结果包括律师的联系方式和评价,为用户提供可操作的方式与专家联系。
-
增强的签署流程:DocuInsight 与 DocuSign 现有的签署工作流无缝集成。用户使用电子邮件登录,连接 DocuSign 账户以访问模板并发送文档进行签署。发送后,收件人可以审阅文档、交互 AI 生成的洞察,并在标准 DocuSign 平台内完成签署。
-
签署后访问:签署后,用户可以通过原始链接重新访问文档,查看已签署的协议、访问 AI 洞察,并继续使用聊天界面进行后续提问。这确保签署者对其协议保持持续的清晰度。
这些功能使 DocuInsight 成为简化法律合同复杂性的强大工具。通过结合 AI 驱动的洞察、交互式支持以及与 DocuSign 的无缝集成,DocuInsight 赋能签署者做出明智决策,帮助发送者建立对其分发协议的信任,并为法律专业人士提供与需要进一步帮助的用户连接的机会。我们的目标是促进协议过程的透明、信任和可访问性,使法律文本更易理解、更公平。
如果您想观看我们使用 DocuInsight 并清晰展示其功能的演示视频,请查看我们制作的额外视频(这不是我们的演示视频,仅是想要更多细节的额外资源):
我们的构建方式
DocuInsight 由三个主要部分组成:
- 数据库:存储所有作业、报告、用户数据等。它包含项目所需的数据。
- 前端:项目的 UI,用户看到并交互的界面。
- 分析器:负责分析法律合同并发送电子邮件的后端服务。
本项目使用了 PostgreSQL 数据库,托管在 Supabase 上。前端和分析器通过 Supabase 的 API 及其 SDK 访问数据库。数据库包含三张表:用户表用于身份验证和账户管理,作业表跟踪需要分析的合同,报告表存储分析器生成的合同报告。
前端使用 Next.js 框架构建,使用 HTML、Tailwind CSS、JavaScript、TypeScript 和 React,实现动态响应式的前端展示。前端使用了多个 API:
- OpenAI API:为每个签署会话托管并运行聊天机器人。
- DocuSign API:使用 eSignature API 处理所有签署流程,并提供用户从 DocuSign 账户中访问模板的功能。
- Tavily API:为 LLM 设计的专用搜索引擎 API,使聊天机器人能够浏览网络并获取最新信息。
- Resend API:处理所有电子邮件相关任务,主要用于前端的登录流程。
- Supabase API:访问托管在 Supabase 上的项目数据库,执行 CRUD 操作。
前端托管在 Vercel 上,由 Next.js 框架的创建者提供的托管服务。
分析器使用 Python 构建,使用 OpenAI 的 o1-preview
模型分析法律合同,并使用 Resend API 发送邮件(如收据或签署合同所需的邮件)。分析器支持 Discord webhook,用户可在关键错误或异常时收到警报。与项目其他部分一样,分析器使用 Supabase 访问数据库。
分析器使用的主要库包括:
- PyMuPDF、openpyxl、python-docx 和 OpenAI 的 o1-preview 模型:加载 PDF、DOCX、DOC、JPG、PNG 等文件内容。
分析器部署在具有至少 4 GB RAM 的 Linode 实例上,运行 Ubuntu 操作系统。
我们遇到的挑战
构建 DocuInsight 充满了技术和实际的挑战。我们必须实现安全的身份验证,确保与数据库的无缝连接,同时保护用户数据。了解哪些 DocuSign API 功能适用于我们的需求需要大量的试错。构建前端以提供良好的用户体验,并将高级 LLM 功能集成到现有的 DocuSign 签署流程中也很困难。实现服务器到客户端的实时数据流以支持聊天界面也很棘手,推荐律师也面临缺乏可访问或经济实惠的法律专业人员数据集的问题。我们必须为聊天机器人构建网页浏览逻辑,以减少幻觉并提高答案可靠性。最后,使项目达到生产级别是最困难的部分。将本地演示转化为高可用性、可靠性的在线服务是完全不同的挑战,任何一次生产故障都可能留下不良印象,因此确保稳定性至关重要且极具挑战性。
我们自豪的成就
我们为成功部署 DocuInsight 并让任何人都能使用感到自豪。构建一个与 DocuSign 无缝集成、能够处理真实使用场景并提供可靠 AI 洞察的生产级应用是重大成就。我们克服了本地演示到真实环境高可用性的挑战,感到非常自豪。
我们的收获
在此项目中,我们意识到构建像 DocuInsight 这样的解决方案比预期更复杂。解析法律文件、确保准确性以及在 AI 能力与成本之间平衡需要细致的思考和持续迭代。我们也学到了视频制作的重要性。为确保演示有效传达价值,我们在截止日期前两周开始制作视频,使用专业设备制作出精致的最终产品。除此之外,项目的规模化也带来了独特挑战。调用高级 AI 模型进行内容分析成本高昂,需要在使用最智能模型和成本效益之间取得平衡。我们通过浏览网络、与潜在用户交流并咨询律师进行基本的市场调研,确保 DocuInsight 能提供真实价值。这一过程让我们明白,构建有意义的产品需要验证其影响,而不是仅仅为了实现而创建解决方案。
未来计划
我们计划通过开发更高级的 AI 代理进行更深入的合同分析,优化向量化数据集以提供更好洞察,并创建更全面的律师目录,将签署者和企业与当地法律专业人士连接。未来功能包括 SEC 案例搜索等工具,以引用法律先例。我们的目标是为签署者、发送者和企业提供更大价值,促进协议的信任和透明。