DocuInsight 简化签署
事件
2025年9月15日: DocuInsight 已退役,但现已完全开源,托管于 github.com/eandf/DocuInsight,文档位于 eandf.github.io/DocuInsight。原始域名在 2027 年之前会重定向到该处。
2025年1月27日: DocuInsight 由 梅赫梅特·伊尔马兹 和 迪兰·埃克 为 2024-2025 年的 DocuSign Hackathon Unlocked 构建。查看 www.docuinsight.ai 或我们的 现场演示。这篇文章基于我们的 Devpost 提交。
关于
DocuInsight 是一个通过突出关键条款、将其翻译为通俗易懂的语言并与 DocuSign 集成以进行电子签名,同时提供与法律专家连接途径的平台,旨在简化法律合同。
DocuInsight 的创建初衷是为了解决“协议陷阱”(Agreement Trap):重要的合同细节被法律术语所掩盖,导致人们在未充分理解其权利或义务的情况下签署合同。我们的愿景是帮助任何协议的双方——签署方和发送方——在签署前都能获得完全的清晰理解。此外,我们希望为用户提供一种简单的方式,以便在需要个性化法律建议时与法律专业人士建立联系。
DocuInsight 于 2024 年 12 月至 2025 年 1 月为 DocuSign 黑客马拉松开发,集成了 DocuSign 的技术以导入协议或模板,利用 OpenAI 的 API 进行文本分析,并提供可以回答合同问题或提供寻找律师来源的聊天界面。我们相信弥合这一知识鸿沟将减少混淆、法律争议和错失的机会,从而惠及所有相关方。
演示
灵感来源
2024 年初,我与一位亲密的朋友共同创办了一家初创公司。出于对他的信任,我在没有彻底审核的情况下签署了最初的公司合同。在无薪投入大量时间和专业知识开发公司 MVP 后,我的朋友利用他额外的股权迫使我要么减少我的股份,要么被公司除名。找到律师后,我发现自己在无意中签掉了重要权利,无法有效地为自己或公司辩护。由于这位曾经亲近朋友的自私和鲁莽行为,这场争端对我造成了个人上的压力并消耗了公司宝贵的时间。这段经历让我认识到,理解法律协议中每一项细节对于保护个人权利和确保组织稳定至关重要。
它的功能
DocuInsight 的核心功能如下:
-
清晰的合同摘要:DocuInsight 使用先进的人工智能模型来分析法律文件并生成简明摘要。这些摘要突出关键条款、异常条款、潜在风险和主要承诺,为用户提供合同的清晰易懂的概览。
-
交互式聊天界面:由人工智能驱动的聊天功能允许用户与他们的合同“对话”。他们可以就特定条款、协议的整体目的或相关的法律概念提问。聊天机器人还可以浏览网页以提供有充分来源、准确且最新的信息,确保用户获得可靠答案。
-
律师推荐:对于寻求额外法律援助的用户,DocuInsight 会生成优化的搜索查询,根据用户所在位置和他们正在审阅的合同类型推荐律师。搜索结果包括法律专业人士的联系方式和评论,为用户提供与专家联系的可操作途径。
-
增强的签署流程:DocuInsight 与 DocuSign 现有的签署工作流无缝集成。用户使用电子邮件登录,连接他们的 DocuSign 帐户以访问模板,并发送文档以进行签署。发送后,接收方可以审阅文档、与 AI 生成的见解进行互动,并像在标准 DocuSign 平台上一样完成签署。
-
签署后访问:签署后,用户可通过原始链接重新访问其文档以查看已签署的协议、访问 AI 见解,并继续使用聊天界面进行后续问题咨询。这确保签署方对其协议保持持续的清晰了解。
这些功能使 DocuInsight 成为简化法律合同复杂性的强大工具。通过结合 AI 驱动的见解、交互式支持以及与 DocuSign 的无缝集成,DocuInsight 使签署方能够做出知情决策,帮助发送方建立其分发协议的信任,并为寻求进一步帮助的用户与法律专业人士之间提供连接机会。我们的目标是促进协议过程中的透明度、信任和可及性,使法律文本更易理解并对每个人更公平。
如果您想观看一段清晰展示我们如何使用 DocuInsight 及其功能的视频,请查看我们另做的一段 DocuInsight 演示视频(这不是我们的主演示视频,仅为想了解更多细节的人提供的额外资源):
我们如何构建
DocuInsight 由三个主要部分组成:
- 数据库:存储所有作业、报告、用户数据等。它包含项目所需的数据。
- 前端:项目的用户界面,即用户看到并与之交互的部分。
- 分析器(Analyzer):一个负责分析法律合同并发送邮件的后端服务。
在该项目中,我们使用了一个数据库。数据库为 PostgreSQL,托管在 Supabase 上。前端和 Analyzer 都通过 Supabase 的 SDK 使用 Supabase 的 API 访问数据库。数据库设置包括三张表:一张用于用户、一张用于作业、还有一张用于报告。用户表用于认证并跟踪账户。作业表用于跟踪需要分析的合同。报告表存储由 Analyzer 生成的所有合同报告。
前端是使用名为 Next.js 的前端框架构建的。在该框架中,我们使用了 HTML、Tailwind CSS、JavaScript、TypeScript 和 React。这些技术使前端能够动态且响应式地展示内容。此外,我们在前端使用了若干 API:
- OpenAI’s API:用于为每个签署会话托管和运行聊天机器人。
- DocuSign’s API:具体使用 eSignature API 来处理所有签署过程,并为用户在 DocuInsight 上访问其 DocuSign 帐户中的模板提供便捷途径。
- Tavily API:为大模型设计的专用搜索引擎 API,使聊天机器人能够浏览网络并检索最新新闻或更新。
- Resend API:用于处理所有与电子邮件相关的任务,主要用于前端的登录流程。
- Supabase API:访问托管在 Supabase 上的项目数据库以执行 CRUD 操作。
前端完全托管在由 Next.js 框架的创建者开发的托管服务 Vercel 上。
Analyzer 使用 Python 构建。它使用 OpenAI 的 API 来分析法律合同,使用 OpenAI 的一个最先进的模型,o1-preview。它还使用 Resend API 发送电子邮件,主要用于发送收据或在 DocuInsight 上签署合同时所需的电子邮件。Analyzer 支持 Discord webhooks,允许用户在 Analyzer 运行时如果发生关键故障或事件时接收警报。像项目的其他部分一样,Analyzer 使用 Supabase 访问项目的数据库。
Analyzer 的代码中包含诸如 PyMuPDF、openpyxl、python-docx 和 OpenAI’s o1-preview model 等包:用于加载各种文件类型的内容,包括 PDF、DOCX、DOC、JPG 和 PNG。
Analyzer 托管在一个至少具有 4 GB RAM 的 Linode 实例上,操作系统为 Ubuntu。
我们遇到的挑战
构建 DocuInsight 充满了技术和实际挑战。我们必须找到如何实现安全认证并与我们的数据库无缝连接,同时确保用户数据得到保护。确定应使用 DocuSign API 的哪些部分以实现我们想要的功能需要大量的试验与错误。构建前端以提供良好的用户体验并将像大型语言模型功能等高级特性集成到现有的 DocuSign 签署流程中,也是很难把握的地方。将服务器到客户端的实时数据流用于聊天界面非常棘手,另外还要想办法推荐律师——因为没有一个可以通过 API 轻松获取或负担得起的法律专业人员数据集。我们不得不为聊天机器人构建网页浏览逻辑,以尽量减少幻觉并使其回答更可靠。最后,使项目达到可上线的生产就绪状态是最困难的部分。在本地构建并运行一个演示是一回事,但将其部署到网上、确保高可用性和可靠性以便任何人都能访问,则是完全不同的挑战。生产环境中的一次故障可能会留下不良印象,因此确保稳定性是关键且极其困难的。
我们引以为傲的成就
我们为成功部署 DocuInsight 并让任何人都能使用它感到自豪。构建一个可投入生产、与 DocuSign 无缝集成、能够应对真实使用场景并提供可靠的 AI 驱动洞见的应用,是一项重要成就。在本地构建演示版是一回事,但确保在高可用性的线上环境中一切正常运行,是我们自豪地克服的一项挑战。
我们学到的东西
在整个项目过程中,我们意识到构建像 DocuInsight 这样的解决方案比我们最初预期的要复杂得多。解析法律文件、确保准确性以及在 AI 功能与可负担性之间取得平衡,要求我们进行深思熟虑和不断迭代。我们还认识到专业视频制作的重要性。为了确保我们的演示有效传达项目价值,我们在截止日期前两周就开始着手制作视频,使用专业摄影设备以呈现精良的成品。此外,将此类项目扩展规模也带来了独特的挑战。调用高级 AI 模型来分析内容在计算上成本高昂,因此我们必须在使用最智能的模型与使解决方案具成本效益之间进行谨慎权衡。最后,我们通过浏览网络、与潜在用户交谈并咨询律师,进行了基础市场调研,以确保 DocuInsight 能够提供实际价值。这一过程教会我们,构建有意义的东西需要验证其影响,而不仅仅是为了构建而构建解决方案。
DocuInsight 的下一步计划
我们计划扩展 DocuInsight,通过开发更高级的 AI 代理以进行更深入的合同分析、优化向量化数据集以获得更佳洞见,并创建更全面的律师名录,以便将签署方和企业与其所在地区的法律专业人士连接起来。未来的功能还包括诸如 SEC 案例检索之类的工具,用于引用法律先例。我们的目标是在促进协议的信任与透明度的同时,为签署方、发送方和企业提供更多价值。