DocuInsight 简化签署
事件
2025年9月15日: DocuInsight 已被退役,但现在已完全开源,地址为 github.com/eandf/DocuInsight,文档在 eandf.github.io/DocuInsight。原始域名将在 2027 年之前重定向到此。
2025年1月27日: DocuInsight 是由 Mehmet Yilmaz 和 Dylan Eck 为 2024-2025 年的 DocuSign Hackathon Unlocked 创建的。请查看 www.docuinsight.ai 或我们的 实时演示。这篇文章基于我们的 Devpost 提交。
关于
DocuInsight 是一个通过突出关键条款、将其翻译成简单英语并与 DocuSign 集成以进行电子签名的平台,同时提供法律专家的访问。
DocuInsight 的创建旨在解决协议陷阱,即重要的合同细节被法律术语掩盖,导致人们在未完全理解其权利或义务的情况下签署。我们的愿景是帮助任何协议的双方,签署者和发送者,在签署之前获得完全的清晰。此外,我们希望为用户提供一种简单的方式,以便在需要个性化咨询时与法律专业人士联系。
DocuInsight 从 2024 年 12 月到 2025 年 1 月为 DocuSign Hackathon 开发,集成了 DocuSign 的技术以导入协议或模板,利用 OpenAI API 进行文本分析,并提供一个可以回答有关合同的问题或提供寻找律师来源的聊天界面。我们相信,弥合这一知识差距将减少混淆、法律争议和所有相关方的机会损失。
演示
灵感
在 2024 年初,我与一位密友共同创办了一家初创公司。信任他,我在没有完全审查的情况下签署了初始公司合同。在投入大量时间和专业知识开发公司的 MVP 之后,我的朋友利用他额外的股权迫使我减少股份或被移除出公司。在找到律师后,我发现自己不小心放弃了重要权利,无法有效地为自己或公司辩护。由于我曾经亲密的朋友自私和鲁莽的行为,争议在个人上给我带来了压力,并使公司失去了宝贵的时间。这次经历让我明白了理解法律协议中每一个细节以保护个人权利和确保组织稳定的重要性。
它的功能
功能和特点:
-
清晰的合同摘要:DocuInsight 使用先进的 AI 模型分析法律文件并生成简明的摘要。这些摘要突出关键条款、异常条款、潜在风险和主要承诺,为用户提供合同的清晰和易懂的概述。
-
互动聊天界面:AI 驱动的聊天功能允许用户与他们的合同“对话”。他们可以询问特定条款、协议的整体目的或相关法律概念。聊天机器人还可以浏览网络,以提供来源可靠、准确和最新的信息,确保用户获得可靠的答案。
-
律师推荐:对于寻求额外法律帮助的用户,DocuInsight 生成优化的搜索查询,根据用户的位置和他们正在审查的合同类型推荐律师。搜索结果包括法律专业人士的联系信息和评论,为用户提供与专家联系的可行方式。
-
增强的签署流程:DocuInsight 与 DocuSign 现有的签署工作流程无缝集成。用户使用电子邮件登录,将其 DocuSign 账户连接以访问模板,并发送文档进行签署。一旦发送,接收者可以查看文档,与 AI 生成的见解互动,并像在标准 DocuSign 平台上一样签署。
-
签署后访问:签署后,用户可以通过原始链接重新访问他们的文档,以查看已签署的协议、访问 AI 见解,并继续与聊天界面互动以进行后续问题。这确保签署者对他们的协议有持续的清晰。
这些功能使 DocuInsight 成为简化法律合同复杂性的强大工具。通过结合 AI 驱动的见解、互动支持和与 DocuSign 的无缝集成,DocuInsight 使签署者能够做出明智的决定,帮助发送者在他们分发的协议中建立信任,并为法律专业人士提供与寻求进一步帮助的用户联系的机会。我们的目标是促进协议过程中的透明度、信任和可及性,使法律文本更易于理解,对每个人都更公平。
如果您想看到我们使用 DocuInsight 并清晰演示其功能的清晰视频,请查看我们制作的关于 DocuInsight 实际操作的额外视频(这不是我们的演示视频,仅是如果人们想要更多细节的额外资源):
我们是如何构建它的
DocuInsight 由三个主要部分组成:
- 数据库:存储所有的工作、报告、用户数据等。它包含项目所需的数据。
- 前端:项目的用户界面,用户所看到和互动的内容。
- 分析器:负责分析法律合同并发送电子邮件的后端服务。
对于这个项目,使用了一个数据库。数据库是 PostgreSQL,并托管在 Supabase 上。前端和分析器通过其 SDK 使用 Supabase 的 API 访问数据库。数据库设置由三个表组成:一个用于用户,一个用于工作,一个用于报告。用户表用于身份验证并跟踪账户。工作表跟踪需要分析的合同。报告表存储分析器生成的所有合同报告。
前端使用一个名为 Next.js 的前端框架构建。在这个框架中,我们使用了 HTML、Tailwind CSS、JavaScript、TypeScript 和 React。这些技术使前端能够动态和响应性地运行和显示内容。此外,我们在前端使用了几个 API:
- OpenAI 的 API:用于托管和运行每个签署会话的聊天机器人。
- DocuSign 的 API:特别是 eSignature API 用于处理所有签署过程,并提供用户从其 DocuSign 账户在 DocuInsight 上轻松访问模板的功能。
- Tavily API:一个专为 LLM 设计的专业搜索引擎 API,允许聊天机器人浏览网络并检索最新的新闻或更新。
- Resend API:用于处理所有与电子邮件相关的任务,主要用于前端的登录过程。
- Supabase API:访问托管在 Supabase 上的项目数据库以执行 CRUD 操作。
前端完全托管在 Vercel 上,这是由 Next.js 框架的创建者开发的托管服务。
分析器使用 Python 构建。它使用 OpenAI 的 API 通过 OpenAI 最先进的模型之一 o1-preview 分析法律合同。它还使用 Resend API 发送电子邮件,主要用于发送收据或在 DocuInsight 上签署合同所需的电子邮件。分析器支持 Discord 网络钩子,允许用户在分析器运行时接收关键故障或事件的警报。与项目的其余部分一样,分析器使用 Supabase 访问项目的数据库。
分析器的代码包含以下包:
- PyMuPDF、openpyxl、python-docx 和 OpenAI 的 o1-preview 模型:用于加载各种文件类型的内容,包括 PDF、DOCX、DOC、JPG 和 PNG。
分析器托管在具有至少 4 GB RAM 的 Linode 实例上,运行 Ubuntu 作为操作系统。
我们遇到的挑战
构建 DocuInsight 充满了技术和实际挑战。我们必须弄清楚如何实现安全的身份验证,确保无缝连接到我们的数据库,同时确保用户数据保持安全。了解我们想要的功能需要使用 DocuSign API 的哪些部分需要大量的反复试验。构建前端以提供良好的用户体验并将 LLM 功能等高级功能集成到现有的 DocuSign 签署过程中也是一项艰巨的任务。从服务器实时流式传输数据到客户端以供聊天界面使用是棘手的,找到推荐律师的方法也很困难,因为没有通过 API 轻松访问或负担得起的法律专业人士数据集。我们必须为聊天机器人构建网络浏览逻辑,以最小化幻觉并使其答案更可靠。最后,使项目准备好投入生产是最困难的部分。构建和运行本地演示是一回事,但在网络上以高正常运行时间和可靠性进行部署以便任何人都可以访问则是完全不同的挑战。生产中的单个故障可能会留下不好的印象,因此确保稳定性至关重要且极其困难。
我们感到自豪的成就
我们为成功部署 DocuInsight 并使其可供任何人使用而感到自豪。构建一个与 DocuSign 无缝集成、处理真实世界使用情况并提供可靠的 AI 驱动洞察的生产就绪应用程序是一个重要的成就。为了演示而在本地构建是一回事,但确保一切在高正常运行时间的实时环境中正常工作是我们自豪地克服的挑战。
我们学到了什么
在这个项目中,我们意识到构建像 DocuInsight 这样的解决方案远比我们最初预期的要复杂得多。解析法律文件、确保准确性以及在 AI 能力与可负担性之间取得平衡需要仔细思考和不断迭代。我们还认识到适当的视频制作的重要性。为了确保我们的演示有效地传达我们项目的价值,我们在截止日期前两周开始制作视频,使用专业的摄影设备来交付一个精致的最终产品。此外,像这样的项目扩展也带来了独特的挑战。调用先进的 AI 模型来分析内容是计算上昂贵的,因此我们必须仔细平衡使用最智能的模型与使解决方案具有成本效益之间的关系。最后,我们通过浏览网络、与潜在用户交谈以及咨询律师进行基本的市场调研,以确保 DocuInsight 能够提供真正的价值。这个过程教会我们,构建有意义的东西需要验证其影响,而不仅仅是为了创建一个解决方案而创建。
DocuInsight 的下一步
我们计划通过开发更先进的 AI 代理进行更深入的合同分析、优化向量化数据集以获得更好的洞察,并创建一个更全面的律师目录,以便将签署人和企业与他们所在地区的法律专业人士联系起来,从而扩展 DocuInsight。未来的功能包括像 SEC 案件搜索这样的工具,以参考法律先例。我们的目标是为签署人、发送者和企业提供更多价值,同时在协议中促进信任和透明度。