DocuInsight
Events
September 15, 2025: DocuInsight 已经停止维护,但现已在 github.com/eandf/DocuInsight 完全开源,文档位于 eandf.github.io/DocuInsight。原始域名将重定向至此,直至 2027 年。
January 27, 2025: DocuInsight 由 Mehmet Yilmaz 和 Dylan Eck 为 2024-2025 年 DocuSign Hackathon Unlocked 构建。访问 www.docuinsight.ai 或我们的 live demo。本文基于我们的 Devpost submission。
About
DocuInsight 是一个平台,通过突出关键条款、将其翻译成通俗英文,并与 DocuSign 集成以实现电子签名,同时提供法律专家的访问。
DocuInsight 的创建旨在解决“协议陷阱”,即重要的合同细节隐藏在法律术语背后,导致人们在未完全了解自身权利或义务的情况下签署。我们的愿景是帮助协议的双方——签署者和发送者——在签署前获得完整的清晰度。此外,我们还希望为用户提供一种简便的方式,以便在需要个性化法律咨询时联系法律专业人士。
DocuInsight 于 2024 年 12 月至 2025 年 1 月期间为 DocuSign Hackathon 开发,集成了 DocuSign 的技术以导入协议或模板,利用 OpenAI API 进行文本分析,并提供聊天界面,可回答有关合同的问题或提供寻找律师的来源。我们相信,弥合这一知识鸿沟将减少混淆、法律纠纷以及所有相关方错失的机会。
Demo
Inspiration
在 2024 年初,我与一位密友共同创办了一家初创公司。出于信任,我在未仔细审阅的情况下签署了公司的初始合同。随后,我投入了大量时间和专业知识来开发公司的 MVP,却没有得到报酬。我的朋友利用其额外的股权迫使我要么减少我的股份,要么被公司除名。找律师后,我发现自己不知不觉中放弃了重要权利,无法有效为自己或公司辩护。由于这位曾经亲密的朋友的自私和鲁莽行为,纠纷在个人层面给我带来了巨大压力,也让公司损失了宝贵的时间。这段经历让我深刻认识到,了解法律协议的每一个细节对于保护个人权利和确保组织稳定至关重要。
What it does
Features and Functionality:
-
Clear Contract Summaries: DocuInsight 使用先进的 AI 模型分析法律文件并生成简明摘要。这些摘要突出关键条款、异常条款、潜在风险和主要承诺,为用户提供清晰易懂的合同概览。
-
Interactive Chat Interface: AI 驱动的聊天功能允许用户与合同“对话”。他们可以询问特定条款、协议的整体目的或相关法律概念。聊天机器人还能浏览网络,提供有可靠来源、准确且最新的信息,确保用户获得可信的答案。
-
Lawyer Recommendations: 对于寻求额外法律帮助的用户,DocuInsight 生成优化的搜索查询,根据用户所在位置和所审阅的合同类型推荐律师。搜索结果包括律师的联系信息和评价,为用户提供可操作的方式与专家对接。
-
Enhanced Signing Process: DocuInsight 与 DocuSign 现有的签署工作流无缝集成。用户使用电子邮件登录,连接其 DocuSign 账户以访问模板,并发送文档进行签署。发送后,收件人可以审阅文档、交互 AI 生成的洞察,并像在标准 DocuSign 平台上一样完成签署。
-
Post-Signing Access: 签署后,用户可以通过原始链接重新访问文档,查看已签署的协议、获取 AI 洞察,并继续使用聊天界面进行后续提问。这确保签署者对其协议保持持续的清晰度。
这些功能使 DocuInsight 成为简化法律合同复杂性的强大工具。通过结合 AI 驱动的洞察、交互式支持以及与 DocuSign 的无缝集成,DocuInsight 赋能签署者做出明智决策,帮助发送者在分发协议时建立信任,并为法律专业人士提供与寻求进一步帮助的用户对接的机会。我们的目标是促进协议过程的透明度、信任和可及性,使法律文本更易理解,对所有人更公平。
如果您想观看我们使用 DocuInsight 并清晰演示其功能的视频,请查看我们制作的额外视频(这不是我们的演示视频,仅作为想了解更多细节的人的补充资源):
How we built it
DocuInsight 由三个主要部分组成:
- Database: 存储所有作业、报告、用户数据等。它包含项目所需的所有数据。
- Frontend: 项目的用户界面,用户看到并与之交互的部分。
- Analyzer: 负责分析法律合同并发送电子邮件的后端服务。
本项目使用了数据库。数据库为 PostgreSQL,托管在 Supabase 上。前端和 Analyzer 均通过 Supabase 的 SDK 使用其 API 访问数据库。数据库设置包括三个表:用户表、作业表和报告表。用户表用于身份验证并跟踪账户;作业表记录需要分析的合同;报告表存储 Analyzer 生成的所有合同报告。
前端使用名为 Next.js 的前端框架构建。在该框架中,我们使用了 HTML、Tailwind CSS、JavaScript、TypeScript 和 React。这些技术使前端能够动态且响应式地运行和展示内容。此外,前端还使用了多个 API:
- OpenAI 的 API:为每个签署会话托管并运行聊天机器人。
- DocuSign 的 API:具体而言,使用 eSignature API 处理所有签署流程,并从用户的 DocuSign 账户中轻松访问模板供 DocuInsight 使用。
- Tavily API:为 LLM 设计的专用搜索引擎 API,使聊天机器人能够浏览网络并检索最新新闻或更新。
- Resend API:用于处理所有与电子邮件相关的任务,主要用于前端的登录流程。
- Supabase API:访问托管在 Supabase 上的项目数据库,以执行 CRUD 操作。
前端完全托管在 Vercel 上,这是由 Next.js 框架的创建者开发的托管服务。
Analyzer 使用 Python 构建。它利用 OpenAI 的 API,使用 OpenAI 最先进的模型之一 o1-preview
来分析法律合同。它还使用 Resend API 发送电子邮件,主要用于发送收据或在 DocuInsight 上签署合同所需的电子邮件。Analyzer 支持 Discord webhook,允许用户在 Analyzer 运行期间出现关键错误或异常时收到警报。与项目的其他部分一样,Analyzer 也使用 Supabase 访问项目数据库。
Analyzer 的代码包含以下包:
- PyMuPDF、openpyxl、python-docx 和 OpenAI 的 o1-preview 模型:用于加载包括 PDF、DOCX、DOC、JPG 和 PNG 在内的各种文件类型的内容。
Analyzer 部署在一台至少 4 GB RAM 的 Linode 实例上,操作系统为 Ubuntu。
Challenges we ran into
构建 DocuInsight 充满了技术和实际挑战。我们必须找出如何实现安全的身份验证,并与数据库无缝连接,同时确保用户数据得到保护。了解哪些部分的 DocuSign API 适用于我们想要的功能需要大量的试错。构建前端以提供良好的用户体验,并将高级功能(如 LLM)集成到现有的 DocuSign 签署流程中也相当困难。将实时数据从服务器流式传输到客户端以供聊天界面使用颇具挑战性,同样,推荐律师也很棘手,因为没有易于获取或负担得起的律师专业数据集可通过 API 使用。我们必须为聊天机器人构建网页浏览逻辑,以尽量减少幻觉并提升答案的可靠性。最后,使项目达到生产就绪水平是最艰巨的任务。将本地演示的东西部署到网络并保持高可用性和可靠性,使任何人都能访问,这与仅在本地运行演示是完全不同的挑战。一次生产故障就可能留下不良印象,因此确保稳定性至关重要且极其困难。
Accomplishments that we’re proud of
We are proud of successfully deploying DocuInsight and making it accessible for anyone to use. Building a production-ready application that integrates seamlessly with DocuSign, handles real-world usage, and delivers reliable AI-powered insights was a significant achievement. It is one thing to build locally for a demo, but ensuring everything works in a live environment with high uptime was a challenge we are proud to have overcome.
我们学到的
Throughout this project, we realized that building a solution like DocuInsight was far more complex than we initially anticipated. Parsing legal documents, ensuring accuracy, and balancing AI capabilities with affordability required careful thought and constant iteration. We also learned the importance of proper video production. To ensure our demo effectively communicated our project’s value, we started working on the video two weeks before the deadline, using professional film equipment to deliver a polished final product. Additionally, scaling projects like this presented unique challenges. Calling advanced AI models to analyze content is computationally expensive, so we had to carefully balance using the most intelligent models with making the solution cost-effective. Finally, we conducted basic market research by browsing the web, speaking with potential users, and consulting lawyers to ensure DocuInsight could provide real value. This process taught us that building something meaningful requires validating its impact rather than simply creating a solution for the sake of it.
DocuInsight 的下一步
We plan to expand DocuInsight by developing more advanced AI agents for deeper contract analysis, refining vectorized datasets for better insights, and creating a more comprehensive directory of lawyers to connect signers and businesses with legal professionals in their area. Future features include tools like an SEC case search to reference legal precedents. Our goal is to deliver even more value to signers, senders, and businesses while fostering trust and transparency in agreements.