DocuInsight Đơn Giản Hóa Việc Ký

Sự kiện

15 tháng 9, 2025: DocuInsight đã được ngưng hoạt động nhưng hiện đã được mã nguồn hóa hoàn toàn và công khai tại github.com/eandf/DocuInsight với tài liệu tại eandf.github.io/DocuInsight. Tên miền gốc chuyển hướng tới đó cho đến năm 2027.

27 tháng 1, 2025: DocuInsight được xây dựng bởi Mehmet YilmazDylan Eck cho DocuSign Hackathon Unlocked 2024-2025. Hãy xem www.docuinsight.ai hoặc bản demo trực tiếp của chúng tôi. Bài viết này dựa trên bài nộp trên Devpost của chúng tôi.

Giới thiệu

DocuInsight là một nền tảng đơn giản hóa các hợp đồng pháp lý bằng cách làm nổi bật các điều khoản chính, dịch chúng sang tiếng Anh dễ hiểu, tích hợp với DocuSign để ký điện tử, và cung cấp quyền truy cập tới các chuyên gia pháp lý.

DocuInsight được tạo ra để giải quyết Bẫy Thỏa Thuận, nơi các chi tiết hợp đồng quan trọng bị giấu sau biệt ngữ pháp lý, khiến người ta ký mà không hiểu đầy đủ quyền lợi hoặc nghĩa vụ của mình. Tầm nhìn của chúng tôi là giúp cả hai bên của bất kỳ thỏa thuận nào, người ký và người gửi, có được sự rõ ràng hoàn toàn trước khi ký. Thêm vào đó, chúng tôi muốn cung cấp một cách đơn giản để người dùng kết nối với các chuyên gia pháp lý nếu họ cần tư vấn cá nhân hóa.

Được phát triển từ tháng 12 năm 2024 đến tháng 1 năm 2025 cho cuộc thi Hackathon của DocuSign, DocuInsight tích hợp với công nghệ của DocuSign để nhập các thỏa thuận hoặc mẫu, sử dụng API của OpenAI để phân tích văn bản, và cung cấp giao diện trò chuyện có thể trả lời câu hỏi về hợp đồng hoặc cung cấp các nguồn để tìm luật sư. Chúng tôi tin rằng thu hẹp khoảng cách kiến thức này sẽ giảm bớt sự nhầm lẫn, tranh chấp pháp lý và các cơ hội bị bỏ lỡ cho mọi người tham gia.

Bản demo

Nguồn cảm hứng

Vào đầu năm 2024, tôi đồng sáng lập một startup với một người bạn thân. Tin tưởng anh ấy, tôi đã ký các hợp đồng ban đầu của công ty mà không xem xét kỹ lưỡng. Sau khi đầu tư nhiều thời gian và chuyên môn để phát triển MVP của công ty mà không được trả lương, người bạn đó đã dùng cổ phần bổ sung của mình để buộc tôi phải giảm cổ phần hoặc bị loại khỏi công ty. Sau khi tìm được luật sư, tôi phát hiện ra rằng tôi vô tình đã ký nhượng lại các quyền quan trọng và không thể tự bảo vệ mình hoặc công ty một cách hiệu quả. Do hành vi ích kỷ và liều lĩnh của người bạn từng thân thiết, tranh chấp đã gây căng thẳng cho tôi về mặt cá nhân và khiến công ty mất thời gian quý giá. Trải nghiệm này dạy tôi tầm quan trọng thiết yếu của việc hiểu mọi chi tiết trong các thỏa thuận pháp lý để bảo vệ quyền lợi cá nhân và đảm bảo sự ổn định của tổ chức.

Những gì nó làm

Các tính năng và chức năng cốt lõi của DocuInsight như sau:

  1. Tóm tắt hợp đồng rõ ràng: DocuInsight sử dụng các mô hình AI tiên tiến để phân tích các tài liệu pháp lý và tạo ra các bản tóm tắt ngắn gọn. Những bản tóm tắt này làm nổi bật các điều khoản chính, các điều khoản bất thường, các rủi ro tiềm ẩn và các cam kết lớn, cung cấp cho người dùng một cái nhìn tổng quan rõ ràng và dễ hiểu về hợp đồng.

  2. Giao diện trò chuyện tương tác: Tính năng trò chuyện được hỗ trợ bởi AI cho phép người dùng “nói chuyện” với hợp đồng của họ. Họ có thể đặt câu hỏi về các điều khoản cụ thể, mục đích tổng thể của thỏa thuận, hoặc các khái niệm pháp lý liên quan. Chatbot cũng có thể duyệt web để cung cấp thông tin có nguồn tin cậy, chính xác và cập nhật, đảm bảo người dùng nhận được câu trả lời đáng tin cậy.

  3. Gợi ý luật sư: Đối với người dùng tìm kiếm hỗ trợ pháp lý bổ sung, DocuInsight tạo các truy vấn tìm kiếm được tối ưu hóa để đề xuất luật sư dựa trên vị trí của người dùng và loại hợp đồng họ đang xem xét. Kết quả tìm kiếm bao gồm thông tin liên hệ và đánh giá của các chuyên gia pháp lý, cung cấp cho người dùng một cách có thể thực hiện để kết nối với chuyên gia.

  4. Quy trình ký nâng cao: DocuInsight tích hợp liền mạch với quy trình ký hiện có của DocuSign. Người dùng đăng nhập bằng email, kết nối tài khoản DocuSign của họ để truy cập các mẫu, và gửi tài liệu để ký. Khi đã gửi, người nhận có thể xem lại tài liệu, tương tác với các phân tích do AI tạo ra, và ký như họ vẫn làm trong nền tảng DocuSign tiêu chuẩn.

  5. Truy cập sau khi ký: Sau khi ký, người dùng có thể truy cập lại tài liệu thông qua liên kết gốc để xem lại thỏa thuận đã ký, truy cập các phân tích AI, và tiếp tục tương tác với giao diện trò chuyện cho các câu hỏi theo dõi. Điều này đảm bảo người ký luôn có sự rõ ràng liên tục về các thỏa thuận của họ.

Những tính năng này làm cho DocuInsight trở thành một công cụ mạnh mẽ để đơn giản hóa những phức tạp của các hợp đồng pháp lý. Bằng cách kết hợp các phân tích do AI điều khiển, hỗ trợ tương tác và tích hợp liền mạch với DocuSign, DocuInsight giúp người ký đưa ra quyết định thông tin, hỗ trợ người gửi xây dựng lòng tin vào các thỏa thuận họ phân phối, và cung cấp cơ hội cho các chuyên gia pháp lý kết nối với người dùng tìm kiếm trợ giúp thêm. Mục tiêu của chúng tôi là thúc đẩy tính minh bạch, sự tin tưởng và khả năng tiếp cận trong quy trình thỏa thuận, giúp văn bản pháp lý dễ hiểu hơn và công bằng hơn cho mọi người.

Nếu bạn muốn xem một video rõ ràng về việc chúng tôi sử dụng DocuInsight và trình diễn các tính năng của nó, hãy xem video bổ sung này mà chúng tôi làm về DocuInsight đang hoạt động (đây KHÔNG phải là video demo của chúng tôi, chỉ là tài nguyên bổ sung nếu mọi người muốn biết thêm chi tiết):

Cách chúng tôi xây dựng nó

DocuInsight gồm ba phần chính:

  • Cơ sở dữ liệu: Lưu trữ tất cả các công việc, báo cáo, dữ liệu người dùng, v.v. Nó chứa dữ liệu cần thiết cho dự án.
  • Giao diện: Giao diện người dùng cho dự án, những gì người dùng nhìn thấy và tương tác.
  • Bộ phân tích: Một dịch vụ backend chịu trách nhiệm phân tích các hợp đồng pháp lý và gửi email.

Đối với dự án này, một cơ sở dữ liệu đã được sử dụng. Cơ sở dữ liệu là PostgreSQL, và nó được lưu trữ trên Supabase. Cả Frontend và Analyzer đều truy cập cơ sở dữ liệu bằng API của Supabase thông qua SDK của họ. Cấu trúc cơ sở dữ liệu bao gồm ba bảng: một cho người dùng, một cho công việc, và một cho báo cáo. Bảng người dùng được sử dụng cho xác thực và để theo dõi tài khoản. Bảng công việc theo dõi các hợp đồng cần được phân tích. Bảng báo cáo lưu trữ tất cả các báo cáo về hợp đồng được tạo bởi Bộ phân tích.

Frontend được xây dựng bằng một framework frontend có tên Next.js. Trong framework này, chúng tôi sử dụng HTML, Tailwind CSS, JavaScript, TypeScript và React. Những công nghệ này cho phép giao diện hoạt động và hiển thị nội dung một cách động và phản hồi. Thêm vào đó, chúng tôi sử dụng một số API trong frontend:

  • OpenAI’s API: Để lưu trữ và chạy chatbot cho mỗi phiên ký.
  • DocuSign’s API: Cụ thể, API eSignature được sử dụng để xử lý tất cả các quy trình ký và cung cấp truy cập dễ dàng tới các mẫu của người dùng từ tài khoản DocuSign trên DocuInsight.
  • Tavily API: Một API công cụ tìm kiếm chuyên dụng dành cho các LLM, cho phép chatbot duyệt web và lấy tin tức hoặc cập nhật mới nhất.
  • Resend API: Được sử dụng để xử lý tất cả các tác vụ liên quan đến email, chủ yếu cho quá trình đăng nhập trên frontend.
  • Supabase API: Truy cập cơ sở dữ liệu dự án được lưu trữ trên Supabase để thực hiện các thao tác CRUD.

Frontend được lưu trữ hoàn toàn trên Vercel, một dịch vụ lưu trữ được phát triển bởi những người tạo ra framework Next.js.

Bộ phân tích được xây dựng bằng Python. Nó sử dụng API của OpenAI để phân tích các hợp đồng pháp lý bằng một trong những mô hình tiên tiến nhất của OpenAI, o1-preview. Nó cũng sử dụng Resend API để gửi email, chủ yếu để gửi biên nhận hoặc email cần thiết để ký hợp đồng trên DocuInsight. Bộ phân tích hỗ trợ webhook của Discord, cho phép người dùng nhận cảnh báo nếu có điều gì đó nghiêm trọng bị hỏng hoặc xảy ra trong khi Bộ phân tích đang chạy. Giống như phần còn lại của dự án, Bộ phân tích sử dụng Supabase để truy cập cơ sở dữ liệu của dự án.

Mã cho Bộ phân tích kết hợp các gói như PyMuPDF, openpyxl, python-docx, và OpenAI’s o1-preview model: Để tải nội dung của nhiều loại tệp khác nhau, bao gồm PDF, DOCX, DOC, JPG và PNG.

Bộ phân tích được lưu trữ trên một phiên bản Linode với ít nhất 4 GB RAM, chạy Ubuntu làm hệ điều hành.

Những thách thức chúng tôi gặp phải

Việc xây dựng DocuInsight đầy ắp những thách thức kỹ thuật và thực tiễn. Chúng tôi phải tìm cách triển khai xác thực an toàn kết nối liền mạch với cơ sở dữ liệu trong khi đảm bảo dữ liệu người dùng được bảo vệ. Hiểu những phần nào của API DocuSign cần sử dụng cho các chức năng mà chúng tôi muốn đòi hỏi nhiều thử nghiệm và sai sót. Cấu trúc frontend để cung cấp trải nghiệm người dùng tốt và tích hợp các tính năng nâng cao như chức năng LLM vào quy trình ký DocuSign hiện có cũng khó để làm đúng. Việc phát trực tiếp dữ liệu thời gian thực từ máy chủ tới client cho giao diện trò chuyện thì phức tạp, cũng như tìm cách đề xuất luật sư, bởi vì không có một tập dữ liệu dễ truy cập hoặc chi phí thấp cho các chuyên gia pháp lý thông qua API. Chúng tôi phải xây dựng logic duyệt web cho chatbot để giảm thiểu ảo tưởng và làm cho các câu trả lời đáng tin cậy hơn. Cuối cùng, làm cho dự án sẵn sàng cho môi trường sản xuất là phần khó nhất. Xây dựng và chạy thứ gì đó cục bộ cho một bản demo là một chuyện, nhưng triển khai nó trên web với thời gian hoạt động cao và độ tin cậy để bất kỳ ai cũng có thể truy cập là một thách thức hoàn toàn khác. Một lỗi duy nhất trong sản xuất có thể để lại ấn tượng xấu, vì vậy đảm bảo độ ổn định là điều quan trọng và cực kỳ khó khăn.

Những thành tựu mà chúng tôi tự hào

Chúng tôi tự hào đã triển khai thành công DocuInsight và làm cho nó có thể truy cập để bất kỳ ai cũng có thể sử dụng. Xây dựng một ứng dụng sẵn sàng cho môi trường sản xuất tích hợp liền mạch với DocuSign, xử lý việc sử dụng trong thế giới thực và cung cấp những hiểu biết đáng tin cậy được hỗ trợ bởi AI là một thành tựu đáng kể. Xây dựng ở môi trường cục bộ cho một bản demo thì khác, nhưng đảm bảo mọi thứ hoạt động trong môi trường trực tiếp với độ sẵn sàng cao là một thách thức mà chúng tôi tự hào đã vượt qua.

Những gì chúng tôi đã học được

Trong suốt dự án này, chúng tôi nhận ra rằng xây dựng một giải pháp như DocuInsight phức tạp hơn nhiều so với những gì chúng tôi ban đầu dự đoán. Phân tích tài liệu pháp lý, đảm bảo độ chính xác, và cân bằng khả năng của AI với tính khả thi về chi phí đòi hỏi suy nghĩ cẩn thận và lặp lại liên tục. Chúng tôi cũng nhận ra tầm quan trọng của việc sản xuất video đúng cách. Để đảm bảo bản demo của chúng tôi truyền đạt hiệu quả giá trị của dự án, chúng tôi bắt đầu làm video hai tuần trước hạn chót, sử dụng thiết bị quay phim chuyên nghiệp để cho ra sản phẩm cuối cùng chỉn chu. Thêm vào đó, việc mở rộng quy mô các dự án như thế này đặt ra những thách thức đặc thù. Gọi các mô hình AI tiên tiến để phân tích nội dung tốn kém về mặt tính toán, nên chúng tôi phải cân bằng cẩn thận giữa việc sử dụng các mô hình thông minh nhất và làm cho giải pháp có hiệu quả về chi phí. Cuối cùng, chúng tôi đã tiến hành nghiên cứu thị trường cơ bản bằng cách duyệt web, nói chuyện với người dùng tiềm năng và tham khảo ý kiến các luật sư để đảm bảo DocuInsight có thể cung cấp giá trị thực sự. Quá trình này dạy chúng tôi rằng xây dựng điều gì đó có ý nghĩa đòi hỏi phải xác thực tác động của nó thay vì đơn giản chỉ tạo ra một giải pháp cho có.

Điều gì tiếp theo cho DocuInsight

Chúng tôi dự định mở rộng DocuInsight bằng cách phát triển các tác nhân AI nâng cao hơn để phân tích hợp đồng sâu hơn, tinh chỉnh các tập dữ liệu được vector hóa để có những hiểu biết tốt hơn, và tạo ra một danh bạ luật sư toàn diện hơn để kết nối những người ký và doanh nghiệp với các chuyên gia pháp lý trong khu vực của họ. Các tính năng tương lai bao gồm các công cụ như tìm kiếm vụ án SEC để tham chiếu tiền lệ pháp lý. Mục tiêu của chúng tôi là mang lại nhiều giá trị hơn nữa cho người ký, người gửi và doanh nghiệp đồng thời thúc đẩy niềm tin và minh bạch trong các thỏa thuận.