PAX-এর সাথে বিশ্বস্ত এআই
পটভূমি
PAX (Proactive Agent for eXemplary Trustworthiness) আমার আগের প্রকল্প, TARS, থেকে একটি বড় মোড় ঘুরিয়ে শুরু হয়েছিল; ওই প্রকল্পটি স্বয়ংক্রিয় সাইবারসিকিউরিটি পেনিট্রেশন টেস্টিংকে লক্ষ্য করেছিল। আমি যখন TARS তৈরি করছিলাম, তখন স্পষ্ট হয়ে যায় যে ব্যবহারিক, নির্ভরযোগ্য এআই এজেন্টের সবচেয়ে বড় বাধাগুলোর একটি ছিল শুধু কাজের স্বয়ংক্রিয়করণ নয়, বরং একটি AI-উৎপন্ন প্রতিক্রিয়ার বিশ্বস্ততা প্রতিষ্ঠা করা। বিশেষ করে যখন সেই আউটপুটগুলো বাস্তব-জগতের সিদ্ধান্তকে প্রভাবিত করতে পারে, যার বিশাল পরিণতি হতে পারে।
TARS-এর মাধ্যমে শুধু সাইবারসিকিউরিটি পেনিট্রেশন টেস্টিং কাজগুলো স্বয়ংক্রিয় করার পরিবর্তে, আমি একটি মৌলিক সমস্যার সমাধান করতে চেয়েছিলাম: একটি LLM যা বলে আমরা তা বিশ্বাস করতে পারি, তা আমরা কীভাবে জানব?
TARS আমার প্রথম স্টার্টআপ, Osgil,-এর জন্য একটি MVP হিসেবে তৈরি করা হয়েছিল, যেটি আমি সহ-প্রতিষ্ঠা করি। আমাদের লক্ষ্য ছিল এআই এজেন্ট ব্যবহার করে সাইবারসিকিউরিটি পেনিট্রেশন টেস্টিং স্বয়ংক্রিয় করা। TARS আমাদের Forum Ventures accelerator থেকে প্রি-সিড ফান্ডিং নিশ্চিত করতে সক্ষম করে। তবে, যখন আমরা প্রতিরক্ষা ও সাইবারসিকিউরিটি কোম্পানিগুলোর কাছে পৌঁছাই, আমরা আবিষ্কার করি যে সেই প্রতিষ্ঠানগুলো পেনিট্রেশন টেস্টিংয়ের মতো গুরুত্বপূর্ণ কাজ সম্পাদন ও রিপোর্ট করার জন্য এআই এজেন্টকে বিশ্বাস করত না। এছাড়াও, তাদের প্রায় সবাই মূলত সাইবারসিকিউরিটি কোম্পানিগুলোর সঙ্গেই ব্যবসা করতে চেয়েছিল, যাতে কিছু খারাপ হলে দোষ চাপানোর একজন থাকে। মূলত, এই কোম্পানিগুলোর সিদ্ধান্তগ্রহণকারীরা তাদের নিরাপত্তা নিয়ে তেমন মাথা ঘামাতেন না, যদি না তাদের তা করতেই হতো, এবং যখন করতেন, তখন তাদের মানদণ্ডের অংশ ছিল কিছু ভুল হলে দোষ চাপানোর একজন থাকা, একধরনের বীমা হিসেবে। ২০২৪ সালের শেষ নাগাদ, স্বয়ংক্রিয় AI-চালিত সাইবার আক্রমণ এখনও বড় কোনো উদ্বেগের বিষয় নয়, তাই সিদ্ধান্তগ্রহণকারীরা আমাদের সমাধানের বাস্তব প্রয়োজন দেখেননি। বাজারের চাহিদার এই অভাবের কারণে, আমরা LLM মডেলে হ্যালুসিনেশন কমানোর দিকে মনোযোগ দিতে মোড় নিই। LLM-এর নির্ভরযোগ্যতা উন্নত করার মাধ্যমে, আমরা বিশ্বাস করি আমাদের কাজ সাইবারসিকিউরিটির বাইরেও ভবিষ্যতের বিস্তৃত এআই এজেন্ট অ্যাপ্লিকেশনগুলোর উপকারে আসতে পারে।
ট্রান্সফর্মার্সের কাহিনি থেকে একটি প্রেরণা
PAX নামটি Transformers জগতের প্রতি একটি ইঙ্গিত। আইকনিক Optimus Prime হওয়ার আগে চরিত্রটির মূল নাম ছিল Orion Pax। সম্ভাবনা থেকে দায়িত্বে রূপান্তরের এই ধারণা PAX-এর মিশনকে অনুপ্রাণিত করেছে: অপরিশোধিত, চমকপ্রদ LLM সক্ষমতা থেকে এমন কিছুর দিকে এগোনো, যা সত্যিই নির্ভর করার মতো বিশ্বস্ত।
প্রকল্পের দৃষ্টি
PAX একটি গবেষণা এজেন্ট এবং ফ্রেমওয়ার্ক, যা পদ্ধতিগতভাবে:
- যেকোনো LLM প্রতিক্রিয়ার বিশ্বস্ততা পরিমাপ করে।
- হ্যালুসিনেশন এবং অসমর্থিত বিবৃতিগুলো কমায়।
- যাচাইযোগ্য উৎসে অ্যাট্রিবিউশন বাধ্যতামূলক করে এবং তা অনুসরণ করে।
- ব্যাখ্যাযোগ্য, কাঠামোবদ্ধ প্রতিবেদন প্রদান করে, যা প্রতিক্রিয়া ও দাবিগুলোর উভয়কেই স্কোর করে।
এই প্রকল্পের লক্ষ্য হলো LLM-গুলোকে শুধু যুক্তিসঙ্গত নয়, বরং প্রমাণযোগ্যভাবে বিশ্বস্ত করে তোলা, ঝুঁকি ও আস্থার স্বচ্ছ পরিমাপসহ।
দ্রুত ও মৌলিক ডেমো
PAX কীভাবে কাজ করে তার সংক্ষিপ্ত বিবরণ
১. বাধ্যতামূলক অ্যাট্রিবিউশন
যেকোনো ব্যবহারকারী প্রশ্নের ক্ষেত্রে, PAX প্রম্পটটিকে এমন একটি এজেন্টের মাধ্যমে পাঠায়, যা সাধারণ জ্ঞান এবং যাচাইয়ের প্রয়োজন এমন তথ্যের মধ্যে কঠোর পার্থক্য করে। যখন প্রতিক্রিয়ায় এমন তথ্য বা দাবি থাকে যা ব্যাপকভাবে সাধারণ জ্ঞান হিসেবে বিবেচিত নয় (যেমন পরিসংখ্যান, সাম্প্রতিক ঘটনা ইত্যাদি), PAX নিশ্চিত করে যে এজেন্ট নির্ভরযোগ্য, হালনাগাদ বহিরাগত উৎস খুঁজে আনে ও সেগুলোকে উল্লেখ করে।
ছদ্ম-প্রক্রিয়া:
- যদি দাবি সাধারণ জ্ঞান না হয় → বহিরাগত অনুসন্ধান API চালাও
- ফলাফল সংগ্রহ করো, প্রতিটি গুরুত্বপূর্ণ বিবৃতিকে প্রাসঙ্গিক রেফারেন্সের সঙ্গে মানচিত্রায়িত করো
- প্রতিক্রিয়ায় কাঠামোবদ্ধ প্লেসহোল্ডার সন্নিবেশ করো (সাধারণ URL বা কাঁচা ফুটনোট নয়)
২. সম্ভাব্যতাভিত্তিক আস্থা-স্কোরিং
PAX শুধু মানবীয় অন্তর্দৃষ্টির উপর নির্ভর করে না। এটি ভাষা মডেলটি তার উত্তরের প্রতিটি অংশ তৈরি করতে কতটা “নিশ্চিত” ছিল তা মাপে, টেক্সট উৎপাদনের সময় ব্যবহৃত অন্তর্নিহিত সম্ভাবনাগুলো বিশ্লেষণ করে। এর ফলে সিস্টেমটি প্রতিটি বাক্যের জন্য, এবং পুরো উত্তরের জন্যও একটি সংখ্যাগত বিশ্বস্ততা স্কোর নির্ধারণ করতে পারে। নিম্ন-আস্থার অংশগুলো এভাবে স্বয়ংক্রিয়ভাবে চিহ্নিত করা যায়।
ছদ্ম-প্রক্রিয়া:
- প্রতিটি প্রতিক্রিয়া টোকেন/শব্দের জন্য, সেই পছন্দের ক্ষেত্রে মডেলের সম্ভাবনা উদ্ধার করো
- বাক্যজুড়ে একত্রিত করো
- প্রতিবাক্য ও সামগ্রিক বিশ্বস্ততা/নির্ভরযোগ্যতা স্কোর তৈরি করো
৩. পর্যবেক্ষিত সামঞ্জস্য
একটি উত্তর মেনে নেওয়ার পরিবর্তে, PAX LLM-কে একই প্রশ্ন বহুবার জিজ্ঞাসা করে, এবং এমবেডিংস (অর্থের ভেক্টর-রূপায়ণ) ব্যবহার করে সম্ভাব্য প্রতিক্রিয়াগুলোর মধ্যে ঐকমত্য ও সামঞ্জস্য পরিমাপ করে।
- উচ্চ মাত্রার ঐকমত্য নির্দেশ করে যে উত্তরটি দৃঢ়/স্থিতিশীল
- বহুল পরিবর্তনশীল প্রতিক্রিয়াগুলো সতর্ক সংকেত: সম্ভাব্য ঝুঁকি বা অস্পষ্টতা
ছদ্ম-প্রক্রিয়া:
- একই প্রশ্ন LLM-কে বহুবার পাঠাও; প্রতিক্রিয়াগুলো সংগ্রহ করো
- আউটপুটগুলোর মধ্যে অর্থগত সাদৃশ্য স্কোর গণনা করো
- ব্যবহারকারীর জন্য একটি “সামঞ্জস্য স্কোর” প্রতিবেদন করো
৪. স্ব-মূল্যায়ন
PAX ঐচ্ছিকভাবে আরেকটি LLM (অথবা এনসেম্বল)-কে পুরো ইন্টারঅ্যাকশন, উদ্ধৃতি, এবং সম্ভাবনা স্কোরগুলো পর্যালোচনা করতে বলে, এবং ০-১ এর মধ্যে একটি সংখ্যা ও একটি বর্ণনামূলক ব্যাখ্যা হিসেবে নিজের চূড়ান্ত রায় দিতে বলে। এটি আত্ম-প্রতিফলনের একটি মেটা স্তর যোগ করে।
ছদ্ম-প্রক্রিয়া:
- আলাপ/প্রতিবেদন একটি মূল্যায়নকারী এজেন্টের কাছে পাঠাও (ভিন্ন মডেল)
- এজেন্ট তথ্যনিষ্ঠতা, সামঞ্জস্য, উদ্ধৃতি-অখণ্ডতা, এবং আস্থার সমালোচনা করে
- অডিটযোগ্যতার জন্য ব্যাখ্যাসহ একটি চূড়ান্ত বিশ্বস্ততা স্কোর আউটপুট করে
ইন্টারঅ্যাকশন প্রবাহ
PAX-এর ইন্টারঅ্যাকশন প্রবাহ নিম্নরূপ:
- ব্যবহারকারী একটি প্রম্পট পাঠায়।
- PAX এজেন্ট প্রম্পটটি প্রক্রিয়া করে, প্রয়োজন অনুযায়ী বহিরাগত API-র সাথে পরামর্শ করে, এবং কাঠামোবদ্ধ অ্যাট্রিবিউশনসহ একটি প্রতিক্রিয়া তৈরি করে।
- সিস্টেমটি:
- প্রতি-বিবৃতির বিশ্বস্ততা/আস্থা স্কোর নির্ধারণ করে
- কোন অংশ কোন প্রমাণ দ্বারা সমর্থিত তা লগ করে
- ঐচ্ছিকভাবে, একটি আত্ম-প্রতিফলিত সারাংশ এবং বিশ্বস্ততা স্কোর তৈরি করে
ফলাফল হলো একটি অত্যন্ত স্বচ্ছ উত্তর, যেখানে সংখ্যাগত স্কোর এবং সংযুক্ত রেফারেন্স থাকে, পাশাপাশি সব সমর্থনকারী ডেটার একটি নিরীক্ষাযোগ্য রেকর্ডও থাকে।
প্রেরণা
PAX কাজ করাতে যে পদ্ধতিগুলো ব্যবহার করা হয়েছে, সেগুলো CleanLabs-এর করা কাজ দ্বারা গভীরভাবে অনুপ্রাণিত। বিশেষ করে, তাদের স্কোরিং অ্যালগরিদম/পদ্ধতি, যেমনটি এখানে বিস্তারিতভাবে বর্ণনা করা হয়েছে। এই অ্যালগরিদম/পদ্ধতির মধ্যে, নিম্নলিখিতগুলো ব্যবহার করা হয়:
-
স্ব-প্রতিফলন: এটি এমন একটি প্রক্রিয়া, যেখানে LLM-কে স্পষ্টভাবে প্রতিক্রিয়াটিকে রেট করতে বলা হয় এবং এই প্রতিক্রিয়াটি কতটা আত্মবিশ্বাসের সঙ্গে ভালো দেখাচ্ছে তা স্পষ্টভাবে বলতে বলা হয়।
-
সম্ভাব্যতাভিত্তিক পূর্বাভাস: এটি এমন “একটি প্রক্রিয়া, যেখানে আমরা অনুরোধের ভিত্তিতে একটি প্রতিক্রিয়া তৈরি করার সময় (অটো-রিগ্রেসিভভাবে টোকেন ধরে টোকেন) LLM দ্বারা নির্ধারিত প্রতি-টোকেন সম্ভাবনাগুলো বিবেচনা করি”।
-
পর্যবেক্ষিত সামঞ্জস্য: এই স্কোরিং হলো এমন একটি প্রক্রিয়া, যেখানে LLM সম্ভাব্যভাবে একাধিক গ্রহণযোগ্য প্রতিক্রিয়া তৈরি করে, যেগুলো ভালো হতে পারে বলে মনে করে, এবং আমরা পরিমাপ করি এই প্রতিক্রিয়াগুলো পরস্পরের সঙ্গে (অথবা একটি নির্দিষ্ট প্রতিক্রিয়ার সঙ্গে) কতটা বিরোধপূর্ণ।
কেন এটি গুরুত্বপূর্ণ?
প্রচলিত LLM স্থাপনা তথ্য হ্যালুসিনেট করতে পারে অথবা পুরোনো কিন্তু বিশ্বাসযোগ্য-সদৃশ, অথচ ভুল তথ্য দিতে পারে। গবেষণা, স্বাস্থ্যসেবা, আইনগত, এবং প্রযুক্তিগত পরামর্শের মতো মিশন-সমালোচনামূলক ব্যবহারের জন্য, যাচাই-অযোগ্য এআই একেবারেই যথেষ্ট নয়।
PAX এআই-এ _বিশ্বাস_কে পরিমাপযোগ্য এবং ব্যাখ্যাযোগ্য করতে চায়। এর পদ্ধতি:
- তুচ্ছ নয় এমন দাবির জন্য “কাজ দেখাও” ধরনের প্রমাণ দাবি করে।
- প্রতিটি আউটপুটে কতটা আস্থা রাখা উচিত তা পরিমাপ করে।
- ব্যবহারকারীদেরকে অডিট করতে এবং বুঝতে দেয় কেন একটি উত্তরকে বিশ্বাস করা উচিত (বা উচিত নয়)।
গবেষণার অবস্থা ও পরবর্তী পদক্ষেপ
PAX বর্তমানে Osgil-এর ছাতার নিচে একটি ব্যক্তিগত গবেষণা প্রকল্প হিসেবে সক্রিয় উন্নয়ন পর্যায়ে রয়েছে। প্রধান ক্ষেত্রগুলোর মধ্যে রয়েছে:
- বহিরাগত অনুসন্ধান ও স্কোরিংয়ের বিলম্ব কমানো।
- ব্যবহারকারীর ধারণা বনাম স্বয়ংক্রিয় বিশ্বস্ততা স্কোর নিয়ে পরীক্ষা-নিরীক্ষা।
- বিজ্ঞান, সংবাদ, এবং নিয়ন্ত্রক ব্যবহারের জন্য ডোমেইন-নির্দিষ্ট প্লাগইন তৈরি করা।
- উন্মুক্ত গবেষণা এবং সম্ভাব্য প্রকাশের জন্য বেঞ্চমার্ক ডেটাসেট প্রস্তুত করা।
শেষ কথা
PAX-এর উদ্দেশ্য হলো LLM-গুলোকে “ব্ল্যাক বক্স সম্ভাব্যতা-উৎপাদক” থেকে স্বচ্ছ, উদ্ধৃতিযোগ্য, এবং সংখ্যাগতভাবে বিশ্বাসযোগ্য সহকারীতে রূপান্তর করা, যা বাস্তব-জগতের উচ্চ-ঝুঁকির কাজের জন্য অত্যন্ত গুরুত্বপূর্ণ। আপনি যদি সহযোগিতা, অডিট, বা বিশ্বস্ত জেনারেটিভ এআই-এর ভবিষ্যৎ নিয়ে আলোচনা করতে আগ্রহী হন, অনুগ্রহ করে যোগাযোগ করুন। পড়ার জন্য ধন্যবাদ!