প্যাক্সের সাথে বিশ্বাসযোগ্য এআই

পটভূমি

প্যাক্স (প্রোঅ্যাকটিভ এজেন্ট ফর একজেম্পলারী ট্রাস্টওর্থিনেস) আমার পূর্ববর্তী প্রকল্প, টার্স, থেকে একটি বড় দিক পরিবর্তন হিসেবে শুরু হয়েছিল, যা স্বয়ংক্রিয় সাইবারসিকিউরিটি পেনিট্রেশন টেস্টিং লক্ষ্য করেছিল। আমি টার্স বিকাশ করার সময় এটি স্পষ্ট হয়ে উঠল যে প্রায়োগিক, নির্ভরযোগ্য এআই এজেন্টদের সামনে সবচেয়ে বড় বাধাগুলির এক ছিল কেবল টাস্ক স্বয়ংক্রিয়করণ নয়, বরং এআই-তৈরি প্রতিক্রিয়ার বিশ্বাসযোগ্যতা প্রতিষ্ঠা করা। বিশেষত যখন ওই আউটপুটগুলি বাস্তব-জগতের সিদ্ধান্তকে প্রভাবিত করতে পারে যার বিশাল পরিণতি থাকতে পারে।

টার্সকে কেবল সাইবারসিকিউরিটি পেনিট্রেশন টেস্টিং টাস্ক স্বয়ংক্রিয় করার জন্য নয় বরং একটি মৌলিক সমস্যা সমাধান করার জন্য আমি তৈরি করেছিলাম: কীভাবে আমরা জানব যে আমরা একটি এলএলএম যা বলে তা বিশ্বাস করতে পারি?

টার্স আমার প্রথম স্টার্টআপ, ওসгил, এর জন্য একটি এমভিপি হিসেবে তৈরি করা হয়েছিল, যা আমি সহ-প্রতিষ্ঠা করেছিলাম। আমাদের লক্ষ্য ছিল এআই এজেন্ট ব্যবহার করে সাইবারসিকিউরিটি পেনিট্রেশন টেস্টিং স্বয়ংক্রিয় করা। টার্স আমাদেরকে ফোরাম ভেঞ্চার্স অ্যাক্সিলারেটর থেকে প্রি-সিড তহবিল secured করতে সক্ষম করেছিল। কিন্তু যখন আমরা ডিফেন্স এবং সাইবারসিকিউরিটি কোম্পানিগুলোর কাছে গিয়েছিলাম, তখন আমরা আবিষ্কার করতাম যে সেই প্রতিষ্ঠানগুলো বিশ্বাস করে না যে এআই এজেন্টরা পেনিট্রেশন টেস্টিং-এর মতো গুরুত্বপূর্ণ কাজগুলি সম্পাদন করে রিপোর্ট করবে। তাছাড়া, প্রায় সব সংস্থাই মূলত সাইবারসিকিউরিটি কোম্পানিগুলির সাথে ব্যবসা করতে চেয়েছিল যাতে কোনো সমস্যা হলে দোষ চাপানোর জন্য একজন লোক থাকে। মূলত, এই কোম্পানিগুলির সিদ্ধান্ত গ্রহণকারীরা তাদের নিরাপত্তার ব্যাপারে ততটা যত্নী নয় যতটা হওয়া উচিত, এবং যখন তারা যত্ন নিত, তখন তাদের মনোযোগের একটি অংশ ছিল কোনো সমস্যা হলে একজন দোষী ব্যক্তি থাকা, যা এক ধরনের বীমা ছিল। ২০২৪ সালের শেষ নাগাদ, স্বয়ংক্রিয় এআই-চালিত সাইবার আক্রমণগুলো এখনও বড় একটি উদ্বেগের বিষয় ছিল না, তাই সিদ্ধান্ত গ্রহণকারীরা আমাদের সমাধানের বাস্তব প্রয়োজনীয়তা দেখছিলেন না। বাজার চাহিদার এই অভাবে, আমরা এলএলএম মডেলগুলিতে হলুসিনেশন কমানোর উপর মনোনিবেশ করতে পিভট করলাম। এলএলএম নির্ভরযোগ্যতা উন্নত করার মাধ্যমে, আমরা বিশ্বাস করি আমাদের কাজ সাইবারসিকিউরিটি বাইরেও ভবিষ্যতের বিস্তীর্ণ এআই এজেন্ট অ্যাপ্লিকেশনগুলিকে উপকৃত করতে পারে।

ট্রান্সফর্মার্স কাহিনী থেকে এক টান

নাম প্যাক্স হলো ট্রান্সফর্মার্স ইউনিভার্সকে শ্রদ্ধা জানিয়ে রাখা একটি ইঙ্গিত। আইকনিক অপটিমাস প্রাইম হওয়ার আগে, চরিত্রটির মূল নাম ছিল অরিয়ন প্যাক্স। সম্ভাবনা থেকে দায়িত্বে রূপান্তরের এই ধারণাই প্যাক্সের মিশনকে অনুপ্রাণিত করেছে — কাঁচা, চমকপ্রদ এলএলএম ক্ষমতা থেকে এমন কিছুতে যাওয়া যা সত্যিই নির্ভরযোগ্য হবে।

প্রকল্পের দৃষ্টিভঙ্গি

প্যাক্স একটি গবেষণা এজেন্ট এবং ফ্রেমওয়ার্ক যা পদ্ধতিগতভাবে:

যে কোন এলএলএম প্রতিক্রিয়ার বিশ্বাসযোগ্যতা পরিমাপ করে।
হলুসিনেশন এবং অনুন্নত/অসমর্থিত বিবৃতিগুলি হ্রাস করে।
যাচাইযোগ্য সূত্রে অ্যাট্রিবিউশন বাধ্যতামূলক করে এবং ট্র্যাক করে।
উভয় উত্তর এবং দাবির জন্য ব্যাখ্যাযোগ্য, গঠনবদ্ধ প্রতিবেদন প্রদান করে এবং স্কোর দেয়।

এই প্রকল্পের উদ্দেশ্য হল এলএলএমগুলিকে কেবল সম্ভাব্য না করে, বরং প্রমাণযোগ্যভাবে বিশ্বাসযোগ্য করা, ঝুঁকি এবং আত্মবিশ্বাসের স্বচ্ছ পরিমাপ সহ।

দ্রুত ও মৌলিক ডেমো

প্যাক্স কীভাবে কাজ করে: সংক্ষেপে

1. বাধ্যতামূলক অ্যাট্রিবিউশন

যেকোন ব্যবহারকারী প্রশ্নের জন্য, প্যাক্স প্রম্পটটি এমন একটি এজেন্টের মাধ্যমে rout করে যা সাধারণ জ্ঞানের এবং যাচাই প্রয়োজন এমন তথ্যের মধ্যে কড়াভাবে পার্থক্য স্থাপন করে। যখন প্রতিক্রিয়ায় এমন তথ্য বা দাবি থাকে যা ব্যাপকভাবে সাধারণ জ্ঞান হিসেবে বিবেচিত হয় না (যেমন পরিসংখ্যান, সাম্প্রতিক ঘটনা ইত্যাদি), প্যাক্স নিশ্চিত করে যে এজেন্ট বিশ্বাসযোগ্য, আপ-টু-ডেট বাহ্যিক সূত্রগুলি পুনরুদ্ধার করে এবং উল্লেখ করে।

ছদ্ম-প্রক্রিয়া:

যদি দাবি সাধারণ জ্ঞান না হয় → বাহ্যিক সার্চ এপিআই চালান

ফলাফল সংগ্রহ করুন, প্রতিটি গুরুত্বপূর্ণ বিবৃতিকে প্রাসঙ্গিক রেফারেন্সের সাথে ম্যাপ করুন

প্রতিক্রিয়ায় গঠনবদ্ধ প্লেসহোল্ডার যোগ করুন (শুধু URL বা কাঁচা ফুটনোট নয়)

2. প্রবণগত আত্মবিশ্বাস স্কোরিং

প্যাক্স কেবল মানুষী অন্তর্দৃষ্টির উপর নির্ভর করে না। এটি প্রতিটি অংশ তৈরি করার সময় ভাষা মডেলটি কতটা “আত্মবিশ্বাসী” ছিল তা পরিমাপ করে, টেক্সট জেনারেশনের সময় ব্যবহৃত অভ্যন্তরীণ সম্ভাব্যতাগুলি বিশ্লেষণ করে। এটি সিস্টেমটিকে প্রতিটি sentence-এ এবং সম্পূর্ণ উত্তরের জন্য একটি সংখ্যাসূচক বিশ্বাস স্কোর নির্ধারণ করতে সক্ষম করে। কম আত্মবিশ্বাসযুক্ত অংশগুলি স্বয়ংক্রিয়ভাবে চিহ্নিত করা যেতে পারে।

ছদ্ম-প্রক্রিয়া:

প্রতিটি প্রতিক্রিয়া টোকেন/শব্দের জন্য, সেই পছন্দের জন্য মডেলের সম্ভাব্যতা পুনরুদ্ধার করুন

বাক্যজুড়ে সমাহার করুন

প্রতি-বাক্য এবং সামগ্রিক বিশ্বাস/নির্ভরযোগ্যতা স্কোর উত্পাদন করুন

3. পর্যবেক্ষিত সঙ্গতি

একটি উত্তর গ্রহণ করার পরিবর্তে, প্যাক্স একই প্রশ্নটি এলএলএমকে একাধিকবার জিজ্ঞাসা করে, এবং এমবেডিংস (অর্থের ভেক্টর উপস্থাপন) ব্যবহার করে সম্ভাব্য প্রতিক্রিয়াগুলির মধ্যে সম্মতি এবং সঙ্গতি পরিমাপ করে।

উচ্চ সম্মতি নির্দেশ করে যে উত্তর শক্তিশালী/স্থিতিশীল
বিস্তৃতভাবে পরিবর্তিত প্রতিক্রিয়াগুলি সতর্কবার্তা: সম্ভাব্য ঝুঁকি বা অস্পষ্টতা

ছদ্ম-প্রক্রিয়া:

প্রশ্নটি এলএলএমকে একাধিকবার পাঠান; প্রতিক্রিয়াগুলি সংগ্রহ করুন

আউটপুটগুলোর মধ্যে সেমান্টিক সাদৃশ্য স্কোর গণনা করুন

ব্যবহারকারীর জন্য একটি “সঙ্গতি স্কোর” রিপোর্ট করুন

4. স্ব-মূল্যায়ন

প্যাক্স ঐচ্ছিকভাবে আরেকটি এলএলএম (অথবা একটি এনসেম্বল) কে সম্পূর্ণ ইন্টারঅ্যাকশন, উদ্ধৃতি এবং সম্ভাব্যতা স্কোর পর্যালোচনা করতে বলে, এবং তার নিজস্ব চূড়ান্ত রায় দেয়, সংখ্যারূপে (0-1) এবং বর্ণনামূলক ব্যাখ্যাও প্রদান করে। এটি একটি মেটা স্তরের আত্ম-প্রতিফলন যোগ করে।

ছদ্ম-প্রক্রিয়া:

কথোপকথন/রিপোর্ট একটি মূল্যায়ন এজেন্টকে (ভিন্ন মডেল) খাওয়ান

এজেন্ট তথ্যগততা, সমন্বয়, উদ্ধৃতি অখণ্ডতা, এবং আত্মবিশ্বাস সমালোচনা করে

অডিটযোগ্যতার জন্য ব্যাখ্যাসহ একটি চূড়ান্ত বিশ্বাস স্কোর আউটপুট করে

ইন্টারঅ্যাকশন ফ্লো

প্যাক্সের ইন্টারঅ্যাকশন ফ্লো নিম্নরূপ:

ব্যবহারকারী একটি প্রম্পট পাঠায়।
প্যাক্স এজেন্ট প্রম্পটটি প্রক্রিয়াজাত করে, প্রয়োজনমতো বাহ্যিক এপিআই পরামর্শ করে, এবং গঠনবদ্ধ অ্যাট্রিবিউশনসহ একটি প্রতিক্রিয়া তৈরি করে।
সিস্টেম:
- প্রতিটি বিবৃতির জন্য বিশ্বাস/আত্মবিশ্বাস স্কোর বরাদ্দ করে
- কোন অংশ কোন প্রমাণ দ্বারা সমর্থিত তা লগ করে
- ঐচ্ছিকভাবে, একটি স্ব-প্রতিফলনমূলক সারাংশ এবং বিশ্বাস স্কোর তৈরি করে

ফলাফল হল একটি অত্যন্ত স্বচ্ছ উত্তর যার সঙ্গে একটি সংখ্যাসূচক স্কোর এবং লিঙ্ককৃত রেফারেন্স, এবং সকল সমর্থনকারী ডেটার একটি অডিটযোগ্য রেকর্ড।

অনুপ্রেরণা

প্যাক্সকে কার্যকর করার জন্য ব্যবহৃত পদ্ধতিগুলি মূলত ক্লিনল্যাব্স দ্বারা করা কাজ থেকে প্রভাবিত ছিল। বিশেষ করে, তাদের স্কোরিং অ্যালগরিদম/পদ্ধতি যা এখানে বিস্তারিত আছে এখানে। এই অ্যালগরিদম/পদ্ধতিতে নিম্নলিখিতগুলি ব্যবহৃত হয়:

স্ব-প্রতিফলন: এই প্রক্রিয়ায় এলএলএমকে স্পষ্টভাবে প্রতিক্রিয়াটিকে রেট করতে এবং স্পষ্টভাবে বলতে বলা হয় যে কতটা আত্মবিশ্বাসীভাবে এই প্রতিক্রিয়াটি ভালো বলে মনে হচ্ছে।
প্রবণগত পূর্বাভাস: এটি এমন একটি প্রক্রিয়া যেখানে আমরা প্রতি-টোকেন সম্ভাব্যতাগুলি বিবেচনা করি যা একটি এলএলএম প্রতিক্রিয়া তৈরি করার সময় (অটোরিগ্রেসিভভাবে টোকেন করে টোকেন) বরাদ্দ করে।
পর্যবেক্ষিত সঙ্গতি: এই স্কোরিং এমন একটি প্রক্রিয়া যেখানে এলএলএম সম্ভাব্য একাধিক প্রতিক্রিয়া সম্ভাব্যতামূলকভাবে তৈরি করে যা তা মনে করে ভাল হতে পারে, এবং আমরা পরিমাপ করি যে এই প্রতিক্রিয়াগুলি একে অপরের সাথে কতটা বিরোধপূর্ণ (অথবা একটি প্রদত্ত প্রতিক্রিয়ার সাথে)।

এটা কেন গুরুত্বপূর্ণ?

প্রচলিত এলএলএম ডিপ্লয়মেন্টগুলি তথ্যের হলুসিনেশন করতে পারে বা পুরনো/বৈধ মনে হলেও মিথ্যা তথ্য প্রদান করতে পারে। গবেষণা, স্বাস্থ্যসেবা, আইনগত ও প্রযুক্তিগত পরামর্শের মতো মিশন-সমালোচক ব্যবহারের জন্য — যাচাইহীন এআই যথেষ্ট নয়।

প্যাক্সের লক্ষ্য হল এআই-এ বিশ্বাস পরিমাপযোগ্য এবং ব্যাখ্যাযোগ্য করা। এর পদ্ধতিগুলি:

জটিল দাবির জন্য “আপনার কাজ দেখান” প্রমাণ দাবি করে।
প্রতিটি আউটপুটে কতটা আত্মবিশ্বাস রাখা উচিত তা পরিমাপ করে।
ব্যবহারকারীদের অডিট করতে এবং বুঝতে দেয় কেন একটি উত্তর বিশ্বাসযোগ্য হওয়া উচিত (অথবা হওয়া উচিত নয়)।

গবেষণা অবস্থা ও পরবর্তী পদক্ষেপ

প্যাক্স বর্তমানে প্রকৃতপক্ষে সক্রিয় উন্নয়ন পর্যায়ে একটি ব্যক্তিগত গবেষণা প্রকল্প হিসেবে ওসгил এর ছাতার নিচে রয়েছে। মূল ফোকাসগুলো অন্তর্ভুক্ত:

বাহ্যিক সার্চ এবং স্কোরিংয়ের latency কমানো।
ব্যবহারকারী-ধারণা বনাম স্বয়ংক্রিয় বিশ্বাস স্কোর নিয়ে পরীক্ষা-নিরীক্ষা।
বিজ্ঞান, সংবাদ, এবং নিয়ন্ত্রক ব্যবহারের জন্য ডোমেইন-নির্দিষ্ট প্লাগইন তৈরি করা।
মুক্ত গবেষণার জন্য এবং সম্ভবত মুক্তির উদ্দেশ্যে বেঞ্চমার্ক ডেটাসেট প্রস্তুত করা।

শেষ কথা

প্যাক্স হল এলএলএমগুলিকে “ব্ল্যাক বক্স সম্ভাব্য জেনারেটর” থেকে স্বচ্ছ, উক্তিযোগ্য, এবং সংখ্যায় বিশ্বাসযোগ্য সহকারী তে রূপান্তর করার ব্যাপার, যা বাস্তব-জগতে উচ্চ-দায়িত্বশীল কাজের জন্য অত্যন্ত গুরুত্বপূর্ণ। যদি আপনি সহযোগিতা, অডিট, বা বিশ্বাসযোগ্য জেনারেটিভ এআইয়ের ভবিষ্যত আলোচনা করতে আগ্রহী হন, অনুগ্রহ করে যোগাযোগ করুন। পড়ার জন্য ধন্যবাদ!