PAX ਨਾਲ ਭਰੋਸੇਯੋਗ ਏਆਈ

ਪਿਛੋਕੜ

ਪੈਕਸ (Proactive Agent for eXemplary Trustworthiness) ਦੀ ਸ਼ੁਰੂਆਤ ਮੇਰੇ ਪਿਛਲੇ ਪ੍ਰੋਜੈਕਟ, ਟਾਰਸ, ਤੋਂ ਇੱਕ ਵੱਡੇ ਮੋੜ ਵਜੋਂ ਹੋਈ ਸੀ, ਜੋ ਖੁਦਰਤ ਸਾਈਬਰਸੁਰੱਖਿਆ ਪੈਨਟਰੇਸ਼ਨ ਟੈਸਟਿੰਗ ਨੂੰ ਲਕੜ੍ਹਦਾ ਸੀ। ਜਦੋਂ ਮੈਂ ਟਾਰਸ ਦਾ ਵਿਕਾਸ ਕਰ ਰਿਹਾ ਸੀ, ਇਹ ਸਾਫ ਹੋ ਗਿਆ ਕਿ ਵਰਤੋਂਯੋਗ, ਭਰੋਸੇਯੋਗ ਏਆਈ ਏਜੰਟਾਂ ਦੇ ਸਾਹਮਣੇ ਸਭ ਤੋਂ ਵੱਡੀ ਰੁਕਾਵਟ ਸਿਰਫ਼ ਕਾਰਜ ਆਟੋਮੇਸ਼ਨ ਨਹੀਂ ਸੀ, ਸਗੋਂ ਏਆਈ-ਨਿਰਮਿਤ ਜਵਾਬ ਦੀ ਭਰੋਸੇਯੋਗਤਾ ਸਥਾਪਿਤ ਕਰਨਾ ਵੀ ਸੀ। ਖਾਸ ਕਰਕੇ ਜਦੋਂ ਉਹ ਨਤੀਜੇ ਅਸਲ-ਦੁਨੀਆ ਦੇ ਫੈਸਲੇ ਪ੍ਰਭਾਵਿਤ ਕਰ ਸਕਦੇ ਹਨ ਜਿਨ੍ਹਾਂ ਦੇ ਵੱਡੇ ਨਤੀਜੇ ਹੋ ਸਕਦੇ ਹਨ।

ਸਿਰਫ਼ ਟਾਰਸ ਨਾਲ ਸਾਈਬਰਸੁਰੱਖਿਆ ਪੈਨਟਰੇਸ਼ਨ ਟੈਸਟਿੰਗ ਕਾਰਜਾਂ ਨੂੰ ਆਟੋਮੇਟ ਕਰਨ ਦੀ ਥਾਂ, ਮੈਂ ਇੱਕ ਮੂਲ ਸਮੱਸਿਆ ਹੱਲ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕੀਤੀ: ਅਸੀਂ ਕਿਸ ਤਰ੍ਹਾਂ ਜਾਣਦੇ ਹਾਂ ਕਿ ਅਸੀਂ ਐੱਲਐੱਲਐਮ ਵੱਲੋਂ ਦੇ ਦਿੱਤੇ ਗਏ ਬਿਆਨ ਤੇ ਭਰੋਸਾ ਕਰ ਸਕਦੇ ਹਾਂ?

ਟਾਰਸ ਮੇਰੇ ਪਹਿਲੇ ਸਟਾਰਟਅਪ, ਓਸਗਿਲ, ਲਈ ਇੱਕ ਐਮਵੀਪੀ ਵਜੋਂ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ ਸੀ, ਜਿਸ ਦੀ ਮੈਂ ਕੋ-ਫਾਊਂਡਰ ਸੀ। ਸਾਡਾ ਉਦੇਸ਼ ਏਆਈ ਏਜੰਟਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸਾਈਬਰਸੁਰੱਖਿਆ ਪੈਨਟਰੇਸ਼ਨ ਟੈਸਟਿੰਗ ਨੂੰ ਆਟੋਮੇਟ ਕਰਨਾ ਸੀ। ਟਾਰਸ ਨੇ ਸਾਨੂੰ ਫੋਰਮ ਵੇਂਚਰਜ਼ ਐਕਸੈਲਰੇਟਰ ਤੋਂ ਪ੍ਰੀ-ਸੀਡ ਫੰਡਿੰਗ حاصل ਕਰਨ ਯੋਗ ਬਣਾਇਆ। ਹਾਲਾਂਕਿ, ਜਦੋਂ ਅਸੀਂ ਰੱਖਿਆ ਅਤੇ ਸਾਈਬਰਸੁਰੱਖਿਆ ਕੰਪਨੀਆਂ ਨੂੰ ਸਮਝਾਇਆ, ਤਾਂ ਅਸੀਂ ਪਾਇਆ ਕਿ ਉਹ ਸੰਗਠਨ ਅਹਿਮ ਕਾਰਜਾਂ ਜਿਵੇਂ ਕਿ ਪੈਨਟਰੇਸ਼ਨ ਟੈਸਟਿੰਗ ਕਰਨ ਅਤੇ ਰਿਪੋਰਟ ਕਰਨ ਲਈ ਏਆਈ ਏਜੰਟਾਂ ‘ਤੇ ਭਰੋਸਾ ਨਹੀਂ ਕਰਦੇ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਲਗਭਗ ਸਾਰੇ ਉਹਨਾਂ ਵਿੱਚੋਂ ਮੁੱਖ ਤੌਰ ‘ਤੇ ਸਾਈਬਰਸੁਰੱਖਿਆ ਕੰਪਨੀਆਂ ਨਾਲ ਹੀ ਵਪਾਰ ਕਰਨਾ ਚਾਹੁੰਦੇ ਸਨ ਤਾਂ ਜੋ ਜੇ ਕੁਝ ਗੜਬੜ ਹੋਵੇ ਤਾਂ ਇਕ “ਸਕੇਪਗੋਟ” ਹੋਵੇ। ਬੁਨਿਆਦੀ ਤੌਰ ‘ਤੇ, ਇਨ੍ਹਾਂ ਕੰਪਨੀਆਂ ਦੇ ਫੈਸਲਾ ਕਰਨ ਵਾਲੇ ਲੋਕ ਆਪਣੇ ਸੁਰੱਖਿਆ ਬਾਰੇ ਇਸ ਤਰ੍ਹਾਂ ਚਿੰਤਿਤ ਨਹੀਂ ਹੁੰਦੇ ਸਿਵਾਏ ਜਦੋਂ ਉਹਨਾਂ ਨੂੰ ਲੋੜ ਹੋਵੇ, ਅਤੇ ਜਦੋਂ ਉਹ ਕਰਦੇ ਹਨ, ਤਾਂ ਉਹਨਾਂ ਦੇ ਮਾਪਦੰਡਾਂ ਵਿੱਚੋਂ ਇੱਕ ਇਹ ਸੀ ਕਿ ਜੇ ਕੁਝ ਗਲਤ ਹੋਵੇ ਤਾਂ ਕਿਸੇ ਨੂੰ ਦੋਸ਼ ਦੇਣ ਲਈ ਰਹੇ। 2024 ਦੇ ਅਖੀਰ ਤੱਕ, ਆਟੋਮੇਟਿਕ ਏਆਈ-ਸਥਿਤ ਸਾਈਬਰ ਹਮਲੇ ਹਜੇ ਵੀ ਇੱਕ ਵੱਡੀ ਚਿੰਤਾ ਨਹੀਂ ਸਨ, ਇਸ ਲਈ ਫੈਸਲਾ ਕਰਨ ਵਾਲਿਆਂ ਨੂੰ ਸਾਡੀ ਸਮੱਸਿਆ ਲਈ ਅਸਲ ਲੋੜ ਨਹੀਂ ਦਿਸੀ। ਬਾਜ਼ਾਰ ਦੀ ਇਸ ਘਾਟ ਕਾਰਨ, ਅਸੀਂ ਐੱਲਐੱਲਐਮ ਮਾਡਲਾਂ ਵਿੱਚ ਹੈਲੂਸੀਨੇਸ਼ਨਾਂ ਨੂੰ ਘਟਾਉਣ ‘ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਨ ਲਈ ਮੋੜ ਲਿਆ। ਐੱਲਐੱਲਐਮ ਭਰੋਸੇਯੋਗਤਾ ਨੂੰ ਸੁਧਾਰ ਕੇ, ਅਸੀਂ ਮੰਨਦੇ ਹਾਂ ਕਿ ਸਾਡਾ ਕੰਮ ਸਾਈਬਰਸੁਰੱਖਿਆ ਤੋਂ ਬਾਹਰ ਹੋਰ ਬਹੁਤ ਸਾਰੇ ਭਵਿੱਖੀ ਏਆਈ ਏਜੰਟ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਲਾਭਦਾਇਕ ਹੋ ਸਕਦਾ ਹੈ।

ਟ੍ਰਾਂਸਫਰਮਰਜ਼ ਦੀ ਕਥਾ ਤੋਂ ਇੱਕ ਪ੍ਰੇਰਣਾ

ਨਾਂ “ਪੈਕਸ” ਟ੍ਰਾਂਸਫਰਮਰਜ਼ ਯੂਨੀਵਰਸ ਨੂੰ ਇੱਕ ਸਲਾਮ ਹੈ। ਆਈਕਾਨਿਕ ਆਪਟਿਮਸ ਪ੍ਰਾਈਮ ਬਣਨ ਤੋਂ ਪਹਿਲਾਂ, ਉਸ ਪਾਤਰ ਦਾ ਅਸਲ ਨਾਂ ਓਰੀਅਨ ਪੈਕਸ ਸੀ। ਸੰਭਾਵਨਾ ਤੋਂ ਜ਼ਿੰਮੇਵਾਰੀ ਵੱਲ ਇਸ ਬਦਲਾਅ ਦਾ ਖ਼ਿਆਲ ਪੈਕਸ ਦੇ ਮਿਸ਼ਨ ਨੂੰ ਪ੍ਰੇਰਿਤ ਕਰਦਾ ਹੈ — ਕੱਚੀ, ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਐੱਲਐੱਲਐਮ ਸਮਰੱਥਾ ਤੋਂ ਕੁਝ ਇੱਥੇ ਤੱਕ ਜੋ ਸੱਚਮੁੱਚ ਭਰੋਸੇਯੋਗ ਹੋਣ ਲਈ ਕਾਫ਼ੀ ਹੋਵੇ।

ਪ੍ਰੋਜੈਕਟ ਦੀ ਦ੍ਰਿਸ਼ਟੀ

ਪੈਕਸ ਇੱਕ ਰਿਸਰਚ ਏਜੰਟ ਅਤੇ ਫਰੇਮਵਰਕ ਹੈ ਜੋ ਪ੍ਰਣਾਲੀਕ ਰੂਪ ਵਿੱਚ:

ਕਿਸੇ ਵੀ ਐੱਲਐੱਲਐਮ ਜਵਾਬ ਦੀ ਭਰੋਸੇਯੋਗਤਾ ਨੂੰ ਮਾਪਦਾ ਹੈ।
ਹੈਲੂਸੀਨੇਸ਼ਨਾਂ ਅਤੇ ਬਿਨਾਂ ਸਹਾਇਤ ਦੇ ਬਿਆਨਾਂ ਨੂੰ ਘਟਾਉਂਦਾ ਹੈ।
ਜਾਂਚਣਯੋਗ ਸਰੋਤਾਂ ਲਈ ਹਵਾਲਾ ਲਗਾਉਣ ਅਤੇ ਟ੍ਰੈਕ ਕਰਨ ਨੂੰ ਮਜਬੂਰ ਕਰਦਾ ਹੈ।
ਜਵਾਬਾਂ ਅਤੇ ਦਾਵਿਆਂ ਦੋਹਾਂ ਨੂੰ ਸਕੋਰ ਕਰਨ ਵਾਲੀਆਂ ਸਮਝਣਯੋਗ, ਸੰਰਚਿਤ ਰਿਪੋਰਟਾਂ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।

ਇਸ ਪ੍ਰੋਜੈਕਟ ਦਾ ਉਦੇਸ਼ ਐੱਲਐੱਲਐਮ ਨੂੰ ਸਿਰਫ਼ ਮੰਨਿਆ ਜਾਂ ਸਕਣ ਵਾਲਾ ਹੀ ਨਹੀਂ, ਬਲਕਿ ਪ੍ਰਮਾਣਿਤ ਭਰੋਸੇਯੋਗ ਬਣਾਉਣਾ ਹੈ, ਜੋ ਜੋਖਮ ਅਤੇ ਭਰੋਸੇ ਦੀ ਪਾਰਦਰਸ਼ੀ ਮਾਪਦੰਡ ਨਾਲ ਹੋਵੇ।

ਤੇਜ਼ ਅਤੇ ਬੁਨਿਆਦੀ ਡੈਮੋ

ਇਹਨਾਂ ਤਰੀਕਿਆਂ ਨਾਲ ਪੈਕਸ ਕੰਮ ਕਰਦਾ ਹੈ

1. ਜ਼ਬਰਦਸਤੀ ਹਵਾਲਾ

ਕਿਸੇ ਵੀ ਉਪਭੋਗਤਾ ਦੇ ਪ੍ਰਸ਼ਨ ਲਈ, ਪੈਕਸ ਪ੍ਰਾਂਪਟ ਨੂੰ ਇੱਕ ਐਸੇ ਏਜੰਟ ਰਾਹੀਂ ਰੂਟ ਕਰਦਾ ਹੈ ਜੋ ਸਖਤੀ ਨਾਲ ਆਮ ਗਿਆਨ ਅਤੇ ਉਸ ਜਾਣਕਾਰੀ ਵਿਚਕਾਰ ਵੰਡ ਕਰਦਾ ਹੈ ਜਿਸਦੀ ਜਾਂਚ ਲੋੜੀਂਦੀ ਹੈ। ਜਦੋਂ ਜਵਾਬ ਵਿੱਚ ਅਜਿਹੇ ਤੱਥ ਜਾਂ ਦਾਵੇ ਹੁੰਦੇ ਹਨ ਜੋ ਆਮ ਗਿਆਨ ਵਜੋਂ ਵਿਅਾਪਕ ਤੌਰ ‘ਤੇ ਨਹੀਂ ਮੰਨੇ ਜਾਂਦੇ (ਉਦਾਹਰਣ ਲਈ ਅੰਕੜੇ, ਹਾਲੀਆ ਘਟਨਾਵਾਂ ਆਦਿ), ਤਾਂ ਪੈਕਸ ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ ਕਿ ਏਜੰਟ ਭਰੋਸੇਯੋਗ, ਅਪ-ਟੂ-ਡੇਟ ਬਾਹਰੀ ਸਰੋਤਾਂ ਨੂੰ ਪ੍ਰਾਪਤ ਅਤੇ ਹਵਾਲਾ ਦੇਵੇ।

ਛਦਮ-ਪ੍ਰਕਿਰਿਆ:

ਜੇ ਦਾਅਵਾ ਆਮ ਗਿਆਨ ਨਹੀਂ ਹੈ → ਬਾਹਰੀ ਖੋਜ ਏਪੀਆਈਜ਼ ਚਲਾਓ

ਨਤੀਜੇ ਇਕੱਠੇ ਕਰੋ, ਹਰ ਮਹੱਤਵਪੂਰਨ ਬਿਆਨ ਨੂੰ ਸੰਬੰਧਤ ਹਵਾਲਿਆਂ ਨਾਲ ਨਕਸ਼ਾ ਬਣਾਓ

ਜਵਾਬ ਵਿੱਚ ਸੰਰਚਿਤ ਪਲੇਸਹੋਲਡਰਾਂ ਸ਼ਾਮਲ ਕਰੋ (ਸਧਾਰਣ URL ਜਾਂ ਕੱਚੇ ਫੁੱਟਨੋਟ ਨਹੀਂ)

2. ਸੰਭਾਵਨਾਤਮਕ ਵਿਸ਼ਵਾਸ ਸਕੋਰਿੰਗ

ਪੈਕਸ ਸਿਰਫ਼ ਮਨੁੱਖੀ ਅਨੁਭੂਤੀ ‘ਤੇ ਨਿਰਭਰ ਨਹੀਂ ਕਰਦਾ। ਇਹ ਟੈਕਸਟ ਜਨਰੇਸ਼ਨ ਦੌਰਾਨ ਵਰਤੇ ਗਏ ਅੰਦਰੂਨੀ ਸੰਭਾਵਨਾਵਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰ ਕੇ ਮਾਪਦਾ ਹੈ ਕਿ ਭਾਸ਼ਾਈ ਮਾਡਲ ਨੇ ਆਪਣੇ ਜਵਾਬ ਦੇ ਹਰ ਹਿੱਸੇ ਲਈ ਕਿੰਨਾ “ਭਰੋਸਾ” ਦਰਸਾਇਆ। ਇਸ ਨਾਲ ਪ੍ਰਣਾੜੀ ਨੂੰ ਹਰ ਵਾਕ ਲਈ ਇੱਕ ਅੰਕਗਣਿਤ ਭਰੋਸਾ ਸਕੋਰ ਅਤੇ ਕੁੱਲ ਜਵਾਬ ਲਈ ਇੱਕ ਸਕੋਰ ਦੇਣ ਯੋਗ ਬਣਾ ਦਿੰਦਾ ਹੈ। ਘੱਟ-ਭਰੋਸੇ ਵਾਲੇ ਹਿੱਸੇ ਖ਼ੁਦਕਾਰ ਤੌਰ ‘ਤੇ ਫਲੈਗ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ।

ਛਦਮ-ਪ੍ਰਕਿਰਿਆ:

ਹਰ ਜਵਾਬ ਟੋਕਨ/ਸ਼ਬਦ ਲਈ, ਉਸ ਚੋਣ ਲਈ ਮਾਡਲ ਦੀ ਸੰਭਾਵਨਾ ਪ੍ਰਾਪਤ ਕਰੋ

ਵਾਕਾਂ ਪਾਰ ਕਰਕੇ ਇਨਾਂ ਦੀ ਏਕੀਕ੍ਰਿਤੀ ਕਰੋ

ਪ੍ਰਤੀ-ਵਾਕ ਅਤੇ ਕੁੱਲ ਭਰੋਸਾ/ bharoseਯੋਗਤਾ ਸਕੋਰ ਉਤਪੰਨ ਕਰੋ

3. ਦੇਖੀ ਗਈ ਸਥਿਰਤਾ

ਇੱਕ ਹੀ ਜਵਾਬ ਨੂੰ ਕਬੂਲ ਕਰਨ ਦੀ ਥਾਂ, ਪੈਕਸ ਐੱਲਐੱਲਐਮ ਨੂੰ ਇਕੋ ਪ੍ਰਸ਼ਨ ਕਈ ਵਾਰੀ ਪੁੱਛਦਾ ਹੈ, ਅਤੇ ਸੰਭਾਵਨਾਵਾਂ (ਮਤਲਬ ਅਰਥ ਦੇ ਵੇਕਟਰ ਪ੍ਰਤੀਨਿਧਿਤ) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸੰਭਵ ਜਵਾਬਾਂ ਵਿਚਕਾਰ ਸਹਿਮਤੀ ਅਤੇ ਲਗਾਤਾਰਤਾ ਨੂੰ ਮਾਪਦਾ ਹੈ।

ਉੱਚ ਸਹਿਮਤੀ ਇਸ਼ਾਰਾ ਦਿੰਦੀ ਹੈ ਕਿ ਜਵਾਬ ਮਜ਼ਬੂਤ/ਸਥਿਰ ਹੈ
ਪੌਖੀ-ਪੌਖੀ ਵੱਖ-ਵੱਖ ਜਵਾਬ ਚੇਤਾਵਨੀ ਨਿਸ਼ਾਨ ਹਨ: ਸੰਭਵ ਜੋਖਮ ਜਾਂ ਅਸਪਸ਼ਟੀਤਾ

ਛਦਮ-ਪ੍ਰਕਿਰਿਆ:

ਏਲਐੱਲਐਮ ਨੂੰ ਪ੍ਰਸ਼ਨ ਕਈ ਵਾਰੀ ਭੇਜੋ; ਜਵਾਬ ਇਕੱਠੇ ਕਰੋ

ਆਉਟਪੁੱਟਾਂ ਵਿਚਕਾਰ ਸੈਮਾਂਟਿਕ ਸਮਾਨਤਾ ਸਕੋਰ ਗਣਨਾ ਕਰੋ

ਉਪਭੋਗਤਾ ਲਈ ਇੱਕ “ਸਥਿਰਤਾ ਸਕੋਰ” ਰਿਪੋਰਟ ਕਰੋ

4. ਸਵੈ-ਮੁਲਾਂਕਣ

ਪੈਕਸ ਇਛਾ ਅਨੁਸਾਰ ਇੱਕ ਹੋਰ ਐੱਲਐੱਲਐਮ (ਜਾਂ ਐਨਸੈਂਬਲ) ਨੂੰ ਸਾਰੀ ਇੰਟਰੈਕਸ਼ਨ, ਹਵਾਲੇ, ਅਤੇ ਸੰਭਾਵਨਾ ਸਕੋਰ ਭੇਜ ਕੇ ਸਮੀਖਿਆ ਕਰਨ ਲਈ ਕਹਿ ਸਕਦਾ ਹੈ, ਅਤੇ ਆਪਣਾ ਅੰਤਿਮ ਫੈਸਲਾ ਨੰਬਰ (0-1) ਅਤੇ ਕਥਨਾਤਮਕ وضاحت ਦੇ ਤੌਰ ‘ਤੇ ਦੇਂਦਾ ਹੈ। ਇਹ ਇੱਕ ਮੈਟਾ ਸਤਰ ਦਾ ਸਵ-ਚਿੰਤਨ ਜੋੜਦਾ ਹੈ।

ਛਦਮ-ਪ੍ਰਕਿਰਿਆ:

ਚਰਚਾ/ਰਿਪੋਰਟ ਨੂੰ ਇੱਕ ਮੁਲਾਂਕਣ ਏਜੰਟ (ਵੱਖਰਾ ਮਾਡਲ) ਨੂੰ ਫੀਡ ਕਰੋ

ਏਜੰਟ ਤਥਿਆਤਮਕਤਾ, ਸੁਸੰਗਤਤਾ, ਹਵਾਲਿਆਂ ਦੀ ਪੂਰਨਤਾ, ਅਤੇ ਭਰੋਸਾ ਦੀ ਆਲੋਚਨਾ ਕਰਦਾ ਹੈ

ਆਡੀਟਯੋਗਤਾ ਲਈ ਵਿਆਖਿਆ ਸਮੇਤ ਇੱਕ ਅੰਤਿਮ ਭਰੋਸਾ ਸਕੋਰ ਨਿਕਲਦਾ ਹੈ

ਇੰਟਰਐਕਸ਼ਨ ਦਾ ਪ੍ਰਵਾਹ

ਪੈਕਸ ਦਾ ਇੰਟਰਐਕਸ਼ਨ ਪ੍ਰਵਾਹ ਇਸ ਤਰ੍ਹਾਂ ਹੁੰਦਾ ਹੈ:

ਉਪਭੋਗਤਾ ਇੱਕ ਪ੍ਰਾਂਪਟ ਭੇਜਦਾ ਹੈ।
ਪੈਕਸ ਏਜੰਟ ਪ੍ਰਾਂਪਟ ਨੂੰ ਪ੍ਰੋਸੈਸ ਕਰਦਾ ਹੈ, ਜਰੂਰਤ ਪੈਂਦੀ ਹੈ ਤਾਂ ਬਾਹਰੀ ਏਪੀਆਈਜ਼ ਨਾਲ ਸਲਾਹ-ਮਸ਼ਵਰਾ ਕਰਦਾ ਹੈ, ਅਤੇ ਸੰਰਚਿਤ ਹਵਾਲਿਆਂ ਨਾਲ ਇੱਕ ਜਵਾਬ ਬਣਾਉਂਦਾ ਹੈ।
ਪ੍ਰਣਾਲੀ:
- ਪ੍ਰਤੀ-ਬਿਆਨ ਭਰੋਸਾ/ਕੰਫਿਡੈਂਸ ਸਕੋਰ ਸੌਂਪਦਾ ਹੈ
- ਲਾਗ ਕਰਦਾ ਹੈ ਕਿ ਕਿਹੜੇ ਹਿੱਸੇ ਕਿਸ ਸਬੂਤ ਨਾਲ ਸਮਰਥਿਤ ਹਨ
- ਵਿਕਲਪਿਕ ਤੌਰ ‘ਤੇ, ਇੱਕ ਸਵੈ-ਚਿੰਤਨ ਸੰਖੇਪ ਅਤੇ ਭਰੋਸਾ ਸਕੋਰ ਤਿਆਰ ਕਰਦਾ ਹੈ

ਨਤੀਜਾ ਇੱਕ ਬਹੁਤ ਹੀ ਪਾਰਦਰਸ਼ੀ ਜਵਾਬ ਹੁੰਦਾ ਹੈ ਜਿਸ ਨਾਲ ਇੱਕ ਅੰਕਗਣਿਤ ਸਕੋਰ ਅਤੇ ਜੋੜੇ ਹੋਏ ਹਵਾਲੇ ਹੁੰਦੇ ਹਨ, ਨਾਲ ਹੀ ਸਾਰੇ ਸਹਾਇਤਕ ਡੇਟਾ ਦੀ ਆਡੀਟਯੋਗ ਰਿਕਾਰਡਿੰਗ।

ਪ੍ਰੇਰਣਾ

ਪੈਕਸ ਨੂੰ ਕੰਮ ਕਰਨ ਲਈ ਵਰਤੇ ਗਏ ਤਰੀਕੇ ਬਹੁਤ ਹੱਦ ਤੱਕ ਕਲੀਨਲੈਬਸ ਦੇ ਕੰਮਾਂ ਤੋਂ ਪ੍ਰੇਰਿਤ ਸਨ। ਖਾਸ ਕਰਕੇ, ਉਨ੍ਹਾਂ ਦੇ ਸਕੋਰਿੰਗ ਅਲਗੋਰਿਦਮ/ਤਰੀਕੇ ਨੂੰ ਇੱਥੇ ਵੇਰਵਾ ਦਿੱਤਾ ਇੱਥੇ. ਇਸ ਅਲਗੋਰਿਦਮ/ਤਰੀਕੇ ਵਿੱਚ, ਹੇਠਾਂ ਦਿੱਤੇ ਤੱਤ ਵਰਤੋਂ ਵਿੱਚ ਆਏ ਹਨ:

ਸਵੈ-ਚਿੰਤਨ: ਇਹ ਇੱਕ ਪ੍ਰਕਿਰਿਆ ਹੈ ਜਿਸ ਵਿੱਚ ਐੱਲਐੱਲਐਮ ਨੂੰ ਖੁਲ ਕੇ ਜਵਾਬ ਦੀ ਰੇਟਿੰਗ ਕਰਨ ਅਤੇ ਇਹ ਸਪਸ਼ਟ ਕਰਨ ਲਈ ਕਿਹਾ ਜਾਂਦਾ ਹੈ ਕਿ ਇਹ ਜਵਾਬ ਕਿੰਨਾ ਭਰੋਸੇਯੋਗ ਦਿੱਸਦਾ ਹੈ।
ਸੰਭਾਵਨਾਤਮਕ ਪੇਸ਼ਗੋਈ: ਇਹ ਉਹ ਪ੍ਰਕਿਰਿਆ ਹੈ ਜਿਸ ਵਿੱਚ ਅਸੀਂ ਐੱਲਐੱਲਐਮ ਦੁਆਰਾ ਜਵਾਬ ਬਣਾਉਂਦੇ ਸਮੇਂ ਦਿੱਤੇ ਗਏ ਪ੍ਰਤੀ-ਟੋਕਨ ਸੰਭਾਵਨਾਵਾਂ ਨੂੰ ਧਿਆਨ ਵਿੱਚ ਰੱਖਦੇ ਹਾਂ (ਆਟੋ-ਰੇਗਰੇਸਿਵ ਤੌਰ ‘ਤੇ ਟੋਕਨ ਦਰ ਟੋਕਨ)।
ਦੇਖੀ ਗਈ ਸਥਿਰਤਾ: ਇਸ ਸਕੋਰਿੰਗ ਵਿੱਚ ਐੱਲਐੱਲਐਮ ਸੰਭਾਵਨਾਤਮਕ ਤੌਰ ‘ਤੇ ਕਈ ਸਮਭਵ ਜਵਾਬ ਪੈਦਾ ਕਰਦਾ ਹੈ ਜੋ ਉਹ ਸੋਚਦਾ ਹੈ ਕਿ ਚੰਗੇ ਹੋ ਸਕਦੇ ਹਨ, ਅਤੇ ਅਸੀਂ ਨਾਪਦੇ ਹਾਂ ਕਿ ਇਹ ਜਵਾਬ ਇੱਕ-ਦੂਜੇ ਨਾਲ ਕਿੰਨੇ ਵਿਰੋਧੀ ਹਨ (ਜਾਂ ਕਿਸੇ ਨਿਰਧਾਰਿਤ ਜਵਾਬ ਨਾਲ)।

ਇਹ ਮਹੱਤਵਪੂਰਨ ਕਿਉਂ ਹੈ?

ਪੰਪਰਾਗਤ ਐੱਲਐੱਲਐਮ ਡਿਪਲੌਇਮੈਂਟ ਤੱਥਾਂ ‘ਤੇ ਭ੍ਰਮ ਹੋ ਸਕਦੀ ਹੈ ਜਾਂ ਪੁਰਾਣੀ/ਯਥਾਰਥ ਲੱਗਣ ਵਾਲੀ ਪਰ ਝੂਠੀ ਜਾਣਕਾਰੀ ਦੇ ਸਕਦੀ ਹੈ। ਮਹੱਤਵਪੂਰਨ ਵਰਤੋਂ-ਮਾਮਲਿਆਂ — ਖੋਜ, ਸਿਹਤ ਸੇਵਾ, ਕਾਨੂੰਨੀ ਅਤੇ ਤਕਨੀਕੀ ਸਲਾਹ — ਲਈ, ਅਣ-ਪ੍ਰਮਾਣਿਤ ਏਆਈ ਕਾਫ਼ੀ ਨਹੀਂ ਹੈ।

ਪੈਕਸ ਦਾ ਉਦੇਸ਼ ਏਆਈ ਵਿੱਚ ਭਰੋਸਾ ਨੂੰ ਮਾਪਯੋਗ ਅਤੇ ਵਿਆਖਿਆਯੋਗ ਬਣਾਉਣਾ ਹੈ। ਇਸ ਦੀ ਪਹੁੰਚ:

ਗੈਰ-ਤਰੱਕੀ ਦਾਵਿਆਂ ਲਈ “ਆਪਣਾ ਕੰਮ ਦਿਖਾਓ” ਪਰਮਾਣ ਦੇਣ ਦੀ ਮੰਗ ਕਰਦੀ ਹੈ।
ਹਰ ਨਿਕਾਸ ਲਈ ਕਿੰਨਾ ਭਰੋਸਾ ਰੱਖਣਾ ਹੈ ਇਹ ਮਾਤਰਾ ਵਿੱਚ ਦਿੰਦੀ ਹੈ।
ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਆਡੀਟ ਕਰਨ ਅਤੇ ਸਮਝਣ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ ਕਿ ਕਿਸੇ ਜਵਾਬ ‘ਤੇ ਭਰੋਸਾ ਕਿਉਂ ਕੀਤਾ ਜਾਂ (ਨਹੀਂ) ਜਾਵੇ।

ਖੋਜ ਦੀ ਸਥਿਤੀ ਅਤੇ ਅਗਲੇ ਕਦਮ

ਪੈਕਸ ਇਸ ਸਮੇਂ ਓਸਗਿਲ ਦੀ ਛੱਤ ਹੇਠ ਇੱਕ ਨਿੱਜੀ ਰਿਸਰਚ ਪ੍ਰੋਜੈਕਟ ਵਜੋਂ ਸਕਰਿਆ ਵਿਕਾਸ ਵਿੱਚ ਹੈ। ਮੁੱਖ ਧਿਆਨ-ਕੇਂਦਰ ਹਨ:

ਬਾਹਰੀ ਖੋਜਾਂ ਅਤੇ ਸਕੋਰਿੰਗ ਦੀ ਲੈਟੈਂਸੀ ਘਟਾਉਣਾ।
ਉਪਭੋਗਤਾ-ਧਾਰਣਾ ਬਨਾਮ ਆਟੋਮੇਟਿਕ ਭਰੋਸਾ ਸਕੋਰਾਂ ਨਾਲ ਪ੍ਰਯੋਗ ਕਰਨਾ।
ਵਿਗਿਆਨ, ਖਬਰਾਂ ਅਤੇ ਨਿਯਮਕ ਵਰਤੋਂ ਲਈ ਡੋਮੇਨ-ਵਿਸ਼ੇਸ਼ ਪਲੱਗਇਨਾਂ ਤਿਆਰ ਕਰਨਾ।
ਖੁੱਲ੍ਹੀ ਖੋਜ ਅਤੇ ਸੰਭਵ ਰਿਲੀਜ਼ ਲਈ ਬੈਂਚਮਾਰਕ ਡੇਟਾਸੈਟ ਤਿਆਰ ਕਰਨਾ।

ਅਖੀਰੀ ਸ਼ਬਦ

ਪੈਕਸ ਦਾ ਮਕਸਦ ਐੱਲਐੱਲਐਮਾਂ ਨੂੰ “ਬਲੈਕ ਬਾਕਸ ਮੰਨਣਯੋਗ ਜਨਰੇਟਰਾਂ” ਤੋਂ ਬਦਲ ਕੇ ਪਾਰਦਰਸ਼ੀ, ਹਵਾਲਾ-ਯੋਗ, ਅਤੇ ਅੰਕਗਣਿਤ ਤੌਰ ‘ਤੇ ਭਰੋਸੇਯੋਗ ਸਹਾਇਕਾਂ ਵਿੱਚ ਤਬਦੀਲ ਕਰਨਾ ਹੈ, ਜੋ ਅਸਲ-ਦੁਨੀਆ ਦੇ ਉੱਚ-ਹੱਦ ਵਾਲੇ ਕਾਰਜਾਂ ਲਈ ਅਤਿ-ਜ਼ਰੂਰੀ ਹਨ। ਜੇ ਤੁਸੀਂ ਸਹਿਯੋਗ, ਆਡੀਟ, ਜਾਂ ਭਰੋਸੇਯੋਗ ਜਨਰੇਟਿਵ ਏਆਈ ਦੇ ਭਵਿੱਖ ‘ਤੇ ਚਰਚਾ ਕਰਨ ਵਿੱਚ ਰੁਚੀ ਰੱਖਦੇ ਹੋ, ਤਾਂ ਕਿਰਪਾ ਕਰਕੇ ਸੰਪਰਕ ਕਰੋ। ਪੜ੍ਹਨ ਲਈ ਧੰਨਵਾਦ!