मूविंग पोज़ एल्गोरिदम
हमारी अंतिम प्रस्तुति दिसंबर 2020 से
प्रोजेक्ट के बारे में
कोलोराडो स्कूल ऑफ माइनस में फॉल 2020 मशीन लर्निंग (CSCI470) पाठ्यक्रम के लिए हमारे अंतिम प्रोजेक्ट के रूप में, हमारी टीम, जिसमें एंड्रयू डार्लिंग, एरिक हेज़, और मैं (मेहमत) शामिल थे, ने “मूविंग पोज़” एल्गोरिदम का कार्यान्वयन किया।
उद्देश्य एक गहराई सेंसर द्वारा कैप्चर किए गए कंकाली डेटा सेट को लेना और मानव क्रियाओं को वर्गीकृत करना था। हमने न केवल मुख्य एल्गोरिदम का कार्यान्वयन किया बल्कि इसकी क्षमताओं को प्रदर्शित करने के लिए एक सरल उपयोगकर्ता इंटरफ़ेस भी विकसित किया।
मूविंग पोज़ एल्गोरिदम, जिसे मूल रूप से मिहाई ज़ानफिर, मारियस लियोर्डियानु, और क्रिस्चियन स्मिन्चिसेस्कु द्वारा प्रस्तावित किया गया था, 3D कंकाली डेटा से मानव क्रियाओं को तेजी से और सटीकता से पहचानने और समझने के लिए एक शक्तिशाली विधि है।
पेपर
हमारा कार्यान्वयन पेपर द मूविंग पोज़: एन एफिशिएंट 3D काइनेमैटिक्स डिस्क्रिप्टर फॉर लो-लेटेंसी एक्शन रिकग्निशन एंड डिटेक्शन (PDF) पर आधारित है, जिसे मिहाई ज़ानफिर, मारियस लियोर्डियानु, और क्रिस्चियन स्मिन्चिसेस्कु ने लिखा है।
डेटा सेट
हमारा मॉडल MSR डेलीएक्टिविटी 3D डेटा सेट पर प्रशिक्षित और परीक्षण किया गया। हमने डेटा सेट से निम्नलिखित क्रियाओं पर ध्यान केंद्रित किया:
UI पूर्वावलोकन
हमने एल्गोरिदम के प्रदर्शन को वास्तविक समय में देखने के लिए एक सरल GUI बनाया। GUI और उपयोग किए गए हार्डवेयर के बारे में अधिक जानकारी के लिए, कृपया प्रोजेक्ट के रेपो के /movingpose/gui/ निर्देशिका में README.md फ़ाइल देखें।