بدأت فعاليات مؤتمر IJCAI (المؤتمر الدولي المشترك للذكاء الاصطناعي) 2024، وهو المؤتمر الأكاديمي المرموق في مجال الذكاء الاصطناعي. وتم اختيار أحدث ورقة بحثية لمركز الذكاء الاصطناعي في OPPO لتكون ضمن فعاليات هذا العام.
وكان لشركة OPPO تواجداً مميزاً مع مجموعة من الابتكارات والميزات المتطورة في مجال الذكاء الاصطناعي، مما يبرز دورها الريادي في مواصلة الابتكار في هواتف الذكاء الاصطناعي.
تقنية ” Zero-Shot Framework ” تُحدث ثورة جديدة في مجال توليد الفيديو من النصوص والصور
وفي مؤتمر IJCAI 2024، تم تسليط الضوء على نحو بارز على ورقة البحث الأحدث من مركز الذكاء الاصطناعي في OPPO تحت عنوان ” Zero-shot High-fidelity and Pose-controllable Character Animation “، مما أظهر مرة أخرى الخبرة التقنية الواسعة لشركة OPPO ومدى تقدمها المستمر في مجال الذكاء الاصطناعي
ويواجه في الوقت الحالي مجال تحويل الصور إلى فيديو (I2V) h العديد من المشكلات الشائعة مثل التباين في مظهر الشخصيات وصعوبة الاحتفاظ بكافة التفاصيل، مما يتطلب كميات ضخمة من بيانات الفيديو للتدريب ويستهلك موارد حسابية كبيرة. لمعالجة هذه التحديات، قدم مركز الذكاء الاصطناعي في OPPO إطار العمل المبتكر “PoseAnimate”، الذي يعتمد على تقنية ” zero-shot ” في مجال، ويقوم PoseAnimate باستخدام معلومات الوضعية للتحكم في حركات الرسوم المتحركة مع الحفاظ على اتساق محتوى المشهد. يحقق هذا الإطار أهدافه من خلال ثلاث مكونات رئيسية:
• وحدة التحكم المدركة للوضع : (PACM) تدمج إشارات الوضعيات المختلفة في تمثيلات نصية للحفاظ على المحتوى غير المتعلق بالشخصية مع ضمان توافق الحركات بدقة مُتناهية
• وحدة الانتباه المزدوج للاتساق (DCAM) : تُعزز الاتساق الزمني، مما يحافظ على هوية الشخصية وتفاصيل الخلفية الدقيقة.
• وحدة الفصل الموجه بواسطة القناع (MGDM): تحسن دقة الفيديوهات المولدة من خلال فصل الشخصيات عن الخلفية.
وقدم فريق عمل OPPO كذلك خوارزمية محاذاة الوضعية والانتقال (PATA) لضمان التوافق وسلاسة الانتقالات في وضعيات الشخصيات. وتظهر النتائج التجريبية أن PoseAnimate يتفوق بشكل كبير على طرق التدريب المتقدمة الحالية في مدى اتساق الشخصيات ودقة التفاصيل، محافظًا على اتساق زمني متميز في كافة الرسوم المتحركة المولدة.