تطورات مذهلة في إصدار GPT-4o مع إمكانيات محسنة للنص والصوت والرؤية

أطلقت شركة OpenAI اصدار جديد من محرك الذكاء الاصطناعي الخاص بها ChatGPT تحت اسم GPT-4o (“o” هي اختصار لـ “omni” أو “الكل”). يحقق الاصدار الجديد تطورات كبيرة في إنشاء محتوى النص والصوت والصور لتقديم تفاعل أكثر طبيعية بين المستخدمين والذكاء الاصطناعي.

تدعي OpenAI أن نموذج الذكاء الاصطناعي الجديد الخاص بها يمكنه الاستجابة للمدخلات الصوتية في أقل من 232 مللي ثانية، كما أنه أسرع بشكل ملحوظ في الاستجابة النصية للمطالبات باللغات الأخرى غير الإنجليزية مع دعم لأكثر من 50 لغة. كذلك يمكن الآن مقاطعة ChatGPT بأسئلة أو توضيحات جديدة أثناء حديثه.

يتميز GPT-4o أيضًا بمساعد صوتي أكثر قدرة ويشبه الصوت البشري ويستجيب في الوقت الفعلي ويمكنه مراقبة المناطق المحيطة بك من خلال كاميرا الموبايل. يمكنك أيضًا أن تطلب من المساعد أن يبدو أكثر مرحًا أو يعود إلى صوت يبدو آليًا أكثر. كذلك يمكن استخدامه للحصول على ترجمات في الوقت الفعلي لأكثر من 50 لغة، ويمكن أن يساعد ضعاف البصر ويرشدهم الى أماكن الأشياء أو يساعدهم على الوصول الى مكان ما عن طريق الكاميرا أيضاً.

عرضت OpenAI قائمة طويلة من إمكانيات GPT-4o في البث المباشر. يمكنك مشاهدة جميع ميزات GPT-4o الجديدة في الفيديو التالي.

سيكون GPT-4o متاحًا لمستخدمي النسخة المجانية من ChatGPT بينما يحصل مستخدمو ChatGPT Plus على حدود أعلى بمقدار 5 مرات. ميزات النص والصور الخاصة بـ GPT-4o متاحة بالفعل في تطبيق ChatGPT وعلى الويب. سيكون المساعد الصوتي الجديد متاحًا لـ ChatGPT Plus في الأسابيع المقبلة.

وفي أخبار ذات صلة، أعلنت OpenAI عن تطبيق ChatGPT لنظام التشغيل macOS، في حين سيأتي إصدار ويندوز في وقت لاحق من هذا العام. أعلنت OpenAI أيضًا عن متجر ChatGPT Store الذي يستضيف الملايين من روبوتات الدردشة المخصصة التي يمكن للمستخدمين الوصول إليها مجانًا.

أضف تعليق