MiniGPT-4: أداة الذكاء الاصطناعي المجانية لتحويل الصور إلى نص

MiniGPT-4

على الرغم من أن ChatGPT يعد روبوت دردشة رائع جدا، إلا أنه في الوقت الحالي يقتصر على توليد النصوص فقط خاصة على إصدار GPT-3.5 الذي يعتبر إصداراََ مجانيًا.

لكن وبعد ظهور MiniGPT-4 الذي يعتبر مشروع مفتوح المصدر أصبح من الممكن استخدامه في عملية تحويل الصور إلى نص بالإضافة إلى المزيد من الميزات الأخرى.

عبر هذا المقال، يمكنك التعرف على ما هو MiniGPT-4؟ بالإضافة إلى كيفية استخدامه وما هي الحدود الخاصة به.


ما هو MiniGPT-4؟


MiniGPT-4 هو مشروع مفتوح المصدر تم نشره على GitHub بهدف إظهار قدرات لغة الرؤية في نظام الذكاء الاصطناعي.

يمتلك MiniGPT-4 القدرة على إنشاء وصف للصورة أو كتابة قصص استنادًا إلى الصورة أو حتى إنشاء مواقع ويب يعتمد فيها على الرسومات فقط، وعلى الرغم من الاسم، فإن MiniGPT-4 تابع بشكل رسمي إلى شركة OpenAI أو GPT-4.

تم إنشاء MiniGPT-4 من قبل مجموعة من طلاب الدكتوراه المقيمين في المملكة العربية السعودية في جامعة الملك عبدالله للعلوم والتكنولوجيا، وهو برنامج يعتمد على نموذج لغة كبير مختلف (LLM) يسمى Vicuna، الذي تم بناؤه بنفسه على نموذج اللغة الكبيرة المفتوح المصدر Meta AI (LLaMA).


كيفية استخدام MiniGPT-4؟


MiniGPT-4 هو مجرد معاينة توضيحية ولا يزال في إصداره الأولي، ويمكن الوصول إليه حاليًا مجانًا عبر الموقع الرسمي للمشروع.

لاستخدام MiniGPT-4 كل ما عليك فعله هو سحب صورة أو النقر فوق "إفلات الصورة هنا"، وبمجرد تحميل الصورة، قم بإدخال استعلامك في مربع البحث.


زيارة موقع MiniGPT-4


ملاحظة
MiniGPT-4 يستخدم وحدة معالجة الرسومات الخاصة بجهازك، ولهذا إذا لم يكن لديك وحدة معالجة رسومات منفصلة قوية، فقد تجد التجربة بطيئة إلى حد ما