أعلنت شركة سامبا نوفا سيستمز، المزود لأسرع وأكفأ الرقائق ونماذج الذكاء الاصطناعي، عن إطلاق سامبا نوفا كلاود، أسرع خدمة استدلال ذكاء اصطناعي في العالم بفضل سرعة شريحة الذكاء الاصطناعي SN40L الخاصة بها.
يمكن للمطورين التسجيل مجاناً عبر واجهة برمجة التطبيقات اليوم -بدون قائمة انتظار- وإنشاء تطبيقاتهم الخاصة باستخدام كل من النموذج الأكبر والأكثر قدرة، Llama 3.1 405B، والنمو بسرعة Llama 3.1 70B، تعمل سامبا نوفا كلاود على تشغيل Llama 3.1 70B بسرعة 461 رمزاً في الثانية و405B بسرعة 132 رمزاً في الثانية بدقة كاملة.
قال رودريغو ليانغ، الرئيس التنفيذي لشركة سامبا نوفا سيستمز «تعد سامبا نوفا كلاود أسرع خدمة واجهة برمجة التطبيقات للمطورين، نحن نقدم سرعة قياسية عالمية بدقة 16 بت كاملة – كل ذلك بفضل أسرع شريحة ذكاء صناعي في العالم»، وأضاف: «تجلب سامبا نوفا كلاود أفضل النماذج مفتوحة المصدر إلى المجتمع الواسع من المطورين بسرعة لم يسبق لها مثيل».
هذا العام، أطلقت شركة ميتا نموذج Llama 3.1 بثلاثة أشكال: 8B و70B و405B، يُعتبر نموذج 405B هو الجوهرة الثمينة للمطورين، حيث يوفر بديلاً تنافسياً للغاية لأفضل النماذج مغلقة المصدر من أوبن إيه آي وأنثروبيك وغوغل، تُعد نماذج Llama 3.1 من ميتا الأكثر شعبية بين النماذج مفتوحة المصدر، ونموذج Llama 3.1 405B هو الأكثر ذكاءً، وفقاً لميت، حيث يقدم مرونة في كيفية استخدام النموذج وتطبيقه.
سامبا نوفا النموذج الأعلى دقة
تابع ليانغ «المنافسون لا يقدمون نموذج 405B للمطورين اليوم بسبب رقائقهم غير الفعالة، مقدمو الخدمات الذين يعملون على وحدات معالجة الرسوميات Nvidia يقللون من دقة هذا النموذج، ما يؤثر على دقته، ويشغلونه بسرعات بطيئة غير قابلة للاستخدام»، وأضاف: «فقط سامبا نوفا هي التي تشغل 405B – أفضل نموذج مفتوح المصدر تم إنشاؤه- بدقة كاملة وبسرعة 132 رمزاً في الثانية».
نموذج Llama 3.1 405B هو نموذج ضخم للغاية -أكبر نموذج مفتوح الأوزان تم إصداره حتى الآن، يعني حجمه أن تكلفة وتعقيد نشره مرتفعة، وسرعة تقديمه أبطأ مقارنة بالنماذج الأصغر، تقلل رقائق SN40L من سامبا نوفا من هذه التكلفة والتعقيد مقارنة بوحدات Nvidia H100 وتخفف من تنازل السرعة للنموذج حيث تقدمها بسرعات أعلى.
قال الدكتور أندرو نج، مؤسس DeepLearning.AI، الشريك الإداري في AI Fund، وأستاذ مشارك في قسم علوم الكمبيوتر بجامعة ستانفورد «تقدم التدفقات الوكيلة نتائج ممتازة للعديد من التطبيقات، نظراً لأنها تحتاج إلى معالجة عدد كبير من الرموز لتوليد النتيجة النهائية، فإن سرعة توليد الرموز أمر حاسم، أفضل نموذج مفتوح الأوزان اليوم هو Llama 3.1 405B، وسامبا نوفا هي المزود الوحيد الذي يشغل هذا النموذج بدقة 16 بت وبأكثر من 100 رمز في الثانية، هذا الإنجاز الفني المثير يفتح إمكانيات مثيرة للمطورين الذين يبنون باستخدام نماذج LLM».
سامبا نوفا كلاود أسرع منصة استدلال ذكاء صناعي
قال جورج كاميرون، المؤسس المشارك لشركة Artificial Analysis: «قامت Artificial Analysis بتقييم مستقل لسامبا نوفا ووجدت أنها تحقق سرعات قياسية تصل إلى 132 رمزاً في الثانية على واجهة برمجة التطبيقات الخاصة بنموذج Llama 3.1 405B. هذه هي أسرع سرعة إخراج متاحة لهذا المستوى من الذكاء عبر جميع النقاط التي تتبعها Artificial Analysis، متجاوزة سرعة النماذج الرائدة التي تقدمها OpenAI وAnthropic وGoogle. ستدعم نقاط نهاية Llama 3.1 من سامبا نوفا استخدامات الذكاء الاصطناعي المعتمدة على السرعة، بما في ذلك التطبيقات التي تتطلب استجابات في الوقت الحقيقي أو تعتمد على الأساليب الوكيلة لاستخدام نماذج اللغة».
المنصة الأولى للذكاء الاصطناعي الوكيل – سامبا نوفا تشغل Llama 3.1 70B بسرعة 461 رمزاً في الثانية
يُعتبر نموذج Llama 3.1 70B النموذج الأعلى دقة لحالات استخدام الذكاء الاصطناعي الوكيل، التي تتطلب سرعات عالية وتأخيراً منخفضاً، يجعل حجمه مناسباً للتخصيص، ما ينتج نماذج خبير يمكن دمجها في أنظمة متعددة الوكلاء مناسبة لحل المهام المعقدة.
تعد سامبا نوفا كلاود أول منصة تسمح للمطورين بتشغيل نماذج Llama 3.1 70B بسرعة 461 رمزاً في الثانية وبناء تطبيقات وكيلة تعمل بسرعة غير مسبوقة.
قال ديفيد كين، الرئيس التنفيذي لشركة Bigtincan Solutions، شركة SaaS مدرجة في ASX: «كراعٍ رائد لحلول تمكين المبيعات المدعومة بالذكاء الاصطناعي، نحن متحمسون للشراكة مع سامبا نوفا، بفضل الأداء المثير للإعجاب من سامبا نوفا، يمكننا تحقيق زيادة تصل إلى 300% في الكفاءة في BigtincanSearchAI، ما يمكّننا من تشغيل أقوى النماذج مفتوحة المصدر مثل Llama بجميع تكويناته وتدفقات العمل الوكيل بسرعة وفعالية لا تضاهى».
قال روبرت رزق، الرئيس التنفيذي لشركة Blackbox AI: «بصفتنا المنصة الرائدة في بناء وكلاء البرمجة الذاتية، نحن متحمسون للتعاون مع سامبا نوفا، من خلال دمج سامبا نوفا كلاود، نحن نرفع منصتنا إلى المستوى التالي، ما يتيح لملايين المطورين الذين يستخدمون Blackbox AI اليوم بناء منتجات بسرعة غير مسبوقة، ما يعزز موقعنا كمنصة مفضلة للمطورين في جميع أنحاء العالم».
قال أليكس راتنر، الرئيس التنفيذي والمؤسس المشارك لشركة Snorkel AI: «مع انتقال الذكاء الاصطناعي من العروض المذهلة إلى الاحتياجات التجارية الواقعية، تصبح التكلفة والأداء في المقدمة»، وأضاف: «ستجعل سامبا نوفا كلاود من السهل والأسرع على المطورين البناء باستخدام نموذج 405B المثير للإعجاب من Llama، ستجعل سرعة الاستدلال العالية من سامبا نوفا، جنباً إلى جنب مع تطوير الذكاء الاصطناعي الموجه بالبيانات من Snorkel، نموذجاً رائعاً لتحقيق نجاح الذكاء الاصطناعي».
شهدت واجهة برمجة التطبيقات السريعة من سامبا نوفا تبنياً سريعاً منذ إطلاقها في أوائل يوليو، بفضل سامبا نوفا كلاود، يمكن للمطورين جلب نقاط التحقق الخاصة بهم، التبديل السريع بين نماذج Llama، أتمتة تدفقات العمل باستخدام سلسلة من مطالبات الذكاء الاصطناعي، واستخدام النماذج المعدلة مسبقًا بسرعة استدلال عالية، ستصبح بسرعة الحل المفضل للاستدلال للمطورين الذين يتطلبون قوة 405B، ومرونة كاملة، وسرعة.
سامبا نوفا كلاود
تتوفر سامبا نوفا كلاود اليوم عبر ثلاثة مستويات: مجاني، مطور، واحترافي، المستوى المجاني (متاح اليوم): يوفر وصولاً مجانياً لواجهة برمجة التطبيقات لأي شخص يقوم بتسجيل الدخول. والمستوى المطور (متاح بنهاية 2024): يتيح للمطورين بناء نماذج بحدود معدل أعلى باستخدام نماذج Llama 3.1 8B و70B و405B، والمستوى الاحترافي (متاح اليوم): يوفر للعملاء في الشركات القدرة على التوسع بحدود معدل أعلى لدعم أحمال العمل الإنتاجية.
يُعزى الأداء المثير للإعجاب لسامبا نوفا كلاود إلى شريحة الذكاء الاصطناعي SN40L الخاصة بسامبا نوفا، بفضل تصميم تدفق البيانات الفريد والمُسجل وبرنامج الذاكرة ثلاثي المستويات، يمكن لشريحة SN40L تشغيل نماذج الذكاء الاصطناعي بسرعة وكفاءة أعلى.