Teknoloji
Moderator
Bu yılın Mayıs ayında IBM'in hem açık kaynaklı Granite üretken yapay zeka modelleriyle kod üretimine odaklandığını hem de InstructLab adlı girişimini sizlerle paylaşmıştık. IBM paylaştığı bir gönderi ile Apache 2.0 lisansı altında piyasaya sürülen yeni Granite 3.0 8B ve Granite 3.0 2B modellerini tanıttı.
Şirket ayrıca Granite 3.0 3B A800M Instruct, Granite 3.0 1B A400M Instruct, Granite 3.0 3B A800M Base ve Granite 3.0 1B A400M Base'i içeren Uzmanların Karışımı (MoE) modellerini tanıttı. Buna ek olarak IBM'in Granite Guardian 3.0 8B ve Granite Guardian 3.0 2B modellerini içeren yeni bir gruba da sahip olduğunu belirtelim. Söz konusu grup, optimize edilmiş korkuluk ve güvenlik seçenekleriyle öne çıkıyor.
IBM'in kıdemli başkan yardımcısı ve baş ticari sorumlusu Rob Thomas'ın aktardıklarına göre; son kazanç çağrısında da belirtildiği üzere, şirketin üretken yapay zeka üzerine inşa ettiği iş hacmi şu anda teknoloji ve danışmanlık genelinde 2 milyar dolardan fazla. Thomas, IBM'deki 25 yılını göz önünde bulundurarak daha önce bu hızda ölçeklenen bir iş alanına sahip olmadıklarını ifade etti.
Kullanıcılar, kurumsal uygulamalara odaklanan Granite 3.0 model ailesinden müşteri hizmetleri, BT otomasyonu, İş Süreci Dış Kaynak Kullanımı (BPO), uygulama geliştirme ve siber güvenlik gibi alanlarda faydalanabilir.
Yeni Granite 3.0 modelleri, merkezi veri modeli fabrikası ekibi tarafından eğitildi. Bu ekip, IBM'in eğitim için kullandığı verileri tedarik etmek ve düzenlemekten sorumlu. Model, yeni bir iki aşamalı eğitim yöntemi kullanılarak, 12 farklı doğal dil ve 116 farklı programlama dilinden alınan veriler üzerinde eğitildi. IBM Kıdemli Başkan Yardımcısı ve Araştırma Direktörü Dario Gil'in aktardıklarına göre eğitim süreci, 12 trilyon token'lık veriyi içeriyor.
Şirketin paylaştığı bilgilere göre RAG, araç kullanımı ve Siber Güvenlik alanındaki görevlerin temel kurumsal görevlerinde Granite 3.0 8B Instruct modeli, Mistral ve Meta'nın benzer büyüklükteki açık kaynak modellerine kıyasla ortalama olarak lider performans göstermekte.
IBM, Hugging Face'in OpenLLM Leaderboard'u tarafından tanımlanan standart akademik kıyaslamalarda, Granite 3.0 8B Instruct modelinin genel performansının, Meta ve Mistral'in benzer büyüklükteki açık kaynak modellerinin son teknoloji performansına karşı ortalama olarak lider olduğunu belirtiyor. Yine de özellikle MMLU, MMLU-Pro ve AGI-Eval ölçütlerinde Llama 3.2 3B'nin Granite 3.0 2B'yi geride bıraktığını görüyoruz. Aynı şekilde Llama 3.1 8B, Kitlesel Çok Görevli Dil Anlayışı olarak tercüme edebileceğimiz MMLU ölçütünde Granite-3.0 8B'nin önüne geçiyor.
Buna ek olarak şirket, AttaQ güvenlik kıyaslamasında Granite 3.0 8B Instruct modelinin, Meta ve Mistral modellerine kıyasla ölçülen tüm güvenlik boyutlarında lider olduğunu ifade ediyor. Yeni IBM dil modellerinin teknik dokümanında daha detaylı kıyaslamalar da mevcut. Bu anlamda modelleri denemeden önce teknik dokümanı okumakta fayda var.
Yeni modeller IBM'in watsonX hizmetinin yanı sıra Amazon Bedrock, Amazon Sagemaker ve Hugging Face'de de kullanıcılarla buluşacak. Yıl sonuna kadar, 3.0 8B ve 2B dil modellerinin genişletilmiş 128K bağlam penceresi ve çok modlu belge anlama yetenekleri için destek içermesi bekleniyor.
Şirket ayrıca Granite 3.0 3B A800M Instruct, Granite 3.0 1B A400M Instruct, Granite 3.0 3B A800M Base ve Granite 3.0 1B A400M Base'i içeren Uzmanların Karışımı (MoE) modellerini tanıttı. Buna ek olarak IBM'in Granite Guardian 3.0 8B ve Granite Guardian 3.0 2B modellerini içeren yeni bir gruba da sahip olduğunu belirtelim. Söz konusu grup, optimize edilmiş korkuluk ve güvenlik seçenekleriyle öne çıkıyor.
IBM'in kıdemli başkan yardımcısı ve baş ticari sorumlusu Rob Thomas'ın aktardıklarına göre; son kazanç çağrısında da belirtildiği üzere, şirketin üretken yapay zeka üzerine inşa ettiği iş hacmi şu anda teknoloji ve danışmanlık genelinde 2 milyar dolardan fazla. Thomas, IBM'deki 25 yılını göz önünde bulundurarak daha önce bu hızda ölçeklenen bir iş alanına sahip olmadıklarını ifade etti.
Kullanıcılar, kurumsal uygulamalara odaklanan Granite 3.0 model ailesinden müşteri hizmetleri, BT otomasyonu, İş Süreci Dış Kaynak Kullanımı (BPO), uygulama geliştirme ve siber güvenlik gibi alanlarda faydalanabilir.
Eğitim verileri
Yeni Granite 3.0 modelleri, merkezi veri modeli fabrikası ekibi tarafından eğitildi. Bu ekip, IBM'in eğitim için kullandığı verileri tedarik etmek ve düzenlemekten sorumlu. Model, yeni bir iki aşamalı eğitim yöntemi kullanılarak, 12 farklı doğal dil ve 116 farklı programlama dilinden alınan veriler üzerinde eğitildi. IBM Kıdemli Başkan Yardımcısı ve Araştırma Direktörü Dario Gil'in aktardıklarına göre eğitim süreci, 12 trilyon token'lık veriyi içeriyor.
Kıyaslama ölçütleri
Şirketin paylaştığı bilgilere göre RAG, araç kullanımı ve Siber Güvenlik alanındaki görevlerin temel kurumsal görevlerinde Granite 3.0 8B Instruct modeli, Mistral ve Meta'nın benzer büyüklükteki açık kaynak modellerine kıyasla ortalama olarak lider performans göstermekte.
IBM, Hugging Face'in OpenLLM Leaderboard'u tarafından tanımlanan standart akademik kıyaslamalarda, Granite 3.0 8B Instruct modelinin genel performansının, Meta ve Mistral'in benzer büyüklükteki açık kaynak modellerinin son teknoloji performansına karşı ortalama olarak lider olduğunu belirtiyor. Yine de özellikle MMLU, MMLU-Pro ve AGI-Eval ölçütlerinde Llama 3.2 3B'nin Granite 3.0 2B'yi geride bıraktığını görüyoruz. Aynı şekilde Llama 3.1 8B, Kitlesel Çok Görevli Dil Anlayışı olarak tercüme edebileceğimiz MMLU ölçütünde Granite-3.0 8B'nin önüne geçiyor.
Buna ek olarak şirket, AttaQ güvenlik kıyaslamasında Granite 3.0 8B Instruct modelinin, Meta ve Mistral modellerine kıyasla ölçülen tüm güvenlik boyutlarında lider olduğunu ifade ediyor. Yeni IBM dil modellerinin teknik dokümanında daha detaylı kıyaslamalar da mevcut. Bu anlamda modelleri denemeden önce teknik dokümanı okumakta fayda var.
Yeni modeller IBM'in watsonX hizmetinin yanı sıra Amazon Bedrock, Amazon Sagemaker ve Hugging Face'de de kullanıcılarla buluşacak. Yıl sonuna kadar, 3.0 8B ve 2B dil modellerinin genişletilmiş 128K bağlam penceresi ve çok modlu belge anlama yetenekleri için destek içermesi bekleniyor.