e
sv

Google, yapay zeka modeli Gemma’yı duyurdu

22 Şubat 2024 09:57
avatar

Mehmet Abacı

  • e

    Mutlu

  • e

    Eğlenmiş

  • e

    Şaşırmış

  • e

    Kızgın

  • e

    Üzgün

Google, geliştiricilerin yapay zekayı sorumlu bir şekilde oluşturmalarına yardımcı olmak amacıyla yeni nesil açık kaynak modeli Gemma'yı duyurdu.

Gemma model ailesi, yapay zeka sohbet robotu Gemini ile aynı araştırma ve teknolojiyle oluşturulduğu ve son teknoloji açık kaynak modeline sahip olduğu belirtildi.

DeepMind ve Google‘daki diğer ekiplerce geliştirilen yeni modelin, Gemini’den ilham aldığı ifade edildi. Google, Gemma modellerinin sorumlu kullanımına rehberlik edecek araçların da yayınlandığını belirtti. Gemma’nın dünya çapında kullanıma sunulduğu bildirilirken, modelin Gemma 2B ve Gemma 7B olmak üzere iki boyutta piyasaya sürüldüğü kaydedildi.

Google, ayrıca bu ay yapay zeka sohbet robotu Bard’ı Gemini olarak yeniden adlandırırken, yeni sürüm Gemini Advanced için ücretli abonelik başlattı.

Gemma nedir?

Gemma, Google’ın Gemini’yi temel alan 4 yeni LLM modelinden oluşan bir ailedir. İki boyutta gelir: 2B ve 7B parametreleri, her biri temel (önceden eğitilmiş) ve talimat ayarlı versiyonlara sahiptir. Tüm varyantlar, niceleme olmadan bile çeşitli tüketici donanımı türlerinde çalıştırılabilir ve 8K token bağlam uzunluğuna sahiptir.

Gemma 7B, Mistral 7B de dahil olmak üzere 7B ağırlığındaki en iyi modellerle karşılaştırılabilecek performansa sahip, gerçekten güçlü bir modeldir. Gemma 2B, boyutuna göre ilginç bir model, ancak sıralamada Phi 2 gibi benzer boyuta sahip en yetenekli modeller kadar yüksek puan almıyor.

Gemma’nın Özellikleri ve Modelleri Nedir?

gemma-7b: Temel 7B modeli.
gemma-7b-it: Temel 7B modelinin ince ayarlı versiyonu.
gemma-2b: Temel 2B modeli.
gemma-2b-it: Temel 2B modelinin ince ayarlı versiyonu.

  • Bilgi istemi biçimi

Temel modellerde bilgi istemi formatı yoktur. Diğer temel modeller gibi, bunlar da bir giriş sırasını makul bir devamla sürdürmek veya sıfır atış/birkaç atış çıkarımı için kullanılabilir. Bunlar aynı zamanda kendi kullanım durumlarınıza göre ince ayar yapmak için de harika bir temel oluşturur. Instruct sürümleri çok basit bir konuşma yapısına sahiptir.

  • Bilinmeyenleri Keşfetmek

Teknik raporda temel modellerin eğitim ve değerlendirme süreçlerine ilişkin bilgiler yer alıyor ancak veri setinin bileşimi ve ön işlemesine ilişkin kapsamlı ayrıntılar bulunmuyor. Çoğunlukla web belgeleri, kodlar ve matematiksel metinler olmak üzere çeşitli kaynaklardan alınan verilerle eğitildiklerini biliyoruz. Veriler, lisans kontrollerinin yanı sıra CSAM içeriğini ve PII’yi kaldırmak için filtrelendi.

Benzer İçerikler
  • Site İçi Yorumlar

En az 10 karakter gerekli