Claude (dil modeli)
Geliştirici(ler) | Anthropic |
---|---|
İlk yayınlanma | Mart 2023 | )
Tür | |
Lisans | Tescilli |
Resmî sitesi | claude.ai |
Claude, Anthropic tarafından geliştirilen geniş kapsamlı dil modelleri ailesidir.[1] İlk model Mart 2023'te piyasaya sürüldü. Mart 2024'te çıkan Claude 3 ise görselleri de analiz edebiliyor.[2]
Eğitim
[değiştir | kaynağı değiştir]Claude modelleri, büyük miktarda metin içindeki sonraki kelimeyi tahmin etmek için önceden eğitilmiş üretken dönüştürücülerdir. Claude modelleri daha sonra, onları yararlı, dürüst ve zararsız hale getirmek amacıyla Anayasal Yapay Zeka ile ince ayardan geçirilmiştir.[3][4]
Anayasal Yapay Zeka
[değiştir | kaynağı değiştir]Anthropic tarafından geliştirilen Anayasal Yapay Zekâ, Claude gibi dil modelleri de dahil olmak üzere yapay zeka sistemlerini kapsamlı insan geri bildirimine ihtiyaç duymadan zararsız ve faydalı hale getirmek için bir yaklaşımdır. "Constitutional AI: Harmlessness from AI Feedback" başlıklı makalede detaylandırılan yöntem, denetimli öğrenme ve takviyeli öğrenme olmak üzere iki aşamayı içerir.[4]
Gözetimli öğrenme aşamasında, model, promplara yanıt oluşturur, bunları rehber ilkeler kümesi (bir "anayasa") temelinde kendi kendini eleştirir ve yanıtları günceller. Sonra model, bu güncellenmiş yanıtlara göre ince ayarlanır.
Yapay zeka geri bildirimi ile pekiştirmeli öğrenme (RLAIF) aşamasında, yanıtlar oluşturulur ve anayasaya uyumlulukları açısından karşılaştırılır. Bu yapay zeka geri bildirimi veri seti, yanıtları anayasaya ne kadar uyduğuna göre değerlendiren bir tercih modeli eğitmek için kullanılır. Daha sonra Claude, bu tercih modeline göre hizalanacak şekilde ince ayara alınır. Bu teknik, insan geri bildiriminden pekiştirmeli öğrenme (RLHF) ile benzerlik gösterir, ancak tercih modelini eğitmek için kullanılan karşılaştırmalar yapay zeka kaynaklıdır ve anayasaya dayanır.[4][5]
Bu yaklaşım, yardımcı ve zararsız yapay zeka asistanlarının eğitilmesini sağlar ve zararlı taleplere karşı itirazlarını açıklayabilir, böylece şeffaflığı artırır ve insan denetiminin gereksinimini azaltır.[6][7]
Claude için oluşturulan "anayasa" 75 maddeden oluşmakta olup, BM İnsan Hakları Evrensel Bildirgesi'nden bölümler de içermektedir.[3][6]
Modeller
[değiştir | kaynağı değiştir]Claude
[değiştir | kaynağı değiştir]Claude, Anthropic tarafından Mart 2023'te piyasaya sürülen ilk büyük dil modelidir.[8] Claude çeşitli görevlerde yetenekli olduğunu kanıtlasa da kodlama, matematik ve muhakeme yeteneklerinde bazı kısıtlamalara sahipti.[9] Anthropic, Notion (üreticilik yazılımı) ve Quora (Poe sohbet robotunu geliştirmeye yardımcı olmak için) gibi şirketlerle ortaklık kurdu.[9]
Claude Instant
[değiştir | kaynağı değiştir]Claude, iki sürüm olarak piyasaya sürüldü: Claude ve Claude Instant. Claude Instant, daha hızlı, daha ucuz ve daha hafif bir sürümdür. Claude Instant'ın giriş bağlam uzunluğu 100.000 token (yaklaşık 75.000 kelimeye karşılık gelir).[10]
Claude 2
[değiştir | kaynağı değiştir]Claude'un sonraki büyük güncellemesi olan Claude 2, 11 Temmuz 2023'te yayınlandı ve genel halka açık hale geldi. Buna karşın, Claude 1 yalnızca Anthropic tarafından onaylanan seçilmiş kullanıcılara sunuluyordu.[11]
Claude 2, bağlam penceresini 9,000 token'dan 100,000 token'a genişletti.[8] Ayrıca, Claude 2'ye PDF ve diğer dokümanları yükleme özelliği eklendi. Böylece kullanıcılar, Claude'un bu belgeleri okuyup özetlemesini ve görevlerde yardımcı olmasını sağlayabilir hale geldi.
Claude 2.1
[değiştir | kaynağı değiştir]Uzmanların belirttiğine göre, Claude 2.1 sürümü önceki sürümlere kıyasla daha az yanlış ifade üretme eğilimindedir.[12] Ayrıca, işlenebilen belge uzunluğu da önemli ölçüde artırılmış ve yaklaşık 500 sayfalık yazılı materyale denk gelen 200.000 token'lık bir pencereye ulaşmıştır.[1]
Claude 3
[değiştir | kaynağı değiştir]Claude 3, 14 Mart 2024 tarihinde piyasaya sürülmüş ve basın açıklamasında geniş bir yelpazedeki bilişsel görevlerde yeni sektör standartları oluşturduğu iddia edilmiştir. Claude 3 ailesi, yetenek sırasına göre Haiku, Sonnet ve Opus olmak üzere üç ileri teknoloji modeli içermektedir. Varsayılan sürüm olan Opus'un 200.000 token'lık bir bağlam penceresi bulunmakta, ancak bu belirli kullanım durumları için 1 milyon token'a genişletilmektedir.[13][14]
Claude 3, yapay olarak test edildiğini fark etme yeteneği de dahil olmak üzere meta-bilişsel akıl yürütme gerçekleştiriyor gibi görünmektedir.[15]
Erişim
[değiştir | kaynağı değiştir]Sınırlı erişim ücretsizdir, ancak hem e-posta adresi hem de cep telefonu numarası gereklidir.
1 Mayıs 2024'te Anthropic, Claude'un ilk kurumsal paketi olan Claude Team planını ve bir Claude iOS uygulamasını duyurdu.[16]
Kaynakça
[değiştir | kaynağı değiştir]- ^ a b Davis, Wes (21 Kasım 2023). "OpenAI rival Anthropic makes its Claude chatbot even more useful". The Verge (İngilizce). 23 Ocak 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Ocak 2024.
- ^ Whitney, Lance (4 Mart 2024). "Anthropic's Claude 3 chatbot claims to outperform ChatGPT, Gemini". ZDNET (İngilizce). 5 Mart 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 5 Mart 2024.
- ^ a b "What to Know About Claude 2, Anthropic's Rival to ChatGPT". TIME (İngilizce). 18 Temmuz 2023. 11 Ocak 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Ocak 2024.
- ^ a b c "Claude's Constitution". Anthropic (İngilizce). 9 Mayıs 2023. 26 Mart 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 26 Mart 2024.
- ^ Eliot, Lance (25 Mayıs 2023). "Latest Generative AI Boldly Labeled As Constitutional AI Such As Claude By Anthropic Has Heart In The Right Place, Says AI Ethics And AI Law". Forbes (İngilizce). 18 Nisan 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 27 Mart 2024.
- ^ a b Kadavath, Saurav; Kundu, Sandipan; Askell, Amanda; Kernion, Jackson; Jones, Andy; Chen, Anna; Goldie, Anna; Mirhoseini, Azalia (15 Aralık 2022), Constitutional AI: Harmlessness from AI Feedback, arXiv:2212.08073 $2 Birden fazla yazar-name-list parameters kullanıldı (yardım); Yazar
|ad1=
eksik|soyadı1=
(yardım) - ^ Mok, Aaron. "A ChatGPT rival just published a new constitution to level up its AI guardrails, and prevent toxic and racist responses". Business Insider (İngilizce). 23 Ocak 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Ocak 2024.
- ^ a b Drapkin, Aaron (27 Ekim 2023). "What Is Claude AI and Anthropic? ChatGPT's Rival Explained". Tech.co (İngilizce). 28 Ekim 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Ocak 2024.
- ^ a b "Introducing Claude". Anthropic. 14 Mart 2023. 16 Mayıs 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 15 Mayıs 2024.
- ^ Yao, Deborah (11 Ağustos 2023). "Anthropic's Claude Instant: A Smaller, Faster and Cheaper Language Model". AI Business. 3 Haziran 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 15 Mayıs 2024.
- ^ Matthews, Dylan (17 Temmuz 2023). "The $1 billion gamble to ensure AI doesn't destroy humanity". Vox (İngilizce). 3 Ekim 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Ocak 2024.
- ^ "Anthropic Announces Claude 2.1 LLM with Wider Context Window and Support for AI Tools". InfoQ (İngilizce). 23 Ocak 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Ocak 2024.
- ^ "Introducing the next generation of Claude". Anthropic (İngilizce). 4 Mart 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 4 Mart 2024.
- ^ Whitney, Lance (4 Mart 2024). "Anthropic's Claude 3 chatbot claims to outperform ChatGPT, Gemini". ZDNET (İngilizce). 5 Mart 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 5 Mart 2024.
- ^ Edwards, Benj (5 Mart 2024). "Anthropic's Claude 3 causes stir by seeming to realize when it was being tested". Ars Technica (İngilizce). 8 Mart 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 9 Mart 2024.
- ^ Field, Hayden (1 Mayıs 2024). "Amazon-backed Anthropic launches iPhone app and business tier to compete with OpenAI's ChatGPT". CNBC. 2 Mayıs 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 3 Mayıs 2024.