Kokoro-Motoru: Animasyonlu AI arkadaş iş akışları için yerel çalışma zamanı
Kokoro-Engine, Chyinan tarafından geliştirilen, masaüstü sistemlerde yerel sanal AI arkadaşları çalıştırmak için açık kaynaklı bir etkileşim motorudur. Live2D avatarlarını dil modelleri, konuşma sentezi ve konuşma tanıma ile senkronize ederek, oturumlar arasında hafıza ve duygusal durumu koruyan konuşma karakterleri oluşturur. Ana bileşenler arasında modüler MOD desteği, Model Bağlam Protokolü entegrasyonu ve birden fazla ses arka ucu bulunmaktadır. Proje, masaüstü platformlarda yerel olarak kontrol edilen, genişletilebilir bir arkadaş çalışma zamanı ihtiyacı duyan AI meraklıları, VTuber'lar ve geliştiricileri hedef alıyor.
Tek bir çalışma zamanında etkileşimli, kalıcı sanal karakterler prototipleştirebilirsiniz
Motor, oturumlar arasında devam eden karakter öncelikli etkileşimler üretir, bu da yaratıcıların ayrı render ve arka uç yığınları oluşturmadan persona ve ses üzerinde iterasyon yapmasına olanak tanır. Tipik kullanımlar arasında karakter kontrolü akışı, diyalog ile bağlantılı reaktif hareketlerin betimlenmesi ve konuşma akışlarını hızlı bir şekilde test etme yer alır. Karakter tanımlarını veya basit kişilik kartlarını içe aktarmak, başlangıç ayarını hızlandırır ve yaratıcıların daha geniş dağıtımdan önce tempo, dudak senkronizasyonu ve reaktif tetikleyicileri değerlendirmesine olanak tanır.
Yerel depolama ve arka uç seçimi çıktı doğrulama sorumluluğunu kaydırır
Sohbet geçmişi, karakter hafızası ve yapılandırma, yerel olarak SQLite'ta depolanır; bu, yerel öncelikli bir iş akışını destekler ve varsayılan bulut saklamasını azaltır. Araç, yerel ve uzaktan dil arka uçlarına bağlanır; üretilen yanıtlar seçilen sağlayıcıyı yansıtır, bu nedenle gerçek veya hassas içerik bağımsız doğrulama gerektirir. Duygusal durum takibi oturum sürekliliğini korur, ancak tutarlı ve doğru hafıza girdilerini sürdürmek, kullanıcının kasıtlı yazımı ve periyodik budaması gerektirir.
Hizmetleri ve sesi genişletmek geliştirici ayarı ve açık yapılandırma gerektirir
Özelleştirme ve harici bağlantılar, tıklama deneyimi yerine bir geliştirme iş akışını tercih eder. Proje, GPT-SoVITS, VITS ve Edge TTS gibi sentez seçeneklerini ve VAD desteği ile Whisper ve SenseVoice gibi tanıma seçeneklerini listeler. Telegram, Discord ve LINE için uzaktan bot geçitleri mevcuttur ve SillyTavern karakter kartları doğrudan içe aktarılır. Kaynaktan inşa etmek, Node.js v18+ ve Rust gerektirir, bu nedenle yerel derlemeler için ek araç zinciri ayarı bekleyin.
Pratik yapılandırmayı kabul eden teknik olarak hazırlıklı yaratıcılar için en uygun
Motor, kurulum ve yinelemeli testlere zaman yatırmaya istekli kullanıcıları ödüllendirir ve tak-çalıştır tüketicilere yönelik değildir. Pratik ipucu: dar bir kapsamla başlayın, kısa doğrulama oturumları yapın, ardından davranış stabil hale geldikçe entegrasyonları genişletin. Motor, özelleştirilmiş bir yardımcı deneyime ulaşmak için pratik bakım kabul eden yaratıcılar için pratik bir seçimdir ve geliştirici araçları ile bir öğrenme eğrisi bekler.