Aşağıdaki video demosunda gösterildiği gibi ChatGPT ile desteklenmiş ve bunun temelinde konuşabilen Spot, soruları yanıtlayabiliyor ve hatta gerçekten konuşuyormuş gibi görünmek için "ağzını" oynatabiliyor. Boston Dynamics, Spot'u "konuşturmak" için OpenAI'ın ChatGPT API'sini ve yanıtlarını dikkatle eğitmek için bazı açık kaynaklı büyük dil modellerini (LLM) kullandığını belirtiyor. Firma daha sonra Spot’a bir hoparlör ekleyip onu metinden konuşmaya sistemiyle donattı.
Boston Dynamics'in baş yazılım mühendisi Matt Klingensmith, ekibin Spot'a tesislerindeki odaların her biri için "çok kısa bir senaryo" verdiğini söylüyor. Ancak Spot, kameralarından aldığı görüntülerle bu kısa senaryoları birleştirerek daha fazla bilgi edinebiliyor/iletebiliyor. Şirkete göre Spot, görüntülere başlık eklemek ve bunlarla ilgili soruları yanıtlamak için Görsel Soru Yanıtlama modellerini kullanıyor.
Asıl hedef robotik ile yapay zekayı birleştirmek
Bu eğlenceli bir demo olsa da aslında arkasındaki amaç daha derin. Boston Dynamics, yapay zeka ile robotiği birleştirmeyi amaçlıyor diyebiliriz. Zira yapay zeka modelleri sayesinde robota sadece onunla konuşarak bir görev atayabilmek, bu sistemleri kullanmak için öğrenme eğrisini azaltmaya yardımcı olabilir. Robotlar, görevin tüm ayrıntılarını bilmese bile bağlamı anlayarak isteneni yerine getirebilir.