Modders niedawno opracował nowy mod do GTA V na PC o nazwie „Sentient Streets”, który wprowadza policyjną misję dochodzeniową z udziałem ponad 30 NPC z głosami generowanymi przez sztuczną inteligencję. Ten imponujący wyczyn techniczny budzi jednak obawy co do pochodzenia danych treningowych AI i możliwości odtwarzania głosów bez zgody.
Głosy AI i reakcje, które ożywiają NPC
Mod Sentient Streets został stworzony przez renomowanego moddera Bloc przy użyciu nowych narzędzi Character Engine od Inworld i ElevenLabs. Ten mod dodaje zadanie Departamentu Policji Los Santos obejmujące przesłuchanie NPC za pomocą głosów generowanych przez sztuczną inteligencję.
Zamiast wyreżyserowanych odpowiedzi lub aktorów głosowych, reakcje i głosy NPC są generowane dynamicznie poprzez analizę AI pytań graczy i wybranych modeli osobowości.
Ta responsywna konwersacja pokazuje potencjał sztucznej inteligencji do symulowania ludzkiej mowy i tworzenia unikalnych tożsamości głosowych w przekonujący i niedrogi sposób. Oferuje wgląd w bardziej realistyczne i nieprzewidywalne interakcje z wirtualnymi postaciami.
Demokratyzuj tworzenie gier dzięki dostępnej sztucznej inteligencji
„Sentient Streets” rozpoczyna od Inworld i ElevenLabs udostępnianie zestawu narzędzi silnika postaci innym modderom i studiom. Celem jest rozszerzenie możliwości programistycznych dla niezależnych twórców.
Potężne zastrzeżone sztuczna inteligencja, takie jak rozszerzone modele językowe, były wcześniej niedostępne dla większości hobbystów i małych zespołów. Teraz platformy takie jak Character Engine obiecują demokratyzację doświadczenia NPC nowej generacji przy ograniczonych zasobach.
Ponieważ narzędzia te stają się coraz bardziej rozpowszechnione, coraz więcej gier na konsole i komputery PC może zawierać responsywne dialogi AI i syntezowane głosy, zamiast polegać wyłącznie na drogich skryptach i aktorach głosowych.
Potrzeba przejrzystości w zakresie pochodzenia danych
Jednak ElevenLabs pozostaje niejasne co do dokładnego pochodzenia danych wykorzystywanych do szkolenia swoich systemów sztucznej inteligencji w zakresie generowania ludzkich głosów, stwierdzając jedynie, że wykorzystuje dane „publicznie dostępne”.
Przejrzystość co do pochodzenia danych jest niezbędna, ponieważ zsyntetyzowane głosy zyskują na jakości. Korzystanie ze skrobanych źródeł danych online lub nieautoryzowanych nagrań rodzi ogromne problemy etyczne bez zgody.
Podczas gdy platformy takie jak Character Engine zapewniają dostęp do potężnej sztucznej inteligencji mniejszym programistom, jasne znaczniki i walidacja są kluczem do zapobiegania nadużyciom i naruszeniom.
Rosną obawy dotyczące reprodukcji głosu
W rzeczywistości obawy aktorów głosowych dotyczące dubbingu AI rosną, ponieważ narzędzia takie jak ElevenLabs stają się coraz bardziej rozpowszechnione. Wielu postrzega to jako zagrożenie dla ich źródeł utrzymania lub marki głosowej, jeśli jest używane bez pozwolenia.
Aktorka z Elder Scrolls nazwała podszywanie się pod głos AI, które sklonowało jej pracę, jako „bardzo przerażające”, podkreślając rosnące obawy wśród kreatywnych talentów w miarę postępu w odtwarzaniu syntetycznego głosu.
Studia, które wykorzystują sztuczną inteligencję do dubbingu, muszą ustanowić surowe wytyczne etyczne, które równoważą innowacyjność i zgodę aktora. Technologia pozostaje kontrowersyjna.
Wskaźnik potencjału transformacyjnego AI
Niezależne modyfikacje, takie jak „Sentient Streets”, stanowią pole do zilustrowania rewolucyjnych zastosowań sztucznej inteligencji w projektowaniu gier oraz złożonej dynamiki, jaką wprowadza ona dla programistów.
Gdy firmy demokratyzują generatywną sztuczną inteligencję, obiecuje ona odblokowanie nowych kreatywnych możliwości w sztuce, muzyce, rozmowach, grach i nie tylko, które zmieniają rozrywkę i branże.
Kluczowe znaczenie ma jednak zapewnienie odpowiedzialnego korzystania z tej nowej mocy, ponieważ sztuczna inteligencja jest teraz bardziej dostępna niż kiedykolwiek. „Sentient Streets” stanowi wymowny wskaźnik tego ewoluującego napięcia.
Wniosek
„Sentient Streets” wprowadza generowane przez sztuczną inteligencję głosy postaci z gier wideo, demonstrując radykalnie nowe kierunki wciągających interakcji NPC. Jednak ulepszone możliwości rodzą pilne pytania etyczne dotyczące zgody i odtwarzania głosu, które wymagają proaktywnych rozwiązań.
Odpowiedzialne wytyczne dotyczące pochodzenia i imitacji danych określą, czy sztuczna inteligencja promuje realizm postaci, czy też wywołuje reakcję, odmawiając praw uznanym twórcom. Ponieważ zaawansowana sztuczna inteligencja demokratyzuje się, kluczowe znaczenie ma skupienie jej mocy na dobre.
Często zadawane pytania
Jak powstały głosy NPC?
Wykorzystanie sztucznej inteligencji do przetwarzania tekstu na mowę z ElevenLabs, które zostało przeszkolone na „publicznie dostępnych” źródłach danych. Dokładne pochodzenie danych treningowych pozostaje obecnie niejasne.
Jakie są zalety głosów AI w grach?
Potencjalne oszczędności kosztów, wykładniczo rosnąca różnorodność unikalnych głosów, responsywność/randomizacja poza stałymi liniami głosowymi.
Jakie zagrożenia wiążą się z odtwarzaniem głosów prawdziwych ludzi?
Brak zgody, utrata dochodów z powodu imitacji, prawne i etyczne kwestie własności i właściwego użytkowania.
W jaki sposób głosy AI mogą zagrozić aktorom?
Zsyntetyzowane głosy mogłyby teoretycznie naśladować je bez pozwolenia, co mogłoby zagrozić ich rozgłosowi wokalnemu i podaniu o pracę.
Jak ograniczyć ryzyko związane z głosami AI?
Ustanowienie znacznie surowszych wytycznych, wymogów przejrzystości i zgody wokół danych szkoleniowych i wykorzystania imitacji. Etyczne środki ostrożności są niezbędne w miarę postępu technologicznego.
Śledź nas na naszych portalach społecznościowych i bądź na bieżąco ze wszystkim, co dzieje się w Metaverse!
Twitter | LinkedIn | Facebook | Telegram | Instagram | Wiadomości Google | Sklep Amazona
Źródło: www.geekmetaverse.com





