Najlepsze głosy generowane za pomocą technologii AI!

NAJLEPSZY VO + LEGALNA AI

W 100% legalne narzędzie wspomagające profesjonalistów z branży audio/video.

PROJEKT VO+AI

VO+AI to wspólny projekt zawodowych lektorów i pierwszego w Polsce internetowego banku głosów Mikrofonika. Pierwsze narzędzie łączące możliwości i doświadczenie popularnych i lubianych głosów
z zaletami sztucznej inteligencji.

Oparty na legalnych źródłach, w pełni bezpieczny dla obu stron, wyjątkowy system, umożliwiający wykorzystanie lektorów doskonale znanych odbiorcom z radia, telewizji i internetu. Każdy model
jest w pełni autonomiczny
, tworzony od podstaw, z zachowaniem indywidualnych cech charakterystycznych dla każdego czytającego. Brzmienie głosu, intonacja, interpretacja a nawet oddechy – to możliwie wierna kopia naszych najlepszych lektorów.

Zaprezentuj swoim klientom teksty wygenerowane przez sztuczną inteligencję, w oparciu o doskonale znane im brzmienie, któremu ufają od dziesiątków lat.

Posłuchaj jak brzmi VO+AI

BLOG - KROK PO KROKU

Nadszedł w końcu ten dzień. Jesteśmy gotowi by pokazać Wam, jak idzie tworzenie głosowych awatarów najlepszych lektorów! Nie próżnowaliśmy przez ten czas …

8 Ogólnopolskie Spotkanie Lektorów, organizowane przez bank głosów Mikrofonika to idealne miejsce na prezentację naszej technologii. Rok temu w tej sali pokazaliśmy …

Ireneusz to pierwszy lektor w naszej bazie, dla którego wytrenowaliśmy voicebota klasy „studio”. Czym różni się od standardowego avatara klasy „basic”? W …

Pozdrawiamy z warszawskiej Stacji Praga, gdzie z Michałem Rusnarczykiem rozmawiamy o etycznych i moralnych aspektach sztucznej inteligencji, przyszłości branży lektorskiej w kontekście …

Etyka i legalność

Rozwój technologii AI niesie ze sobą szczególną odpowiedzialność i stawia nas przed nowymi wyzwaniami. Świat się zmienia, ale są w nim pewne stałe zasady. Głos każdego człowieka jest jego wyłączną własnością. Podobnie jak inne charakterystyczne cechy każdego lektora: interpretacja, akcentowanie, frazowanie i wypracowane przez lata pracy wzorce emisji.

Nie jest tajemnicą, że firmy z branży technologicznej nie szanują podstawowych praw osób, których głos pojawia się publicznie. Korzystają z zasobów cyfrowych bez zgody wydawców, emitentów i lektorów – właścicieli tych nagrań. To musi rodzić skutki prawne.

Projekt VO+AI pokazuje, że można pogodzić interesy wszystkich stron i zaprezentować produkt w 100% zgodny z prawem i podstawowymi zasadami. Każdy lektor, którego głosu użyliśmy w tym projekcie,
jest pewien, że będzie miał nad jego wykorzystaniem pełną kontrolę, a ewentualne zyski z używania powstałego modelu głosu będą sprawiedliwie dzielone. Gwarantuje mu to jasna i transparentna umowa.

Konsultujemy naszą filozofię rozwoju z samymi lektorami, prezentując ją na Ogólnopolskim Spotkaniu Lektorów. Nasze umowy zostały przedstawione Stowarzyszeniu Lektorów RP, ZASP oraz Związkowi Zawodowemu Twórców Dubbingu.

VO+AI nie ma na celu zastąpienia lektora technologią. Ma ułatwić klientom dobór odpowiedniego wykonawcy. Ma pomóc montażystom poprawiać uciążliwe błędy oraz uzmysławiać realizatorom różnice i mnogość opcji do wyboru. Ma też pomóc lektorom kiedy nie będą mogli pracować, oszczędzać czas i zwiększać zyski wszystkich uczestników rynku. Współtworzyć lepsze produkcje.

Nasi partnerzy mogą być pewni, że będziemy dbać o ich prawa, występować w ich obronie
i chronić ich głosy przed nielegalnym wykorzystaniem.

Technologia

W wielkim uproszczeniu nasz projekt umożliwia stworzenie dokładnej cyfrowej kopii każdego głosu. W oparciu o zrealizowane nagrania, analizujemy za pomocą AI brzmienie, sposób artykulacji, interpretacji, frazowania i oddychania poszczególnych czytających. Staramy się możliwie wiernie odtworzyć te zmienne podczas generowania dźwięków mowy, na podstawie przekazanego pliku tekstowego. Z angielska nazywa się to TTS (text to speech).

Nasze prace oparte są o technologie dostępne publicznie. Korzystamy z rozwiązań na licencji MIT m. in. GradTTS i HiFi-GAN. Modyfikujemy i ulepszamy autorski silnik, starając się uzyskać możliwie dobre rezultaty, a nasze modele głosowe są nieustannie udoskonalane i rozbudowywane o nowe nagrania. Wszystko dzieje się w zamkniętej, bezpiecznej przestrzeni sieci lokalnej, a żadne materiały nie są wysyłane na serwery firm zewnętrznych.

Pracami naszego zespołu kieruje Marcin Hajdukiewicz, jeden z pionierów technologii TTS w Polsce, opracowujący rozwiązania w oparciu o technologię AI od 2021 roku.

Projekt wspierają