Oprogramowanie

OpenAI zmienia zasady. Zapomnij o uczeniu się języków, po prostu mów

Chociaż sztuczna inteligencja kojarzy się większości osób z czatbotami, obrazkami i filmikami, to ma ona znacznie więcej zastosowań.

PRZEMYSłAW BANASIAK (YOKAI) 19:53

OpenAI zmienia zasady. Zapomnij o uczeniu się języków, po prostu mów

Dodaj do ulubionych źródeł w Google

OpenAI wprowadziło nowe modele głosowe, które mają być znacznym usprawnieniem względem dostępnych do tej pory rozwiązań. Według prezentacji to koniec prostego schematu pytanie-odpowiedź, a krok w kierunku systemów, które potrafią jednocześnie słuchać, rozumować, tłumaczyć, transkrybować i podejmować działania w trakcie rozmowy.

Dalsza część tekstu pod wideo

Jak na razie nowe modele dostępne są wyłącznie w ramach API

Najważniejszą nowością jest GPT-Realtime-2, przeznaczony do prowadzenia bardziej naturalnych rozmów. Ma on generować realistycznie brzmiącą mowę i reagować na użytkownika w sposób przypominający konwersację z człowiekiem. W porównaniu z poprzednikiem, GPT-Realtime-1.5, nowy model ma wykorzystywać rozumowanie klasy GPT-5, co według OpenAI pozwoli mu lepiej radzić sobie z bardziej złożonymi sytuacjami.

Wybrane okazje dla Ciebie

Reklama

Mikrofon MAD DOG SM200K Kardioidalny + Ramię mikrofonowe MAD DOG MA100K Obciążenie głowicy 1.5 kg

0 zł

~~399.99 zł~~ - najniższa cena

Kup teraz 399.99 zł

0 zł

~~249 zł~~ - najniższa cena

Kup teraz 249 zł

0 zł

~~189 zł~~ - najniższa cena

Kup teraz 189 zł

Drugim novum jest GPT-Realtime-Translate. Jak sama nazwa wskazuje, model służy do tłumaczenia rozmów w czasie rzeczywistym. Rozwiązanie obsługuje ponad 70 języków wejściowych, czyli takich, które potrafi zrozumieć, oraz 13 języków wyjściowych, w których może przekazywać tłumaczenie rozmówcy. Firma podkreśla, że chodzi nie tylko o samo tłumaczenie słów, ale też o utrzymanie tempa naturalnej rozmowy.

Do tego dochodzi GPT-Realtime-Whisper, nowa funkcja transkrypcji mowy na tekst. Jej zadaniem jest zapisywanie wypowiedzi na żywo, w trakcie trwania interakcji. W praktyce może to oznaczać łatwiejsze tworzenie notatek ze spotkań, zapis rozmów z klientami, automatyczne napisy czy narzędzia dla osób, które muszą korzystać z tekstu zamiast dźwięku.

Początkowo wszystkie z wymienionych dostępne są w ramach API, dla deweloperów tworzących własne aplikacje. OpenAI zauważyło jednak ogromne zainteresowanie ze strony zwykłych użytkowników, a wpisy na X sugerują wprowadzenie tych rozwiązań z czasem również do ChatGPT.

Philips Evnia 27M2N5500 (27", QHD, 180 Hz)

AI sztuczna inteligencja OpenAI ChatGPT tłumaczenie na żywo tłumaczenie ai tłumaczenie nagrań dźwiękowych GPT-Realtime-2

Źródła zdjęć: OpenAI

Źródła tekstu: OpenAI, oprac. własne

Zobacz więcej

Oprogramowanie 20:38

Airbnb znowu pod ostrzałem. Tym razem z niecodziennego powodu