Nemsokára már valós időben tudsz beszélgetni a ChatGPT-vel
Az OpenAI bemutatta a ChatGPT új hangalapú funkcióját, amely természetes hatású, valós idejű beszélgetéseket tesz lehetővé.
Bemutatkozott a ChatGPT új hangfunkciója
A jelentések szerint a biztonsággal és a finomhangolással kapcsolatos több késés után az OpenAI által régóta várt „Advanced Voice Mode” (AVM) a ChatGPT-hez mostantól alfa verzióban is elérhető a kiválasztott felhasználók számára.
Live demo of GPT-4o realtime conversational speech pic.twitter.com/FON78LxAPL
— OpenAI (@OpenAI) May 13, 2024
Az AVM funkciót még májusban jelentették be és mutatták be. Lehetővé teszi a felhasználók számára, hogy valós idejű beszélgetést folytathassanak a ChatGPT mesterséges intelligencia modelljével egy technológia-beszédszintetizáló modulon keresztül.
Ez a technológia nemcsak a hétköznapi használatot könnyíti meg, hanem számos alkalmazási területet nyithat meg, beleértve az ügyfélszolgálatot és az oktatást is.
A Google Duplex méltó elődje volt a fejlesztésnek
Azok, akik emlékeznek a Google 2018-as bejelentésére, ismerhetik a "Duplex" AI szolgáltatást, amely valós időben hívta fel a vállalkozásokat találkozók egyeztetésére. A cél az volt, hogy az AI képes legyen kezelni a mindennapi beszélgetéseket és pontos információkat biztosítani.
Bár a Duplex projektet végül megszüntették, a technológia öröksége tovább él az OpenAI ChatGPT-ben, amely most hasonló képességeket kínál.
Six years ago Google announced Duplex, an AI voice assistant which made voice calls on your behalf.
— Bourne Striker (@unrealstriker) May 13, 2024
Can OpenAI nail what Google couldn’t? pic.twitter.com/5AjW5wpJJy
Jövőbeli Kihívások és a biztonság
Az AVM valós idejű kommunikációt tesz lehetővé, amely emberi beszélgetéseket próbál utánozni. A ChatGPT természetes ütemben válaszol a felhasználók kérdéseire emberi hangon, és képes követni a beszélgetés menetét, még ha félbeszakítják is.
Az OpenAI egy korlátozott verzióban vezeti be ezt a funkciót, hogy teszteljék a képességeit és a biztonsági vonatkozásait. Bár a májusi bemutatók lenyűgözőek voltak, némi zökkenőmentesítésre is szükség van, és vannak aggályok a technológia lehetséges visszaéléseivel kapcsolatban.
We tested GPT-4o's voice capabilities with 100+ external red teamers across 45 languages. To protect people's privacy, we've trained the model to only speak in the four preset voices, and we built systems to block outputs that differ from those voices. We've also implemented…
— OpenAI (@OpenAI) July 30, 2024
Az OpenAI különös figyelmet fordít a biztonságra és az adatvédelemre. Az új funkció használata során szigorú adatvédelmi intézkedések vannak érvényben, hogy a felhasználók személyes adatai védve legyenek.
Az OpenAI folyamatosan fejleszti a rendszert, hogy kiszűrje a helytelen használatot és a potenciális veszélyeket. A jövőben további fejlesztésekkel és újításokkal készülnek, hogy a Hangmód még jobb felhasználói élményt nyújtson.
Az X-ről szóló bejegyzésben, amely bejelenti a funkció elindítását, a vállalat ezt írta:
„Teszteltük a GPT-4o hangképességeit több mint 100 külső vörös teamerrel, 45 nyelven. Az emberek magánéletének védelme érdekében a modellt arra tanítottuk, hogy csak a négy előre beállított hangon szólaljon meg, és olyan rendszereket építettünk, amelyek blokkolják az ezektől a hangoktól eltérő kimeneteket. Emellett védőkorlátokat is bevezettünk az erőszakos vagy szerzői joggal védett tartalmakra vonatkozó kérések blokkolására.”
Az OpenAI Hangmódja egy izgalmas újítás, amely tovább bővíti a ChatGPT lehetőségeit, és új távlatokat nyit az AI-alapú kommunikáció világában. A felhasználók számára pedig újabb lépést jelent a jövő technológiájának mindennapi alkalmazása felé.
Az amerikai kormány korábban valóban hadat üzent volna a kriptoiparnak? A Coinbase most komoly bizonyítékokkal állt elő.
A Solana alapú népszerű memecoin launchpad, a Pump.fun hirtelen letiltotta az Egyesült Királyság felhasználóit.
A Standard Chartered elemzője szerint a kereslet 2025-re egészen 200 000 dollárig tolhatja fel az árfolyamot.
Az NFT-kollekció elérte a 75 000 dolláros “floor” árat, miközben a márka az Ethereumon túlra is terjeszkedik, és elindítja a PENGU tokenjét a Solanan.