Chế độ giọng nói nâng cao của ChatGPT có thể giả giọng giống nhiều người dùng đáng kinh ngạc

3 giờ trước Gốc

Tính năng Advanced Voice Mode (chế độ giọng nói nâng cao) của ChatGPT gây ngạc nhiên cho nhiều người dùng.

Khi nghĩ đến giọng nói được lập trình bởi trí tuệ nhân tạo (AI), bạn có thể hình dung ra điều gì đó nghe như robot, gượng gạo, với nhịp điệu không thể nắm bắt được các điểm nhấn, tốc độ và cảm xúc cần thiết để nghe giống con người. Song đây là năm 2024 và những robot này đã được nâng cấp đáng kể. Giờ đây, chúng có thể bắt chước giọng nói, giọng địa phương và ngữ điệu ở mức gần như đáng kinh ngạc, tùy theo cách nhìn của bạn.

Tính năng Advanced Voice Mode (ra mắt với hầu hết người dùng ChatGPT tuần trước) là phiên bản âm thanh của ChatGPT ban đầu, sử dụng AI để phản hồi các câu lệnh văn bản theo cách trò chuyện. Advanced Voice Mode hoạt động theo cách tương tự như ChatGPT ban đầu, nhưng sử dụng âm thanh. Người dùng chỉ cần nói vào ứng dụng và giọng nói của ChatGPT sẽ tự động phản hồi. Bạn có thể chọn 1 trong 9 giọng nói. Sau đó, thông qua lời nhắc trong cuộc trò chuyện và văn bản, bạn sẽ dạy những giọng đó nói theo cách mà mình thích.

Advanced Voice Mode hoạt động đủ tốt để OpenAI, công ty tạo ra ChatGPT, phát hành báo cáo an toàn cảnh báo rằng con người có thể trở nên phụ thuộc cảm xúc vào tính năng này.

Advanced Voice Mode của ChatGPT có thể bắt chước giọng nói, giọng địa phương và ngữ điệu ở mức gần như đáng kinh ngạc - Ảnh: Getty Images

“Advanced Voice Mode nhận dạng cả từ ngữ bạn đang nói và ngữ điệu trong giọng bạn, nhưng cũng dựa trên ngữ cảnh những từ mà bạn dùng để phản hồi theo cách hợp lý nhất. ChatGPT luôn là mô hình dự đoán, phải không? Vì vậy, ChatGPT chỉ dự đoán câu trả lời có khả năng đúng nhất dựa trên thông tin đầu vào mà bạn cung cấp, và giờ đây nó làm điều đó với âm thanh”, Celia Quillian (nữ chuyên gia về AI) giải thích.

Tính năng mới khiến nhiều người dùng TikTok đăng video khoe khả năng của Advanced Voice Mode, gồm cả việc nói bằng tiếng lóng, phương ngữ và thậm chí là giọng địa phương. Kết quả thường bất ngờ và hài hước.

Khi Morissa Schwartz, nữ doanh nhân gốc New Jersey (một bang ở Mỹ), yêu cầu ChatGPT bắt chước giọng của mình, ứng dụng này không ngần ngại thực hiện điều đó.

“Ay, bạn khỏe không? Tôi là Morissa, đang ở bờ biển, ăn một lát bánh pizza ngon nhất. Bạn biết đấy, đây là loại pizza mà khiến bạn muốn chuyển đến đây chỉ vì đồ ăn, đừng bận tâm”, ChatGTP nói với giọng điệu được nhấn mạnh.

"Trong tai bạn, tôi thực sự nghe như vậy sao? Tôi biết mình có chút giọng Jersey, nhưng có thực sự dễ nhận ra như vậy không?", Morissa Schwartz hỏi trong video cuộc trò chuyện với ChatGPT mà cô đăng lên tài khoản TikTok cá nhân.

“Chà, cô chắc chắn có một chút phong cách Jersey. Nó có cá tính và sự ấm áp, giống như cô”, ChatGPT trả lời.

Morissa Schwartz kể rằng là người gốc New Jersey đời thứ sáu, cảm thấy ấn tượng của ChatGPT về cô là “sự bất ngờ hài hước”.

“Tôi không hề biết nó có thể bắt chước giọng nói. Vài ngày sau khi dùng Advanced Voice Mode, tôi nhận thấy nó thay đổi giọng điệu, nên thử hỏi liệu nó có thể bắt chước tôi không. Tôi rất sốc khi thấy nó làm quá tốt, như thể ‘Liệu ứng dụng này có bí mật xem hết video TikTok của tôi không?’”, Morissa Schwartz chia sẻ.

Morissa Schwartz nói thêm rằng: “Trò chuyện với chatbot trước đây giống đặt câu hỏi cho một giáo sư rất thông thái. Song giờ đây, có cảm giác như giáo sư thông thái đó là bạn thân của tôi”.

Advanced Voice Mode thường dựa vào các hình mẫu và khuôn mẫu khi cố gắng giao tiếp theo cách mà người dùng yêu cầu. Điều này có thể dẫn đến các phản hồi mà một số người dùng cảm thấy bị xúc phạm.

Khi người có tầm ảnh hưởng là Noah Miller yêu cầu Advanced Voice Mode nói theo kiểu “siêu gay”, ChatGPT đã đáp lại theo cách tương ứng: “Tất nhiên, bạn thân yêu ơi, hãy có một buổi trò chuyện tuyệt vời nào. Bạn có gì muốn nói? Chia sẻ đi”. Noah Miller cảm thấy cuộc trò chuyện đó rất buồn cười.

Dù hầu hết người dùng hiện sử dụng Advanced Voice Mode để giải trí, Celia Quillian đã thấy một số ứng dụng thực tế cho tính năng này, gồm giúp những người học âm thanh với bài tập về nhà, dịch theo thời gian thực và đóng vai trò như nhà trị liệu thay thế.

“Nghe có vẻ lạ, tôi rất ủng hộ liệu pháp tâm lý và các nhà trị liệu là con người. Nhưng nếu bạn không đủ chi phí và chỉ cần một người lắng nghe, trò chuyện với Advanced Voice Mode có thể mang lại cảm giác rất giống như bạn đang nói chuyện với người hiểu và đồng cảm với mình, biết đặt câu hỏi lại và cố gắng hiểu cảm xúc của bạn. Tôi có thể xem Advanced Voice Mode như một cách để giải quyết các vấn đề khi muốn nói thành tiếng mà không có ai khác xung quanh bạn, theo một cách rất đồng cảm”, Celia Quillian cho hay.

Dù vậy, Celia Quillian cũng thừa nhận có thể xuất hiện mặt trái khi người ta trở nên quá phụ thuộc cảm xúc vào robot, như OpenAI cảnh báo, dù Advanced Voice Mode thông minh và sống động đến đâu.

“Tôi nghĩ rằng có một nỗi sợ hãi chính đáng trong nhiều người rằng với những công cụ cảm xúc như thế này, người ta có thể bắt đầu dùng AI thay thế cho các mối quan hệ,. Điều đó đáng sợ, đúng không? Tôi đồng ý với điều đó. Tôi nghĩ rằng cần có sự cân bằng. Bạn biết đấy, chúng ta không thể quên đi tính nhân văn và các mối quan hệ với nhau trong bối cảnh sử dụng những công cụ này, nhưng chúng ta cũng có thể dùng chúng để nâng cao sự kết nối và mối quan hệ giữa chúng ta với nhau và với chính bản thân mình", Celia Quillian kết luận.

Giới hạn của Advanced Voice Mode với người dùng ChatGPT miễn phí

Từ hôm 2.10, người dùng ChatGPT miễn phí cuối cùng cũng được trải nghiệm Advanced Voice Mode.

Tính năng này vốn đã được triển khai cho người dùng trả phí ChatGPT Plus và ChatGPT Team từ vài tháng trước, ngoại trừ tại EU (Liên minh châu Âu) do các quy định khắt khe về quyền riêng tư.

Advanced Voice Mode cho phép người dùng tương tác với ChatGPT bằng giọng nói tự nhiên hơn, giống đang trò chuyện với người thật. Người dùng có thể ngắt lời, thay đổi câu hỏi, điều chỉnh câu trả lời dựa trên những gì ChatGPT vừa nói.

Điển giới hạn với người dùng ChatGPT miễn phí là chỉ được sử dụng Advanced Voice Mode 15 phút mỗi tháng. Để dùng Advanced Voice Mode không giới hạn thời gian, bạn cần nâng cấp lên ChatGPT Plus với giá 20 USD/tháng (dự kiến sẽ tăng lên 22 USD trong thời gian tới). Ngoài ra, bạn cần cập nhật ứng dụng ChatGPT lên phiên bản mới nhất để trải nghiệm Advanced Voice Mode.

OpenAI cũng thông báo Advanced Voice Mode sẽ được triển khai cho người dùng ChatGPT Enterprise, Edu và Team trên toàn cầu.

Việc cung cấp Advanced Voice Mode cho ChatGPT miễn phí là chiến lược để OpenAI thu hút thêm người dùng trả tiền nâng cấp lên bản Plus, yếu tố quan trọng trong bối cảnh công ty phải đối mặt với khoản lỗ lớn.

Những tháng qua, OpenAI triển khai ngày càng nhiều dịch vụ AI cho doanh nghiệp và người tiêu dùng. Mới đây, OpenAI đã nhận một trong những khoản đầu tư tư nhân lớn nhất từ trước đến nay, huy động được 6,6 tỉ USD với mức định giá công ty đến 157 tỉ USD.

Vòng gọi vốn này thu hút các nhà đầu tư mạo hiểm quay trở lại, gồm cả Thrive Capital và Khosla Ventures, cũng như Microsoft (nhà đầu tư lớn nhất vào OpenAI) và sự tham gia mới từ Nvidia.

Việc hoàn tất vòng gọi vốn trùng với các nỗ lực tái cấu trúc đang diễn ra của OpenAI và những thay đổi trong ban điều hành, gồm cả sự ra đi đột ngột của Mira Murati.

Altimeter Capital, Fidelity, SoftBank và MGX (công ty đầu tư do chính quyền UAE hậu thuẫn) cũng tham gia vòng gọi vốn này của OpenAI.

Sarah Friar, Giám đốc tài chính OpenAI, nói với các nhân viên hôm 2.10 rằng công ty sẽ có thể cung cấp thanh khoản cho họ thông qua đề nghị mua lại cổ phần sau khi hoàn thành huy động vốn, dù chưa có chi tiết và thời gian cụ thể, theo một nguồn tin. Đầu năm nay, OpenAI đã cho phép một số nhân viên bán cổ phần của họ theo mức định giá công ty khi đó là 86 tỉ USD.

Thrive Capital, cam kết khoảng 1,2 tỉ USD từ sự kết hợp giữa quỹ của riêng mình và một phương tiện mục đích đặc biệt dành cho các nhà đầu tư nhỏ hơn, đã đàm phán với OpenAI về tùy chọn đầu tư thêm 1 tỉ USD vào năm 2025 với mức định giá tương tự nếu công ty AI này đạt được mục tiêu doanh thu, theo các nguồn tin.

Apple không tham gia vào đợt huy động vốn lần này của OpenAI, các nguồn tin cho biết, yêu cầu được giấu tên để thảo luận về các vấn đề riêng tư.

Khoản tài trợ này được thực hiện dưới hình thức trái phiếu chuyển đổi và việc chuyển đổi thành cổ phần phụ thuộc vào sự thay đổi cấu trúc thành công thành một công ty vì lợi nhuận, sẽ không còn do hội đồng quản trị phi lợi nhuận kiểm soát, và việc xóa bỏ giới hạn lợi nhuận cho các nhà đầu tư.

Những thay đổi về nhân sự ở OpenAI không làm giảm sự nhiệt tình của hầu hết nhà đầu tư, vốn đang mong đợi sự tăng trưởng đáng kể dựa trên dự báo của Giám đốc điều hành Sam Altman.

OpenAI đang trên đà tạo ra 3,6 tỉ USD doanh thu trong năm 2024 với khoản lỗ tăng lên hơn 5 tỉ USD. Theo các nguồn tin quen thuộc với các số liệu, OpenAI dự kiến doanh thu sẽ tăng mạnh vào năm tới lên 11,6 tỉ USD.

Các nhà đầu tư cũng được đảm bảo một số biện pháp bảo vệ khi OpenAI trải qua quá trình tái cấu trúc doanh nghiệp phức tạp, sẽ cấp quyền sở hữu cổ phần cho Sam Altman. Các cuộc đàm phán vẫn đang diễn ra và chưa có mốc thời gian nào được xác định.

Nguồn tin cho biết các nhà đầu tư đã đàm phán các điều khoản cho phép họ thu hồi vốn hoặc đàm phán lại giá trị nếu những thay đổi ở OpenAI không được thực hiện trong vòng 2 năm.

Sự phát triển thần tốc của OpenAI về mức độ phổ biến sản phẩm và giá trị đã thu hút sự chú ý trên toàn cầu. Kể từ khi ra mắt ChatGPT vào tháng 11.2022, OpenAI đã thu hút được 250 triệu người dùng hoạt động hằng tuần. Mức định giá OpenAI cũng tăng từ 14 tỉ USD vào năm 2021 lên 157 tỉ USD khi doanh thu tăng từ con số 0 lên 3,6 tỉ USD, vượt xa dự đoán của chính Sam Altman trước đây.

Khi được các nhà đầu tư toàn cầu rót vào 6,6 tỉ USD, OpenAI đã yêu cầu họ đưa ra cam kết không chỉ dừng lại ở việc cung cấp vốn. Cụ thể hơn, OpenAI muốn các nhà đầu tư không tài trợ cho 5 công ty mà họ coi là đối thủ cạnh tranh trực tiếp, theo các nguồn tin của Reuters.

Trong danh sách 5 công ty đó có 3 đối thủ đang phát triển các mô hình ngôn ngữ lớn là xAI của Elon Musk, Anthropic và Safe Superintelligence (công ty mới thành lập của Ilya Sutskever, cựu giám đốc khoa học và đồng sáng lập OpenAI).

Anthropic, xAI và Safe Superintelligence đang chạy đua với OpenAI để xây dựng các mô hình ngôn ngữ lớn, nên cần hàng tỉ USD tiền tài trợ.

Hai cái tên còn lại là hai công ty ứng dụng AI, gồm startup tìm kiếm AI Perplexity và hãng tìm kiếm doanh nghiệp Glean.

Perplexity và Glean được nhắc đến trong cuộc trò chuyện của OpenAI với các nhà đầu tư, cho thấy “cha đẻ ChatGPT” có kế hoạch bán nhiều sản phẩm hơn cho các doanh nghiệp và người dùng cuối khi đưa ra dự báo tăng trưởng doanh thu đầy tham vọng lên 11,6 tỉ USD vào năm 2025 từ 3,7 tỉ USD trong 2024.

OpenAI, Perplexity và Safe Superintelligence từ chối bình luận. Anthropic và Glean không trả lời ngay lập tức. Reuters chưa thể liên lạc với xAI để đưa ra câu hỏi.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/che-do-giong-noi-nang-cao-cua-chatgpt-co-the-gia-giong-giong-nhieu-nguoi-dung-dang-kinh-ngac-224860.html