ChatGPT biết trò chuyện và quan sát, tiến tới ‘thông minh như người’

Thứ Tư, 04 Tháng Mười 2023

Nếu trước đây khi năng lực giao tiếp của ChatGPT mới chỉ dừng ở văn bản thì cũng đã đủ để tạo nên sự chấn động với dư luận, thì nay nền tảng này còn có thể đối đáp với người dùng, phân tích hình ảnh, tư vấn thông tin và tìm lời giải cho một bài toán.

Phát triển như vũ bão

Kể từ khi ra mắt vào tháng 11-2022, ChatGPT được coi là một trong những thành tựu công nghệ lớn nhất những năm qua với khả năng tóm tắt các văn bản đơn giản, viết luận và thậm chí… làm thơ.

Sự bùng nổ của ChatGPT thể hiện qua việc giá trị của công ty mẹ OpenAI (có trụ sở tại San Francisco, Mỹ) đã tăng gấp ba chỉ sau một năm. Ngày 26-9, tờ Wall Street Journal cho biết trong cuộc đàm phán với các nhà đầu tư tiềm năng, giá trị của OpenAI được xác định vào khoảng 80 – 90 tỉ USD.

Hồi đầu năm nay, OpenAI bán ra 300 triệu cổ phiếu và giá trị vốn hóa của họ ước tính khoảng 30 tỉ USD. Con số 90 tỉ sẽ đưa họ bước vào nhóm các start-up có giá trị cao nhất cùng với ByteDance (công ty mẹ của TikTok) hay SpaceX.

Ngoài ra, OpenAI cũng nhận khoản đầu tư khổng lồ từ Microsoft, hiện sở hữu 49% công ty này, được cho là lên đến 10 tỉ USD. Vào tháng 4-2023, công ty này ước tính doanh thu năm nay sẽ đạt 1 tỉ USD. Doanh thu của OpenAI đến từ việc tính phí truy cập các phiên bản nâng cao của ChatGPT và cấp phép công nghệ cơ bản cho các doanh nghiệp.

Với đà phát triển đó, OpenAI lại vừa công bố bước tiến mới khi cấp thêm cho ChatGPT giọng nói để giao tiếp theo thời gian thực và khả năng quan sát hình ảnh. Trong phần giới thiệu đầu tuần này, họ biểu diễn khả năng ChatGPT có thể kể chuyện cho mọi người trước khi ngủ hoặc “giải quyết” những tranh luận trên bàn ăn.

Không chỉ thế, ChatGPT còn có thể đưa ra câu trả lời dựa trên hình ảnh, biểu đồ hay chỉ tập trung vào một phần nào đó của bức ảnh theo yêu cầu người dùng. Các tính năng mới vừa nêu sẽ được mở cho người dùng gói ChatGPT Plus và Enterprise trong vài tuần tới.

“Chúng tôi đang tìm cách làm cho ChatGPT dễ sử dụng hơn và hữu ích hơn” – báo New York Times dẫn lời ông Peter Deng, phó chủ tịch sản phẩm tiêu dùng và doanh nghiệp của OpenAI, cho biết.

Hướng đến thông minh như người

Với phiên bản mới, ChatGPT đã vượt qua các chatbot khác như Google Bard và cạnh tranh với các trợ lý ảo AI như Alexa của Amazon và Siri của Apple. Nó cũng khiến cuộc đua AI nóng hơn khi Google và Amazon mới đây đều công bố cập nhật các công cụ AI của mình.

Trong khi đó, những công ty khác cũng nhanh chóng tìm cơ hội tận dụng công nghệ này. Chẳng hạn, nền tảng nghe nhạc trực tuyến Spotify đang xem xét dùng thuật toán của OpenAI để dịch postcast sang các ngôn ngữ khác nhau.

Sau khi trải nghiệm tính năng mới, báo New York Times nhận xét giọng nói của ChatGPT nghe tự nhiên hơn các trợ lý ảo khác và có khả năng tương tác với người dùng. Theo OpenAI, giọng nói của ChatGPT “được hỗ trợ bởi mô hình chuyển văn bản thành giọng nói mới, có khả năng tạo ra âm thanh giống con người chỉ từ văn bản và một vài giây lời nói mẫu”. Công ty này cho biết họ đã hợp tác với các diễn viên lồng tiếng chuyên nghiệp để tạo ra năm giọng nói khác nhau cho chatbot.

ChatGPT được đánh giá có kỹ năng ngôn ngữ mạnh mẽ hơn nhờ mô hình L.L.M học hỏi từ nguồn thông tin khổng lồ trên Internet. Nếu các trợ lý ảo khác chủ yếu trả lời trong giới hạn câu hỏi được lập trình, ChatGPT có thể tự tin “tám” về mọi chủ đề, dù chưa chắc câu trả lời của nó là chính xác.

Việc cung cấp dữ liệu âm thanh và hình ảnh cho các mô hình học máy của ChatGPT cũng là một bước trong tầm nhìn dài hạn của OpenAI nhằm tạo ra trí thông minh giống con người hơn. “Nếu chúng ta xây dựng một mô hình chỉ sử dụng ngôn ngữ thì dù có mạnh đến đâu, nó cũng chỉ là học ngôn ngữ mà thôi” – giáo sư Trevor Darrell tại Đại học California Berkeley nhận định.

Nhiều lo ngại

Tuy nhiên, sự tiến hóa của ChatGPT tiếp tục gây tranh luận về những nguy cơ tiềm ẩn như phát tán tin giả, bị tội phạm mạng lợi dụng. Với tính năng quan sát hình ảnh, nền tảng này tiến vào lãnh địa mới của sự nhạy cảm khi xử lý hình ảnh có thể bao gồm gương mặt, cơ thể người.

Nhiều ý kiến lo ngại nó có thể được dùng để nhận diện khuôn mặt và xác định người trong ảnh. Ngoài ra, khả năng giải toán, xử lý sơ đồ qua hình ảnh có thể hữu ích trong học tập nhưng cũng có thể là kẽ hở để gian lận.

Trước những lo ngại này, nhà nghiên cứu Sandhini Agarwal của OpenAI nói ChatGPT sẽ không hỗ trợ nhận diện khuôn mặt nhưng công ty vẫn chưa quyết định chính sách đối với dữ liệu giọng nói người dùng. Người dùng có thể tùy chọn lưu dữ liệu trao đổi với ChatGPT hay không và những gì không lưu sẽ bị tự động xóa trong 30 ngày.