Trình diễn tính năng trò chuyện và xử lý hình ảnh của ChatGPT

ChatGPT ra tính năng trò chuyện, xử lý hình ảnh

OpenAI vừa tung ra bản cập nhật quan trọng nhất của ChatGPT, cho phép người dùng tương tác tự nhiên với trí tuệ nhân tạo qua giọng nói và xử lý hình ảnh. AI này có khả năng tương tác bằng giọng theo phong cách năm nhân vật mặc định và có khả năng xử lý hình ảnh. Tính năng mới này sẽ mở ra nhiều ứng dụng sáng tạo và tập trung vào khả năng tiếp cận. Trước đó, Amazon cũng đã đầu tư vào công ty khởi nghiệp AI Anthropic và mở rộng tính năng “trò chuyện” của loa thông minh Alexa.

ChatGPT – Tương tác gia tăng thông qua giọng nói và xử lý hình ảnh

ChatGPT – Tương tác gia tăng thông qua giọng nói và xử lý hình ảnh
ChatGPT – Tương tác gia tăng thông qua giọng nói và xử lý hình ảnh

OpenAI vừa công bố một bản cập nhật quan trọng cho ChatGPT – một công nghệ trí tuệ nhân tạo (AI) nổi tiếng, mang đến khả năng tương tác tự nhiên thông qua giọng nói và xử lý hình ảnh. Bản cập nhật này cho phép ChatGPT tham gia vào các cuộc trò chuyện theo phong cách của năm nhân vật mặc định và xử lý hình ảnh mà người dùng nhập vào.

Tương tác qua giọng nói và xử lý hình ảnh

Trong bản cập nhật mới, ChatGPT có thể tham gia vào cuộc trò chuyện bằng giọng nói, kể chuyện, hoặc đọc nội dung mà người dùng nhập dưới dạng văn bản. Các phản hồi từ ChatGPT được cho là có sự trò chuyện hơn so với các trợ lý ảo phổ biến như Google Assistant, Alexa, hay Siri.

Gợi ý  Tử vi năm 2024 dành cho người tuổi Thìn

Điều quan trọng là tính năng trò chuyện này mở ra nhiều ứng dụng sáng tạo mới và tập trung vào khả năng tiếp cận của ChatGPT.

Tính năng xử lý hình ảnh cho phép người dùng chụp ảnh mọi thứ xung quanh và yêu cầu ChatGPT phân tích ảnh để giải quyết các vấn đề. Ví dụ như khắc phục sự cố khi lò nướng không khởi động, kiểm tra thực phẩm trong tủ lạnh để lập kế hoạch ăn uống, hoặc phân tích biểu đồ liên quan đến công việc. Tính năng này tương tự với Google Lens của Alphabet.

Kỳ vọng và áp dụng trong cuộc sống

Kỳ vọng và áp dụng trong cuộc sống
Kỳ vọng và áp dụng trong cuộc sống

Bản cập nhật mới trên ChatGPT được cho là sẽ nâng cao sức mạnh của nó và biến nó trở thành một đối thủ đáng gờm cho các trợ lý ảo truyền thống.

Theo Washington Post, việc bổ sung khả năng thoại và xử lý hình ảnh đưa ChatGPT tiến xa hơn trên con đường trở thành một mô hình đa phương thức thực sự. Điều này có nghĩa là ChatGPT không chỉ có khả năng “nhìn” và “nghe” thế giới, mà còn có thể phản hồi bằng giọng nói và hình ảnh bên cạnh văn bản.

Các nhà nghiên cứu trong lĩnh vực Trí tuệ Nhân tạo đánh giá rằng mô hình đa phương thức đang là giai đoạn cạnh tranh tiếp theo và có thể được áp dụng vào nhiều lĩnh vực trong cuộc sống, chẳng hạn như trên smartphone, TV, xe hơi, và loa thông minh.

Gợi ý  Samsung đẩy nhanh việc tung ra Galaxy S24 để cạnh tranh với iPhone 15

Thị trường trí tuệ nhân tạo

Thị trường trí tuệ nhân tạo đang được quan tâm rất nhiều trong thời gian gần đây. Ngày 25/9, Amazon đã thông báo về việc đầu tư 4 tỷ USD vào một công ty khởi nghiệp Trí tuệ Nhân tạo có tên Anthropic. Đây được coi là một thỏa thuận đầu tư lớn nhất trong lĩnh vực này kể từ khi Microsoft đầu tư hơn 10 tỷ USD vào OpenAI.

Như vậy, ChatGPT với bản cập nhật mới là một bước tiến quan trọng của công nghệ trí tuệ nhân tạo, mang lại khả năng tương tác tự nhiên thông qua giọng nói và xử lý hình ảnh. Điều này không chỉ mở ra nhiều ứng dụng sáng tạo mới mà còn đáp ứng nhu cầu tiếp cận của hàng triệu người dùng.