ChatGPT đang nhận được một bản nâng cấp khổng lồ, được thiết kế để tăng tốc cuộc sống của bạn và loại bỏ các tác vụ nền tẻ nhạt, giúp chúng ta tập trung hơn vào công việc, giải trí và nhiều hơn nữa. Tính năng ChatGPT Agent mới của OpenAI ra mắt khả năng duyệt web tự động hoàn toàn (agentic browsing) và hứa hẹn sẽ sớm đến tay người dùng toàn cầu. Đây là một bước tiến mang tính cách mạng, định hình lại cách chúng ta tương tác với trí tuệ nhân tạo.
ChatGPT Agent: Bước Tiến Vượt Bậc Của Trí Tuệ Nhân Tạo Từ OpenAI
ChatGPT đang được trang bị khả năng sử dụng các tác nhân AI tự động hoàn toàn, được gọi là ChatGPT Agent. Hãy hình dung thế này: cho đến nay, ChatGPT có thể duyệt web và tìm kiếm thông tin cho bạn, nhưng bạn vẫn cần duy trì sự tương tác và hướng dẫn quá trình tìm kiếm. Giờ đây, ChatGPT Agent có thể tự động hóa hoàn toàn mọi quy trình, yêu cầu và tác vụ phức tạp với gần như không cần sự can thiệp từ người dùng.
Trong nhiều khía cạnh, ChatGPT Agent là sự kết hợp mạnh mẽ của hai công cụ trước đây của OpenAI là Operator và Deep Research. Operator là nỗ lực trước đây của OpenAI trong việc tạo ra một tác nhân AI có khả năng duyệt web, thực hiện đặt chỗ và hoàn thành một số tác vụ cơ bản. Trong khi đó, Deep Research là một công cụ nghiên cứu chuyên sâu, được thiết kế để đào sâu vào bất kỳ yêu cầu nào, tạo ra các báo cáo toàn diện với phân tích dữ liệu từ nhiều nguồn, nhưng nó không được thiết kế cho mức độ tương tác web như Operator.
ChatGPT Agent đang chọn tính năng trong cửa sổ chat
Việc kết hợp những công cụ này với sức mạnh của AI tác nhân (agentic AI) mang đến một công cụ có thể tự động duyệt web cho bạn, xem xét hầu hết mọi thông tin bạn cung cấp. Điều đặc biệt là ChatGPT Agent có thể truy cập “ChatGPT connectors” cho phép bạn liên kết các ứng dụng và tài khoản vào tác nhân, nơi nó có thể tìm thấy thông tin rất cụ thể về bạn và yêu cầu của bạn. Ví dụ, bạn có thể kết nối Gmail, ứng dụng lịch của mình, v.v., và biến AI tác nhân thành một trợ lý cá nhân chính thức.
Ba Lĩnh Vực Hoạt Động Cốt Lõi Của ChatGPT Agent
Khả năng của ChatGPT Agent có thể được chia thành ba lĩnh vực chính:
- Tác vụ Tự động (Autonomous Tasks): ChatGPT Agent có thể hoàn thành các tác vụ phức tạp, nhiều bước mà không yêu cầu người dùng phải liên tục nhập liệu. Điều này mở ra kỷ nguyên mới cho năng suất cá nhân và doanh nghiệp.
- Duyệt web Toàn diện (Web Browsing): Tác nhân có thể duyệt web trong môi trường ChatGPT, mô phỏng chính xác hành vi của một người thật với các cú nhấp chuột và thao tác. Nó cũng có khả năng điều hướng các biểu mẫu trực tuyến, một yếu tố cực kỳ quan trọng trong môi trường internet hiện nay. Đây là một máy tính ảo bên trong ChatGPT, có cả giao diện văn bản và trình duyệt trực quan mà Agent có thể lựa chọn sử dụng.
- Kho Công cụ Đa dạng (Tools): OpenAI đã xác nhận rằng ChatGPT Agent có thể sử dụng tất cả các công cụ đã có sẵn để hoàn thành tác vụ của mình, chẳng hạn như truy cập API, thực hiện các thao tác tệp, nhập dữ liệu, suy luận, và thậm chí lập trình để hoàn thành công việc. Ví dụ, Agent có quyền truy cập vào terminal riêng để xử lý các tác vụ cụ thể hoặc sử dụng AI tạo sinh để tạo ra hình ảnh độc đáo.
ChatGPT Agent của OpenAI đang duyệt web
Cơ Chế Học Hỏi và Phát Triển Liên Tục
Đây là mô hình đầu tiên mà OpenAI đã huấn luyện có thể chuyển đổi liền mạch giữa các chức năng và “hộp công cụ thống nhất” này. Sử dụng học tăng cường (reinforcement learning), Agent có thể quyết định khi nào sử dụng bất kỳ công cụ nào có sẵn, cho phép nó xử lý các yêu cầu và tác vụ phức tạp từng bước một. Theo thời gian, nó sẽ trở nên hiệu quả hơn trong việc hoàn thành các tác vụ, đẩy nhanh quy trình và tăng độ chính xác.
Bảo Mật và An Toàn: Ưu Tiên Hàng Đầu Của ChatGPT Agent
Buổi livestream của OpenAI đã nêu bật một số tính năng bảo mật chính được tích hợp vào ChatGPT Agent:
- Kiểm soát người dùng chặt chẽ: Mặc dù Agent có thể hoàn thành các tác vụ theo yêu cầu, nó sẽ nhắc nhở bạn khi đến lượt gửi biểu mẫu, đăng nhập vào trang web và các tác vụ quan trọng khác. Những điểm dừng này được thiết kế để ngăn chặn các vấn đề phát sinh cụ thể trong những tình huống này. Tự động hóa là tuyệt vời, nhưng hiện tại, sự can thiệp của người dùng vẫn rất quan trọng.
- Phòng ngừa rủi ro: OpenAI cũng đã huấn luyện Agent từ chối các yêu cầu nguy hiểm, không an toàn hoặc mơ hồ mà nó không thể thực hiện. Điều này được điều chỉnh chặt chẽ với các tiêu chuẩn an toàn hiện có của OpenAI, đảm bảo nó không đi quá xa khỏi các giới hạn hiện tại của ChatGPT. Điều này có thể khiến một số người cảm thấy ChatGPT quá giới hạn, nhưng nó là điều hợp lý khi triển khai các tác nhân AI tự động trên quy mô toàn cầu.
- Không thực hiện giao dịch mua hàng: Tại thời điểm ra mắt, Agent cũng sẽ không thực hiện bất kỳ giao dịch mua hàng nào mà không có sự xác nhận từ người dùng.
- Chống tấn công Prompt Injection: Agent cũng đi kèm với một số công cụ mới để bảo vệ chống lại tấn công prompt injection, một kiểu tấn công độc hại mới tập trung vào các công cụ AI. Prompt injection là một vấn đề đối với tất cả các loại AI tạo sinh, nhưng đặc biệt đáng lo ngại khi các công cụ này sẽ bắt đầu duyệt web một cách tự động.
ChatGPT Agent của OpenAI sử dụng kết nối
Để chống lại điều này, OpenAI đã xây dựng một số biện pháp bảo vệ mới vào Agent. Ví dụ, ChatGPT Agent chạy trong một môi trường sandbox được cách ly. Mặc dù nó có thể thực hiện các thay đổi đối với lịch của bạn, tải xuống tệp, v.v., nhưng OpenAI không muốn nó tương tác trực tiếp với hệ điều hành của bạn ở mức độ có thể gây hại, vì vậy họ cách ly công cụ. Ngoài ra, nó sử dụng các bộ phân loại cụ thể để xác định các cuộc tấn công prompt injection và các loại thao túng khác, đồng thời được thiết kế để ngăn chặn chúng.
Thời Điểm Ra Mắt và Gói Dịch Vụ Của ChatGPT Agent
Trong một khoảnh khắc hiếm hoi của OpenAI, Sam Altman đã xác nhận rằng Agent sẽ ra mắt ngay lập tức. Người đăng ký ChatGPT Pro sẽ nhận được 400 truy vấn mỗi tháng, trong khi người đăng ký Plus và Team có giới hạn hơn với 40 yêu cầu.
Tuy nhiên, giống như hầu hết các tính năng mới của ChatGPT, ngay cả khi nó được ra mắt ngay lập tức, vẫn mất vài ngày để tính năng này đến được tài khoản cụ thể của bạn, ngay cả khi bạn đã đăng ký một trong các gói trên.
Cạnh Tranh Gay Gắt: Thị Trường Trình Duyệt AI Đang Nóng Lên
Đừng quên rằng duyệt web tác nhân (agentic browsing) trong trình duyệt là một lĩnh vực rất sôi động. Đầu năm 2025, Opera đã ra mắt trình duyệt Neon tác nhân ấn tượng của mình, trong khi Perplexity cũng đang thử nghiệm trình duyệt Comet được hỗ trợ bởi AI. Và không thể không nhắc đến gã khổng lồ chống virus Norton, dự kiến sẽ ra mắt Neo, một trình duyệt hỗ trợ AI khác, vào năm 2025. Như đã nói, các trình duyệt hỗ trợ AI đã ở đây, và chúng đang đến rất nhiều!
ChatGPT Agent đánh dấu một cột mốc quan trọng trong sự phát triển của trí tuệ nhân tạo, mang đến khả năng tự động hóa chưa từng có và hứa hẹn thay đổi đáng kể cách chúng ta làm việc và tương tác với công nghệ. Bạn nghĩ sao về tiềm năng của ChatGPT Agent? Hãy chia sẻ ý kiến của bạn trong phần bình luận!